sich wiederholende zeichen aus string entfernen

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • sich wiederholende zeichen aus string entfernen

    Guten Morgen.
    Habe gesucht, leider nichts gefunden.

    Ich bin dabei ein Forum zu entwerfen.
    Jetzt möchte ich natürlich das wenn jemand scheisse eingibt wie beispielsweise "WWWWWWWWWWWWWWWWWWW" oder "aaaaaaaabbbbbbbbcccccccccccccccddddddddd" usw.
    und das dauerhaft.. das sowas entfernt wird.

    Es gibt ja den befehl strip_tags um tags aus dem gesamten text zu entfernen..

    Gibt es auch ein Befehl um aus einem String son müll wie sich wiederholende zeichen rauszuschmeißen?

    Oder hat jemand ne Idee wie man das möglichst auf alle zeichen durchsuchen kann.

    Oder das soetwas entfernt wird sobald ein Zeichen mehr als 3 mal hintereinander genannt wird?

    Wär schön wenn Ihr mir helfen könntet.

    Gruß

  • #2
    Zwar keine wirklich schöne Lösung, aber wenn du's direkt vor dem Speichern des User Inputs machst, irgendwie vertretbar ... ^^

    PHP-Code:
    $str 'aaaaaaaabbbbbbbbcccccccccccccccdddddddddabbbb';

    $chars      'abcd';
    $maxRepeats 3;

    foreach (
    str_split($chars) as $char) {
        
    $pattern sprintf('/%s{%d,}/'$char$maxRepeats);
        
    $str preg_replace($pattern$char$str);
    }

    echo 
    $str//abcdab 
    Mein PHP Blog

    Kommentar


    • #3
      oder kann man die langen zeichenketten vielleicht auch auf eine bestimmte zahl reduzieren ? zum beispiel das sich ein buchstabe maximal 5 mal am stück wiederholt?

      Kommentar


      • #4
        hey, ich glaub wir haben gleichzeitig abgesendet

        Vielen Dank ich werds gleich mal ausprobieren ...

        Gruß

        Kommentar


        • #5
          Hier noch eine etwas performantere Lösung ...

          PHP-Code:
          $str 'aaaaaaaabbbbbbbbcccccccccccccccdddddddddabbbb';

          $chars      'abcd';
          $maxRepeats 3;

          $patternParts = array();
          foreach (
          str_split($chars) as $char) {
              
          $patternParts[] = sprintf('%s{%d,}'$char$maxRepeats);
          }

          $str preg_replace_callback(
              
          sprintf(
                  
          '/%s/i',
                  
          join('|'$patternParts)
              ),
              
          create_function(
                  
          '$matches',
                  
          'return $matches[0][0];'
              
          ),
              
          $str
          );

          echo 
          $str//abcdab 
          Mein PHP Blog

          Kommentar


          • #6
            hi, danke für deine mühe..
            aber leider kommt bei mir der hier:
            Fatal error: Call to undefined function: str_split() in blablabla on line 2654

            Kommentar


            • #7
              PHP5 installieren oder mal in die User Kommentare auf http://de3.php.net/manual/de/function.str-split.php schauen. Das würde Dein Problem wahrscheinlich beheben.
              MM Newmedia | MeinBlog

              Kommentar


              • #8
                ja mein php ist schon älter das ist richtig..
                ich schau da mal..

                Kommentar


                • #9
                  Alles klar hat geklappt funktioniert nun. Vielen Dank für eure Hilfe

                  Kommentar


                  • #10
                    Warum so umständlich?

                    PHP-Code:
                    $out preg_replace('/(.)\\1{3,}/sS''$1'$in); 

                    Das sollte alle Zeichen eliminieren, die mehr als 3-mal vorkommen. Schifffahrt bspw. bleibt so erhalten.

                    Falls das ganze nur auf bestimmte Zeichen (wie Buchstaben) beschränkt werden soll, musst du den Punkt eben durch eine Zeichenklasse (wie [a-zA-ZäöüßÄÖÜ] im einfachsten Fall) ersetzen.

                    Den Original-Quelltext bitte aus der Zitatansicht kopieren -- sonst verschwinden einige der hier ganz wichtigen Backslashes.
                    Klingon function calls do not have “parameters”‒they have “arguments”‒and they always win them!

                    Kommentar


                    • #11
                      hi das ist ja schon gut mit einer zeile code..
                      nur ist es nun so.. alles was bis 3 mal kommt bleibt so, das is ja auch ok.. aber wenn ich jetzt schifffffahrt mit 5 f schreibe kürzt er alle weg und schreibt es letztendlich nur noch mit einem F, kann man das so machen das er alles was mehr als 3 mal ist wegnimmt... und das zeichen dann aber trotzdem 3 mal stehen lässt?

                      Kommentar


                      • #12
                        Original geschrieben von fireweasel
                        Warum so umständlich?
                        Weil man's nicht besser weiss ...
                        Mein PHP Blog

                        Kommentar


                        • #13
                          Original geschrieben von KarlKoks
                          hi das ist ja schon gut mit einer zeile code..
                          nur ist es nun so.. alles was bis 3 mal kommt bleibt so, das is ja auch ok.. aber wenn ich jetzt schifffffahrt mit 5 f schreibe kürzt er alle weg und schreibt es letztendlich nur noch mit einem F, kann man das so machen das er alles was mehr als 3 mal ist wegnimmt... und das zeichen dann aber trotzdem 3 mal stehen lässt?
                          Das macht den Ausdruck aber komplizierter.

                          PHP-Code:
                          $out preg_replace('/(.)(\\1{1,2})\\1*/sS''$1$2'$in); 
                          Ist ungetestet, müsste aber so funktionieren ...
                          Klingon function calls do not have “parameters”‒they have “arguments”‒and they always win them!

                          Kommentar


                          • #14
                            Hi, Super danke das funktioniert wunderbar..
                            und wenn ich das ganze mal ändern möchte auf beispielsweise das 5 zeichen oder 10 zeichen stehen bleiben und alles dahinter gekürzt wird?
                            Was muss ich dann daran ändern?

                            Sorry aber ich blick durch das "Zeichen-Wirr-Warr" nicht durch..

                            Gruß

                            Kommentar


                            • #15
                              PHP-Code:
                              $out preg_replace('/(.)(\\1{1,2})\\1*/sS''$1$2'$in); 
                              Zerlegen wir das Ganze mal:

                              . passt auf jedes beliebige Zeichen (wenn ganz am Ende /s steht).

                              (.) Wie der Punkt. Weil er aber in runden Klammern steht, wird das das gefundene Muster zwischengespeichert und durchnummeriert. Sowas nennt man "subpattern". Weil es sich um das erste runde Klammernpaar handelt, bekommt dieses Subpattern die Nummer 1.

                              \\1 findet exakt das gleiche, wie das erste Subpattern. Das nennt man "back reference".

                              \\1{1,2} findet das gleiche, wie das erste Subpattern, und zwar mehrere Male. Hier mindestens 1 Mal und höchstens 2 Mal.

                              (\\1{1,2}) Merkt sich diesen Kram für später als Subpattern Nummer 2.

                              \\1* findet das gleiche, wie das erste Subpattern, und zwar mehrere Male. Der Stern steht hier für null mal bis beliebig oft.

                              Beim Ersetzen geben wir die Nummer der "gemerkten" Subpattern an:
                              $1 ist das, was mit (.) gefunden wurde.
                              $2 ist das, was mit (\\1{1,2}) gefunden wurde.


                              Das Geheimnis sind die Zahlen in den geschweiften Klammern.
                              Die erste gibt eine Minimalzahl an und die zweite die Maximalzahl.

                              Willst du jetzt 5 Zeichen stehen lassen, schreibst du:

                              PHP-Code:
                              $out preg_replace('/(.)(\\1{1,4})\\1*/sS''$1$2'$in); 
                              Das findet und behält mindestens 1 + 1 == 2 Zeichen und maximal 1 + 4 == 5 Zeichen. Alle weiteren Zeichen werden entfernt.

                              Ich hoffe, das war jetzt nicht noch verwirrender als nur der reguläre Ausdruck alleine ...

                              Alternativ könntest du auch eine Funktion schreiben, die die maximale Zahl zu erhaltender gleicher Zeichen entgegennimmt und dann den regulären Ausdruck zusammenbaut:

                              PHP-Code:

                              function many_to_few(
                                
                              $in   /// STR       string to filter
                                
                              $max  /// INT(3...) maximale Anzahl 
                              ) {
                                if (!
                              is_num($max) || $max 3) {
                                  return 
                              FALSE;
                                }
                                return 
                              preg_replace('/(.)(\\1{1,' $max '})\\1*/sS''$1$2'$in);

                              Klingon function calls do not have “parameters”‒they have “arguments”‒and they always win them!

                              Kommentar

                              Lädt...
                              X