[Regex-Schnorr] Uppercase-Umlaute richtig ersetzen

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • [Regex-Schnorr] Uppercase-Umlaute richtig ersetzen

    Hat grad jemand Lust, mir einen Regex zu formulieren?

    In einer Funktion zum Generieren von URLs aus frei eingegebenen, deutschen Worten tausche ich Umlaute im Moment folgendermaßen aus:

    PHP-Code:
    $temp_matchcode_name str_replace("Ä","AE",$temp_matchcode_name);
    $temp_matchcode_name str_replace("Ö","OE",$temp_matchcode_name);
    $temp_matchcode_name str_replace("Ü","UE",$temp_matchcode_name); 
    dasselbe in Grün nochmal für kleine Umlaute. Kann man bestimmt cleverer und in einer Zeile machen, aber mein Punkt ist ein anderer. Diese Methode sieht blöd aus, wenn der Umlaut der erste Buchstabe im Wort ist. Beispiel:

    AEnderungen.html
    UEber_uns.html

    schöner wäre:

    Aenderungen.html
    Ueber_uns.html

    Die Regel wäre also:
    Tausche jeden großen Umlaut durch AE, OE bzw. UE aus, außer er wird direkt von einem beliebigen Kleinbuchstaben gefolgt. In dem Fall ersetze durch Ae, Oe und Ue.
    Schlimmstenfalls mache ich das mit einer Schleife, aber viel schöner wäre natürlich ein Regex - schon, weil ich Code sparen will wo es nur sinnvoll geht. Also wenn jemand Lust hat, ich wäre dankbar!
    Zuletzt geändert von pekka; 05.01.2009, 19:45.

  • #2
    Re: [Regex-Schnorr] Uppercase-Umlaute richtig ersetzen

    Original geschrieben von pekka
    Hat grad jemand Lust, einen Regex zu formulieren? Mir ist das zu hoch.

    In einer Funktion zum Generieren von URLs aus frei eingegebenen, deutschen Worten tausche ich Umlaute im Moment folgendermaßen aus:

    PHP-Code:
    $temp_matchcode_name str_replace("Ä","AE",$temp_matchcode_name);
    $temp_matchcode_name str_replace("Ö","OE",$temp_matchcode_name);
    $temp_matchcode_name str_replace("Ü","UE",$temp_matchcode_name); 
    dasselbe in Grün nochmal für kleine Umlaute. Kann man bestimmt cleverer und in einer Zeile machen, ...
    Hast du schon mal nach Transliteration gegoogelt?
    Ich für meinen Teil warte schon seit ewigen Zeiten darauf, dass das mal einer ordentlich löst, und das fertige Script ins WWW stellt. ;-)

    Nebenbei bemerkt, gibts auch noch das "ß" in der deutschen Sprache, was keinen Platz in einer ordentlich formatierten URL hat.

    Tausche jeden großen Umlaut durch AE, OE bzw. UE aus, außer er wird direkt von einem beliebigen Kleinbuchstaben gefolgt. In dem Fall ersetze durch Ae, Oe und Ue.
    Schlimmstenfalls mache ich das mit einer Schleife, aber viel schöner wäre natürlich ein Regex - schon, weil ich Code sparen will wo es nur sinnvoll geht.
    Mal sehen: Du hast drei Fälle zur Unterscheidung:
    1.) kleingeschriebener Umlaut (einfache Umwandlung)
    2.) großgeschriebener Umlaut mit nachfolgendem kleingeschriebenem Buchstaben
    3.) alle anderen großgeschriebenen Umlaute

    PHP-Code:
    $pcre '/(?:
      [äöü]|
      [ÄÖÜ](?=[a-zäöüß])|
      ([ÄÖÜ])
    )/x'
    // fuer UTF-8 hier noch das "u" ergaenzen
    // sonst nur für ISO-8859-1(5) oder Windows CP 1252 ("ANSI")

    function transcript(
      
    $hits
    ) {
      static 
    $trans_table = array (
        
    'ä' => 'ae',
        
    'ö' => 'oe',
        
    'ü' => 'ue',
        
    'Ä' => 'Ae',
        
    'Ö' => 'Oe',
        
    'Ü' => 'Ue',
      );
      
    // Klein und Groß+Klein
      
    if (!isset($hits[1])) {
        return isset(
    $trans_table[$hits[0]]) ? $trans_table[$hits[0]] : $hits[0];
      }
      
    // Groß(+Groß)
      
    return isset($trans_table[$hits[0]])
          ? 
    strtoupper($trans_table[$hits[0]])
          : 
    $hits[0];
    }

    $haystack 'Käse Köln Füße Öl Übel Äü Üß ÄÖÜ Ä Ö Ü ÜBUNG';

    $out preg_replace_callback($pcre'transcript'$haystack); 
    Klingon function calls do not have “parameters”‒they have “arguments”‒and they always win them!

    Kommentar


    • #3
      Eyyyy super, vielen dank!
      Der verdient eigentlich schon Code-Schnipsel-Status
      Werde es morgen testen!

      Kommentar

      Lädt...
      X