utf8 decode / encode

Collapse
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • utf8 decode / encode

    Hallo

    Habe folgendes Problem:

    In einer mysql DB (utf8) habe folgende Einträge:

    name_land
    -------------
    Östereich
    Rumänien
    (...)

    im command line client werden die daten auch so dargestellt. Wenn ich die daten via phpmyadmin anschaue sehen sie so aus:

    Östereich
    Rumänien
    (...)

    Ich verstehe nich warum das so ist, aber das ist auch nicht weiter tragisch (verwende eigentlich nur command line).

    die Daten lese ich mit php so aus:

    Code:
    (...)
         $dbname="mydb";
         $connect=mysql_connect($dbserver,$dbusername,$dbuserpassword) or die("keine Verbindung möglich");
            mysql_set_charset('utf8',$connect);
            $db=mysql_select_db($dbname,$connect) or die ("DB-Auswahl fehlgeschlagen");
            $myquery="SET character_set_database=utf8";
            $ergebnis=mysql_query($myquery, $connect) or die("Anfrage fehlgeschlagen $myquery");
    
    
    $myquery="SELECT $_SESSION[name_country] FROM country";
    $ergebnis=mysql_query($myquery, $connect) or die("Anfrage fehlgeschlagen");
    
    while($row = mysql_fetch_row($ergebnis)){
            $name_land=htmlentities(utf8_decode($row[0]), ENT_QUOTES, 'UTF-8', false);
            print "$name_land";
            (...)
    }
    Die Ausgabe ist folgende:


    ""
    "Rumänien"
    (...)


    Wieso ist $name_land bei Östereich bzw. Östereich auf einmal leer?


    Vielen Dank!

  • #2
    Weil du den Namen mit utf8_decode() in ISO-8859-1 konvertierst, aber htmlentities() sagst, dass er UTF-8 kodiert ist. Warum verwendest du überhaupt htmlentities()? In 99% der Fälle reicht auch htmlspecialchars() vollkommen aus. Und warum konvertierst du UTF-8 in ISO-8859-1? Wenn du ISO-8859-1 haben willst, warum setzt du nicht gleich die Datenbankverbindung auf diesen Zeichensatz?

    Comment


    • #3
      danke für deine antwort. du hast recht, das utf8decode macht natürlich keinen sinn. ich habe beim importieren der daten "set names utf8" nicht ausgeführt und dadurch waren nicht alle daten korrekt erfasst.

      Comment


      • #4
        es reicht auch aus, wenn du dann statt "htmlentities" "htmlspecialchars" benutzt, da UTF-8 im gegensatz zu ISO Umlaute usw. enthält...

        Comment


        • #5
          ok. aber was ist der nachteil von htmlentities?

          Comment


          • #6
            wenn du Umlaute per htmlentities umwandeln willst, müssten eigtl. komische Zeichen rauskommen. (bei Charset UTF-8)
            Last edited by Gunah; 07-12-2009, 12:14.

            Comment


            • #7
              Unsinn!
              Sowohl bei "htmlentities" und auch "htmlspecialchars" kann/sollte man den Charset angeben, wenn er von iso-8859-1 abweicht.

              ok. aber was ist der nachteil von htmlentities?
              Es macht meist mehr als nötig.

              Dadurch:
              Es ist lahmer.
              Es erzeugt fetteren Output.
              Last edited by combie; 07-12-2009, 12:58.
              Wir werden alle sterben

              Comment


              • #8
                Originally posted by madmadmod View Post
                ok. aber was ist der nachteil von htmlentities?
                http://www.w3.org/International/questions/qa-escapes:
                Es ist fast immer besser, eine Zeichencodierung zu benutzen, die es erlaubt, die Zeichen in ihrer normalen Form zu verwenden, anstatt Zeichen-Entity-Referenzen oder numerische Zeichenreferenzen zu verwenden.

                Die Verwendung von Escapes macht den Quelltext schlechter lesbar und schwerer zu pflegen und kann auch die Dateigröße beträchtlich erhöhen.
                I don't believe in rebirth. Actually, I never did in my whole lives.

                Comment

                Working...
                X