XML_Parser verschluckt Zeichen

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • XML_Parser verschluckt Zeichen

    Moin allesamt ,
    Ich will mit PHP eine simple XML-Datei schreiben und später mit xml_parse_into_struct wieder einlesen , klappt auch weitestgehend ... das Problem ist nur , dass das , was nich zu den einfachen lateinischen Schriftzeichen gehört , beim Einlesen Probleme macht . Ich hab zunächst als Wert des Elements den Text der da rein soll so eingetragen , wie er auch in ne ganz normale XHTML-Datei käme , also alle Sonderzeichen als &xxx; . Und beim ü hat er dann einfach abgebrochen . Ich hab daraufhin ein wenig rumprobiert und den Wert in ein Attribut geschrieben . Ich hab dann rausgefunden , dass es funktioniert , wenn ich das & als & schreibe . Nun hab ich mir gedacht , das Problem sei gelöst , und das ganze wieder zum Element-Wert gemacht , und siehe da , statt ü steht da uuml; . Ein bisschen rumprobieren zeigt , dass & und " verschwinden , während selbst   zum Abbruch führt . Ich hab auf php.net mal in die Dokumentation gesehen und hier gesucht , aber nix gefunden . Kennt jemand dieses Phänomen ? Hat jemand ne Ahnung , was ich machen kann (außer des wieder als Attribut einzutragen) ?

    In PHP sieht das entsprechende so aus :
    PHP-Code:
    $XML xml_parser_create ();
    xml_parser_set_option($XMLXML_OPTION_CASE_FOLDING0);
    xml_parser_set_option($XMLXML_OPTION_SKIP_WHITE1);
    xml_parse_into_struct ($XML,join('',file($Pfad.$Name.'.xml')),$Meta);
    xml_parser_free ($XML); 
    die XML-Dateien haben diesen Aufbau :
    PHP-Code:
    <xml>
    <
    Autor></Autor>
    <
    Datei Typ="" Titel="" Name="" Endung=""></Datei>
    </
    xml
    Ich hab's auch mit '<xml>&amp;amp;uuml;cnjak</xml>' getestet , dasselbe komische Ergebnis

    Das Skript läuft bei 1&amp;1 unter PHP5 .

    Ich wär echt dankbar , wenn mir da jemand weiter helfen könnte .
    Sonst noch'n nettes Wochenende wünscht
    Euer Hehler
    [color=darkblue]
    "Eine gute Theorie ist das Praktischste, was es gibt."
    Gustav Robert Kirchhoff (1827-87), dt. Physiker
    [/color]

  • #2
    was passiert denn wenn du den header als UTF-8 machst?
    also das praktisch ü bleibt und du nicht daraus & uuml; machen musst.
    Sunshine CMS
    BannerAdManagement
    Borlabs - because we make IT easier
    Formulargenerator [color=red]Neu![/color]
    Herkunftsstatistik [color=red]Neu![/color]

    Kommentar


    • #3
      Wenn ich die XML utf-8 codiere , und nach dem Parsen utf8_decode und danach htmlentities darauf anwende , dann klappt's . Also danke erstmal .
      Aber würde mich schon sehr interessieren , wo das Problem mit den Sonderzeichen liegt ...
      [color=darkblue]
      "Eine gute Theorie ist das Praktischste, was es gibt."
      Gustav Robert Kirchhoff (1827-87), dt. Physiker
      [/color]

      Kommentar

      Lädt...
      X