xml parser - zeilenumbruch bei umlauten!

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • xml parser - zeilenumbruch bei umlauten!

    Hallo, hier wurde genau mein Problem beschrieben, aber eine Lösung fehlte dem ganzen jedoch:
    http://forum.de.selfhtml.org/archiv/2007/4/t150442/
    Hallo,

    ich habe ein Problem mit den XML-Parserfuznktionen von PHP (xml_parser_create()) und habe auch schon das halbe Internet abgegrast
    Also:

    Ich habe eine XML Datei mit folgendem Charset-Encoding "<?xml version='1.0' encoding='iso-8859-1'?>". Besitzen Elemente in dieser Datei Umlaute, so bricht der Parser den Datenstrom an dieser Stelle um und erzeugt eine neue Zeile.

    Dieses Verhalten tritt erst mit PHP 5 auf. In PHP 4 läuft alles Problemlos.

    Minimalbsp:
    xml_set_character_data_handler($xml_parser, "indexCharacterData");

    ruft auf:

    function indexCharacterData($parser, $data) {
    echo "<br>---> ";var_dump($data);
    }

    erzeugt folgende Ausgabe (PHP5:

    ---> string(8) " Artikel"
    ---> string(11) "übersicht "

    in PHP 4 jedoch:

    ---> string(8) " Artikelübersicht"


    Ich hab schon hinbekommen, dass aus "übersicht" in "übersicht" (jedoch blieb der Bruch bestehen) und das aus "Artikelübersicht" in "Artikelbersicht" umgesetzt wurde.

    Ich denke es ist ein Charset Problem, aber hab eigentlich auch schon alle mir bekannten Möglichkeiten durchexerziert.
    Mit Encoding auf UTF-8 hab ich schon einiges probiert, ändert aber nix.
    Als Ergebnis bekomm ich das:
    PHP-Code:
    Array
    (
        [
    0] => Array
            (
                [
    ATTRIBUTES] => Array
                    (
                        [
    ISDEFAULT] => true
                    
    )
                [
    ARTGROUPID] => Abf
            
    )
        [
    1] => Array
            (
                [
    ARTGROUPID] => ührmittel
            
    )

    Abführmittel muss natürlich nur ein Eintrag sein?

    Weiß jemand, was gemacht werden muss???

    Danke
    Zuletzt geändert von TriphunEM; 06.11.2009, 11:48.

  • #2
    Hallo,

    dort (bei selfhtml) war auch noch die Frage offen, warum du nicht DOM oder SimpleXML benutzt.

    Ansonsten steht im Manual noch ein Kommentar dazu. Hast du das schon probiert?

    Bitte poste auch deinen bisherigen relevanten Code, damit man schonmal einen Überblick hat und nicht jedes Detail erst erfragen muss.

    Gruß,

    Amica
    Zuletzt geändert von AmicaNoctis; 06.11.2009, 11:54.
    [COLOR="DarkSlateGray"]Hast du die [COLOR="DarkSlateGray"]Grundlagen zur Fehlersuche[/color] gelesen? Hast du Code-Tags benutzt?
    Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
    Super, danke!
    [/COLOR]

    Kommentar


    • #3
      Hi,

      ja ich hab ein
      PHP-Code:
              xml_parser_set_option($this->objXMLParser,XML_OPTION_TARGET_ENCODING,'UTF-8'); 
      schon eingebaut. Das ändert leider überhaupt nichts!

      Warum ich kein SimpleXML verwende? Weil ich den XML parser nun mal gewählt habe, und ich damit eine großen XML-Import in eine DB geschrieben habe, und ich auf keinen Fall die Zeit noch das Geld habe, das zu ändern!

      Noch eine Idee?

      Kommentar


      • #4
        Das ist zwar unschön für dich aber leider spezifikationskonformes Verhalten:

        http://de.php.net/manual/de/function...ta-handler.php

        Character data handler is called for every piece of a text in the XML document. It can be called multiple times inside each fragment (e.g. for non-ASCII strings).
        Du musst das also selbst zusammenhalten, auch wenn es getrennt kommt.
        [COLOR="DarkSlateGray"]Hast du die [COLOR="DarkSlateGray"]Grundlagen zur Fehlersuche[/color] gelesen? Hast du Code-Tags benutzt?
        Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
        Super, danke!
        [/COLOR]

        Kommentar

        Lädt...
        X