Datei problem - Zeichensatz

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Datei problem - Zeichensatz

    Hallo zusammen,

    ich habe eine Frage bezüglich des Zeichensatzes einer Datei.
    Ich bekomme auf einen FTP-Server eine Datei gestellt.
    Laut Lieferant handelt es sich um eine UTF-8 Datei.
    Nun möchte ich diese gerne per PHP verarbeiten.

    Wenn ich diese mit FOPEN einlese, und mir die Zeilen ausgebe, dann sieht das so aus:
    1�5�0�|�S�P�X�|�A�R�T�|�9�8�1�2�1�1�.�0�0�0�|���|��� �

    mit utf8_decode und mb_convert_encoding habe ich es nicht hinbekommen.
    KAnn mir jemand einen Tipp geben, was ich hier machen muss ?

    Gruß jogi
    Angehängte Dateien

  • #2
    Hallo,

    nein, das ist offensichtlich eine UTF-16LE-Datei, die du aber auch mit mb_convert_encoding umwandeln kannst.

    Gruß,

    Amica
    [COLOR="DarkSlateGray"]Hast du die [COLOR="DarkSlateGray"]Grundlagen zur Fehlersuche[/color] gelesen? Hast du Code-Tags benutzt?
    Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
    Super, danke!
    [/COLOR]

    Kommentar


    • #3
      Hallo amica,

      danke für deinen Tipp.
      Leider führt das
      PHP-Code:
      mb_convert_encoding$datei[$a], 'ISO-8859-1''UTF-16LE'
      zu
      Code:
      ???????????????????????�?�??
      und
      PHP-Code:
      mb_convert_encoding$datei[$a], 'UTF-8''UTF-16LE'
      zu
      Code:
      ã„€ã”€ã€€ç°€åŒ€å€€å €ç°€ä„€åˆ€å€ç°€ã¤€ã €ã„€ãˆ€ã„€ã„€â¸€ã€€ã€€ã€€ç°€�ç°€�ഀ਀
      irgendwas mache ich wohl noch verkehrt, oder ?

      Kommentar


      • #4
        Vermutlich schickst du es mit der falschen Charset-Angabe zum Browser. Denn im Prinzip ist das schon richtig so.

        Mit
        PHP-Code:
        header("Content-Type: text/plain; charset=UTF-8"); 
        kannst du z. B. festlegen, dass es der Browser als Klartext anzeigen und als UTF-8 interpretieren soll.
        [COLOR="DarkSlateGray"]Hast du die [COLOR="DarkSlateGray"]Grundlagen zur Fehlersuche[/color] gelesen? Hast du Code-Tags benutzt?
        Hast du als URL oder Domain-Beispiele example.com, example.net oder example.org benutzt?
        Super, danke!
        [/COLOR]

        Kommentar


        • #5
          Zitat von jogisarge Beitrag anzeigen
          Leider führt das
          PHP-Code:
          mb_convert_encoding$datei[$a], 'ISO-8859-1''UTF-16LE'
          zu
          Code:
          ???????????????????????�?�??
          Bei mir führt das, wenn ich es in einer als ISO-8859-1 ausgelieferten Ressource anwende (Script als ANSI gespeichert), zu
          Code:
          ?120|SPX|ART|9811|1.000|�|� 150|SPX|ART|981211.000|�|�
          - und ist damit schon recht nah dran am Original, welches mir Notepad++ als
          Code:
          120|SPX|ART|9811|1.000|[i]NUL[/i]|[i]NUL[/i]
          150|SPX|ART|981211.000|[i]NUL[/i]|[i]NUL[/i]
          anzeigt. (Unter Format ist dabei im NP++ automatisch UCS-2 LE ausgewählt, aber ich kann gerade nicht sagen, in wie fern das wahrscheinlicher ist als UTF16-LE.)

          Die NUL-Bytes werden als
          Code:
          dargestellt, und das führende Fragezeichen rührt vermutlich von einer konvertierten BOM her.
          I don't believe in rebirth. Actually, I never did in my whole lives.

          Kommentar

          Lädt...
          X