Zeichensatz-Problem

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Zeichensatz-Problem

    Hallo,

    Ich mache folgendes: Ich schicke über ein Formlar Text aus einer doc-Datei an ein php-Script. Dieses erstellt mir eine html-Seite, in der ich den üblichen Zeichensatz angebe:

    <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">

    Wenn ich das ganze nun validiere (validator.w3.org), bekomme ich bei diversen normalen Buchstaben Fehlermeldungen wie diese:

    non SGML character number 146

    so what?

    Gruß,
    Syco
    [COLOR=darkblue].: 1+1=23 :.[/COLOR]

  • #2
    Re: Zeichensatz-Problem

    Original geschrieben von syco23
    so what?
    wenn dir das problem egal ist, warum fragst du dann ...?


    das zeichen ist halt einfach nicht unkodiert erlaubt an der stelle, wo es bei dir auftaucht.
    I don't believe in rebirth. Actually, I never did in my whole lives.

    Kommentar


    • #3
      wenn dir das problem egal ist, warum fragst du dann ...?
      wie du dir sicher vorstellen kanst, war's nicht so gemeint

      Es handelt sich um Buchstaben wie z.B. l mitten in Worten ohne Sonderzeichen. Ich kann mir also nicht vorstellen, was daran nicht passt.

      Mein einziger Erklärungsansatz: Ein l aus einem Worddokument kann unter Umständen anders kodiert sein, als das regläre ASCII-l. Aber dazu kenne ich mich mit Zeichensätzen leider zu wenig aus.
      [COLOR=darkblue].: 1+1=23 :.[/COLOR]

      Kommentar


      • #4
        Original geschrieben von syco23
        wie du dir sicher vorstellen kanst, war's nicht so gemeint
        *g* hatte mich nur leicht gewundert - weil "so what?" im englischen das pendant eines schulterzuckend vorgebrachten "na und, was soll's ..." ist.

        Es handelt sich um Buchstaben wie z.B. l mitten in Worten ohne Sonderzeichen. Ich kann mir also nicht vorstellen, was daran nicht passt.

        Mein einziger Erklärungsansatz: Ein l aus einem Worddokument kann unter Umständen anders kodiert sein, als das regläre ASCII-l. Aber dazu kenne ich mich mit Zeichensätzen leider zu wenig aus.
        also beispielsweise das oben genannte zeichen mit der nummer 146 wäre wohl das ’
        das liegt aber nicht innerhalb von iso-8859-1, wäre also entweder als entity zu schreiben - oder ein anderes charset zu verwenden, bspw. unicode.
        I don't believe in rebirth. Actually, I never did in my whole lives.

        Kommentar


        • #5
          @wahsaga
          kennst du spontan eine php fkt welche mir die tollen word-copy&paste-fehler in saubere zeichen umwandeln kann?
          INFO: Erst suchen, dann posten![color=red] | [/color]MANUAL(s): PHP | MySQL | HTML/JS/CSS[color=red] | [/color]NICE: GNOME Do | TESTS: Gästebuch[color=red] | [/color]IM: Jabber.org |


          Kommentar


          • #6
            nö.
            aber wenn sowas öfter vorkommt würde ich überlegen, gleich auf utf-8 umzusteigen ...
            I don't believe in rebirth. Actually, I never did in my whole lives.

            Kommentar


            • #7
              ja. an der überlegung war ich auch schon.

              hatte vorhin schon mal ein paar threads gelesen und muss jetzt wohl mein framework etwas modifizieren, damit das problemlos klappt.

              auch die daten in der db muss ich noch umwandeln.

              naja. mal sehen, oder ich mache einfach einen würgarround.
              INFO: Erst suchen, dann posten![color=red] | [/color]MANUAL(s): PHP | MySQL | HTML/JS/CSS[color=red] | [/color]NICE: GNOME Do | TESTS: Gästebuch[color=red] | [/color]IM: Jabber.org |


              Kommentar

              Lädt...
              X