multilingual ... das beste vorgehen?

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • multilingual ... das beste vorgehen?

    nachdem ich mich durch die suche, verschiedene andere foren und google gequält habe, bin ich etwas frustriert und verunsichert, was das thema "mehrsprachige websites" angeht.

    konkret geht es um die sprachfähigkeiten eines kleinen cms, das vor der aufgabe steht sowohl de, en, fr & co anzuzeigen, als auch ru, cz & hu.

    die meisten informationen zu diesem thema favorisieren UTF-8 statt unterschiedlicher ISO-XXX charsets. leider sind die infos so fragmentiert, dass ich mir noch kein komplettes bild über die korrekte vorgehensweise machen kann.

    das ist mein stand der kenntnis:
    • textaufnehmende tabellen in der mysql-db werden mit utf-8 als character-set belegt
    • formulare (admin-bereich, suche, login, etc.) erhalten als attribut 'accept-charset="UTF-8"'
    • vor der ausgabe sende ich einen header mit dem charset sowie einen mit der angeforderten sprache

    nur,
    - wie werden zB inhalte bei der eingabe in die datenbank formatiert?
    --> per utf8_encode() vor dem insert ... wäre doch doppeltgemoppelt?

    - muss die ausgabe html-formatiert werden (htmlentities()) oder stellt der browser die daten automatisch richtig dar, weil charset & sprache schon anzeigen, was da kommt?

    - wie kann man grundsätzlich testen, ob das, was man da verzapft (= programmiert) hat, auch zum gewünschten ergebnis führt?
    --> spracheinstellungen am pc auf russisch setzen und wild eintippen?

    - was habe ich vergessen, zu fragen?

    wäre schön, wenn das ^^ ihr bestätigen/korrigieren könnt und licht in meine dunkelheit bringt.
    Kissolino.com

  • #2
    Re: multilingual ... das beste vorgehen?

    Original geschrieben von Wurzel

    --> spracheinstellungen am pc auf russisch setzen und wild eintippen?
    früher musste man erst den Sprachsatz von MS saugen und installieren.


    das ist russsich:
    Каталог

    heisst Katalog
    mfg
    marc75

    <Platz für anderes>

    Kommentar


    • #3
      Re: Re: multilingual ... das beste vorgehen?

      Original geschrieben von marc75
      das ist russsich:
      Каталог
      heisst Katalog
      aber nur buchstabe für buchstabe .... oder?
      INFO: Erst suchen, dann posten![color=red] | [/color]MANUAL(s): PHP | MySQL | HTML/JS/CSS[color=red] | [/color]NICE: GNOME Do | TESTS: Gästebuch[color=red] | [/color]IM: Jabber.org |


      Kommentar


      • #4
        Re: Re: Re: multilingual ... das beste vorgehen?

        Original geschrieben von Abraxax
        aber nur buchstabe für buchstabe .... oder?
        ich kann ja auch nur noch copy/paste meine letzte Russich Unterrichtstunde liegt ca. 12 Jahre her, da ist jetzt nix mehr mit Russich schreiben.

        habs von google.ru
        mfg
        marc75

        <Platz für anderes>

        Kommentar


        • #5
          tja. ich bin mir auch nicht sooo sicher. mein unterricht ist aber schon ~14 jahre her.
          also müsstest du es u.u. besser wissen ...
          INFO: Erst suchen, dann posten![color=red] | [/color]MANUAL(s): PHP | MySQL | HTML/JS/CSS[color=red] | [/color]NICE: GNOME Do | TESTS: Gästebuch[color=red] | [/color]IM: Jabber.org |


          Kommentar


          • #6
            eigentlich auch egal

            für Wurzel heisst es das dieses Forum hier die kryllischen Schriftzeichen darstellen kann, hatte das mal vor Jahren in ein phpbb probiert da ging es nicht.

            Vielleicht hilft es Ihm
            mfg
            marc75

            <Platz für anderes>

            Kommentar


            • #7
              Vielleicht hilft es Ihm
              eher weniger, imho. *g

              die darstellung in den browsern ist überall gegeben, man muß es nur erstmal hinkriegen, alles darzustellen ich kann dir nur sagen (benutze auch utf-8): so ein riesen haufen bockmist. es ist mir auch nach ettlichen versuchen nicht gelungen, festzustellen, was genau zu tun ist, um utf-8 richtig zu speichern (db) und darzustellen ... manchmal gings, manchmal nicht. im forum läßt sich dazu auch nicht wirklich konkretes finden ... zum verrückt werden

              ich wäre echt froh, wenn sich da ne lösung findet ...
              Die Zeit hat ihre Kinder längst gefressen

              Kommentar


              • #8
                Original geschrieben von derHund
                ich wäre echt froh, wenn sich da ne lösung findet ...
                vielleicht sollten wir mal unser halbwissen zusammenwerfen ... im prinzip ist utf-8 ja nicht die vorgabe, sondern das ergebnis meiner rumsucherei ... wenns per iso einfacher/stabiler ist, dann halt so
                EDIT:
                notiz an mich: form nicht senden, bevor man fertig geschrieben hat
                Kissolino.com

                Kommentar


                • #9
                  Original geschrieben von derHund

                  die darstellung in den browsern ist überall gegeben,
                  nicht ganz, koreanisch, japanisch und co kann mein browser nicht darstellen.

                  man muß es nur erstmal hinkriegen, alles darzustellen
                  dazu kann er ja mal schauen wie es hier im forum gelöst wurde, da es scheinbar hier funktioniert.
                  mfg
                  marc75

                  <Platz für anderes>

                  Kommentar


                  • #10
                    im prinzip ist utf-8 ja nicht die vorgabe
                    ich brauchs fürs xhtml ...
                    vielleicht sollten wir mal unser halbwissen zusammenwerfen ...
                    also, folgendes kann ich mit sicherheit sagen: solch ein formular
                    Code:
                    <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
                    <form method="post" action="bla" accept-charset="ISO-8859-1, ISO-8859-2">
                    wenn ich jetzt einen übergebenen text in der db speicher,
                    - in einem varchar, ausgabe mit htmlentities: funzt!
                    - in einem 'text', ausgabe mit/ohne htmlentities: datenmüll bei sonderzeichen ...

                    wenn ich den accept-charset in utf-8 ändere (was du wohl tun mußt), erhalte ich schon in der db müll. auch in verbindung utf-en/decode ...



                    über die konfiguration meines mySQL kann ich auch nicht viel sagen ...
                    Die Zeit hat ihre Kinder längst gefressen

                    Kommentar


                    • #11
                      mhm ... klingt nicht sehr ermutigend ... ich hab was gefunden zum thema utf-8 <=> unicode .... vielleicht löst das das problem.
                      Kissolino.com

                      Kommentar


                      • #12
                        Original geschrieben von derHund
                        - in einem 'text', ausgabe mit/ohne htmlentities: datenmüll bei sonderzeichen ...
                        schon mal versucht, hier statt einem TEXT- ein BLOB-feld zu verwenden?

                        ich weiss nicht genau, wie die daten bei UTF-8-kodierung beim server ankommen, aber AFAIK werden doch für jedes zeichen zwei bytes übermittelt - ich weiss nicht, ob eine TEXT-spalte mit byte-werten von 0 bis 255 klarkommt ...
                        I don't believe in rebirth. Actually, I never did in my whole lives.

                        Kommentar


                        • #13
                          mhm ... klingt nicht sehr ermutigend ...
                          ach, vielleicht hab ich auch nur irgendwo was verplant, hab grad mal auf der hunde-seite geschaut, da gehts ohne probleme ... ich muß mir das bei gelegenheit nochmal genau anschauen
                          ich hab was gefunden zum thema utf-8 <=> unicode .... vielleicht löst das das problem.
                          laß disch überraschen
                          Die Zeit hat ihre Kinder längst gefressen

                          Kommentar


                          • #14
                            schon mal versucht, hier statt einem TEXT- ein BLOB-feld zu verwenden?
                            ich hab schon jede menge versucht, nur nicht wirklich systematisch *g
                            ich muß mir das bei gelegenheit nochmal genau anschauen
                            Die Zeit hat ihre Kinder längst gefressen

                            Kommentar


                            • #15
                              sorry, hab jetzt leider keine zeit, realhaxe hat mir den link geschickt.
                              hab grad ne dreisprachige seite gekloppt, voll dynamisch-> alles in db, sprich: deutsch, englich, chinesisch. hier der link
                              ich sage nur, utf-8 ging bei allen versuchen schief. ich bin schon weg, keine zeit. bin aber erst montag zurück, ich hoffe das reicht. dann klappts auch. ich suchs dann raus.
                              [color=red]musse rühre, musse probiere=>iss a pulsgeber ![/color]

                              Kommentar

                              Lädt...
                              X