Alle HTML Tags schliessen

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Alle HTML Tags schliessen

    Hi Leute,

    wie kann ich es hinbekommen, einen html-text zu parsen und dann fehlende schliessende html-tags am ende korrekt zu schliessen?

    Habs mit reg_exp bisher nicht hinbekommen, hat jemand ne Idee dazu?

    Gruß
    Tgod
    ---^_-(oOOo)-_^---
    ° Tgod °
    ------------------
    www.twintech.de

  • #2
    Re: Alle HTML Tags schliessen

    das wird auf jeden fall nicht einfach...

    es ist ja nicht damit getan, für alle irgendwo mal geöffneten html-tags am ende einen schliessenden anzuhängen, die reihenfolge und position muss ja auch stimmen.


    wenn du aus
    Code:
    <html><body><table><tr><td>xyz</td></tr></body></html>
    einfach ein
    Code:
    <html><body><table><tr><td>xyz</td></tr></body></html></table>
    machst, hast du dadurch ja noch gar nichts gewonnen, evtl. je nach fehlertoleranz des browser sogar noch verschlimmbessert...


    ich fürchte, nur mit regex alleine wirst du hier nicht zum ziel kommen, da steckt schon eine aufwendigere logik hinter.
    I don't believe in rebirth. Actually, I never did in my whole lives.

    Kommentar


    • #3
      Weiß nichts konkretes, aber

      mittels Regex kannst du dir ja die geschriebenen Tags in ein Array holen. dann gehst du einfach das array rückwärts durch und machst halt die /-Tags.

      Kommentar


      • #4
        @TobiaZ: Danke, so werde ich das mal versuchen...ich muss nur noch rausfinden, wie ich sämtliche HTML Tags mit ner regexp bekomme, denn ich muss ja bei:
        Code:
        <font size=3>
        auch das "font" bekommen nicht nur sowas wie:
        Code:
        <b> oder <i>
        ---^_-(oOOo)-_^---
        ° Tgod °
        ------------------
        www.twintech.de

        Kommentar


        • #5
          wenn du das mal fertig hast, kannste ja mal posten! das nenne ich ne aufgabe
          eddi
          [color=red]musse rühre, musse probiere=>iss a pulsgeber ![/color]

          Kommentar


          • #6
            Original geschrieben von Tgod
            ich muss nur noch rausfinden, wie ich sämtliche HTML Tags mit ner regexp bekomme, denn ich muss ja bei:
            Code:
            <font size=3>
            das ist mit regulären ausdrücken kein grosses problem.

            du suchst nach etwas, das mit <font anfängt und mit > aufhört.

            also so in etwa \<font(.*?)\>
            . = beliebige zeichen
            + = 0 oder beliebig viel davon
            ? dient dazu, den 'hunger' des regulären ausdrucks einzuschränken.
            die runden klammern kannst du evtl. noch weglassen, wenn du das was hinter <font steht nicht zur weiteren verarbeitung brauchst.
            I don't believe in rebirth. Actually, I never did in my whole lives.

            Kommentar


            • #7
              ich glaube eine expr. die nur das erste wort mit nimmt, wäre besser. weil ansonsten für font, table, ... alles extra gemacht werden muss.

              also irgendwas mit "<+bis zum leerzeichen" und ">"

              Kommentar

              Lädt...
              X