Hi,
komme ich damit klar, wenn ich den Quelltext einer Seite auf den Body reduzieren möchte oder muss ich noch irgendwas besonderes berücksichtigen?
Ich habe den Wert in den Klammern greedy gemacht, da es theoretisch sein kann, dass durch einen Fehler zwei <body>'s auf der Seite sein könnten. Hatte ich schon mal bei einem Kunden gesehen, weil der ein CMS hatte, dass einfach HTML-Seiten als Content includierte und die Seite ging trotzdem.
EDIT: Hmm.. ersetzt der dann das zwei mal oder nur einmal? Also was macht der aus:
Muss ich wohl mal testen...
EDIT2:
Ok daraus wird:
Das ist schlecht :P
EDIT3:
Ich denke ich lösche danach noch mal alle <html>, <head> und <body> Bereiche. Dann dürfte das klappen. Ich will nämlich Inhalt2 nicht haben.
Gruß
Marc
komme ich damit klar, wenn ich den Quelltext einer Seite auf den Body reduzieren möchte oder muss ich noch irgendwas besonderes berücksichtigen?
Code:
$src = preg_replace('#<html.*<body.*>(.*?)</body.*>.*</html.*>#Uis', '\\1', $src);
EDIT: Hmm.. ersetzt der dann das zwei mal oder nur einmal? Also was macht der aus:
Code:
<html> <head> </head> <body> Inhalt 1 <html> <head> </head> <body> Inhalt 2 </body> </html> </body> </html>
EDIT2:
Ok daraus wird:
Code:
Inhalt 1 <html> <head> </head> <body> Inhalt 2 </body> </html>
EDIT3:
Ich denke ich lösche danach noch mal alle <html>, <head> und <body> Bereiche. Dann dürfte das klappen. Ich will nämlich Inhalt2 nicht haben.
Gruß
Marc
Kommentar