Hu Folks,
also ich versuche gerade den Quelltext einer HTML Seite auszuwerten und nach bestimmten Begriffen zu suchen.
1.) Die Begriffe stehen fest, was im Klartext bedeutet dass ich das restliche HTML Gedöns drumrum ja ignorieren kann.
Beispiel:
Ich will nun z.b. aus <html>...class2="text"....</html> class2 samt Inhalt auslesen. Mein regex muster lautet:
".*(class2="\w").*"
Mit ".*" lass ich also den HTML Code drumrum unberührt.
Das wird in den meisten regex Editoren auch fehlerfrei gemacht. Nur wenn ich das jetzt in ein PHP Script auslese, meldet dieses:
Warning: preg_match() [function.preg-match]: Unknown modifier '.' in /www/htdocs/xxx/xxx.php on line 5
Was wohl soviel bedeutet, dass PHP den Punkt (.) in regex zum erfassen jeglicher Zeichen nicht kennt? Ohne gehts nämlich. Falls ja, wie erfasse ich dann in PHP per Regex beliebige Zeichen?
2.) In den meisten Regex-Editoren kann man auf singleline umschalten, was bedeutet dass der String der HTML Seite nur als eine einzige Zeile behandelt wird. Damit spart man sich Zeilenumbrüche im Regexmuster. Wie setzte ich diesen Singlelinemodus für regex in PHP ?
mfg und danke
also ich versuche gerade den Quelltext einer HTML Seite auszuwerten und nach bestimmten Begriffen zu suchen.
1.) Die Begriffe stehen fest, was im Klartext bedeutet dass ich das restliche HTML Gedöns drumrum ja ignorieren kann.
Beispiel:
Ich will nun z.b. aus <html>...class2="text"....</html> class2 samt Inhalt auslesen. Mein regex muster lautet:
".*(class2="\w").*"
Mit ".*" lass ich also den HTML Code drumrum unberührt.
Das wird in den meisten regex Editoren auch fehlerfrei gemacht. Nur wenn ich das jetzt in ein PHP Script auslese, meldet dieses:
Warning: preg_match() [function.preg-match]: Unknown modifier '.' in /www/htdocs/xxx/xxx.php on line 5
Was wohl soviel bedeutet, dass PHP den Punkt (.) in regex zum erfassen jeglicher Zeichen nicht kennt? Ohne gehts nämlich. Falls ja, wie erfasse ich dann in PHP per Regex beliebige Zeichen?
2.) In den meisten Regex-Editoren kann man auf singleline umschalten, was bedeutet dass der String der HTML Seite nur als eine einzige Zeile behandelt wird. Damit spart man sich Zeilenumbrüche im Regexmuster. Wie setzte ich diesen Singlelinemodus für regex in PHP ?
mfg und danke
Kommentar