Ich habe ein Script, das alle URLs aus einer Seite ausliest.
Geht auch mit allen HTML-Tags, nur bei Javascripten mit der windows.open()-Funktion habe ich Probleme beim auslesen.
Ich lese dabei die Zeilen des HTML-Codes ein, wird ein bestimmter String (hier 'windows.open') gefunden, soll die URL ausgelesen werden.
So siehts aus:
Die momentane (falsche) Ausgabe ist
Da der Array[2] nur die URL mit Query enthalten soll, sollte der Array aber eigentlich so aussehen:
Wie bekomme ich den letzten unbenötigten Teil
weg?
Gruss Guido
Geht auch mit allen HTML-Tags, nur bei Javascripten mit der windows.open()-Funktion habe ich Probleme beim auslesen.
Ich lese dabei die Zeilen des HTML-Codes ein, wird ein bestimmter String (hier 'windows.open') gefunden, soll die URL ausgelesen werden.
So siehts aus:
PHP-Code:
$zeile = "<a href=\"#\" onClick=\"java script:window.open('seite.htm?query=value','pop','width=490,height=490')\">";
$pattern = "/window\.open\((\'|\")(.*)(\'|\"),/";
preg_match($pattern, $zeile, $matches);
print "<pre>";
print_r($matches);
print "<pre>";
Code:
Array ( [0] => window.open('seite.htm?query=value','pop', [1] => ' [2] => seite.htm?query=value','pop [3] => ' )
Code:
Array ( [0] => window.open('seite.htm?query=value', [1] => ' [2] => seite.htm?query=value [3] => ' )
Code:
'pop',
Gruss Guido
Kommentar