Hallo alle zusammen,
für ein Projekt muss ich, anhand einer übergebenen URL, die Meta Informationen von Webseiten auslesen. Das ganze klappt soweit sehr gut, solange bis ich auf eine Weiterleitung treffe.
In folgendem Fall bekomme ich mittels CURL und CURLINFO_HTTP_CODE die Information über eine Weiterleitung, allerdings habe ich kaum Ideen an die weitergeleitete Domain zu kommen.
Aktuell öffne ich mit file_get_contents den Quelltext der neuen URL und suche mit einem regulären Ausdruck nach dem eingebundenen Stylesheet und hole mir so den Namen der Domain. Mir ist auch klar das diese Möglichkeit Käse ist. Ich arbeite zur Zeit an einer Lösung die vorkommen von absoluten Pfaden in dem Dokument sucht und bei mehr als drei gleichen Übereinstimmungen aus diesem den Namen der Domain herausparst.
Folgende Domain nutze ich zum testen: MooEditable
Vielleicht hat einer von euch ja eine Idee wie man das am besten bewerkstelligen kann.
cheers
für ein Projekt muss ich, anhand einer übergebenen URL, die Meta Informationen von Webseiten auslesen. Das ganze klappt soweit sehr gut, solange bis ich auf eine Weiterleitung treffe.
In folgendem Fall bekomme ich mittels CURL und CURLINFO_HTTP_CODE die Information über eine Weiterleitung, allerdings habe ich kaum Ideen an die weitergeleitete Domain zu kommen.
Aktuell öffne ich mit file_get_contents den Quelltext der neuen URL und suche mit einem regulären Ausdruck nach dem eingebundenen Stylesheet und hole mir so den Namen der Domain. Mir ist auch klar das diese Möglichkeit Käse ist. Ich arbeite zur Zeit an einer Lösung die vorkommen von absoluten Pfaden in dem Dokument sucht und bei mehr als drei gleichen Übereinstimmungen aus diesem den Namen der Domain herausparst.
Folgende Domain nutze ich zum testen: MooEditable
Vielleicht hat einer von euch ja eine Idee wie man das am besten bewerkstelligen kann.
cheers
Kommentar