Grüß Gott,
ich arbeite zurzeit an einem Linkchecker (dem ein oder anderen hier ist dies wohl bekannt), der auch prima funktioniert. Es gibt in meinem Skript drei Typen, (interne!) Links zu überprüfen:
- Bei internen IDs wird das Vorkommen via Datenbankabfrage überprüft
- Beim Vorkommen einer html-Datei wird die Datei angepingt
- Bei sonstigen Dateien (doc, pdf et cetera) verwende ich file_exists
Warum Pingen? Es handelt sich um via .htaccess generierte .html-Dateien (mod_rewite), sodass diese real nicht existieren. Gepingt wird mittels @fopen.
Allerdings bedarf dieser Vorgang bei 1.365 zu überprüfenden Links insgesamt gut 15 Sekunden. Dass das ganze etwas dauert, ist mir klar. Trotz alledem bin ich auf der Suche nach schnelleren Möglichkeiten.
Nun mein Anliegen an euch: Gibt es noch bessere bzw. schlauere Vorgehensweisen, die Dateien nach ihrer Existenz zu überprüfen und wenn ja, welche konkret?
Lieben Dank!
ich arbeite zurzeit an einem Linkchecker (dem ein oder anderen hier ist dies wohl bekannt), der auch prima funktioniert. Es gibt in meinem Skript drei Typen, (interne!) Links zu überprüfen:
- Bei internen IDs wird das Vorkommen via Datenbankabfrage überprüft
- Beim Vorkommen einer html-Datei wird die Datei angepingt
- Bei sonstigen Dateien (doc, pdf et cetera) verwende ich file_exists
Warum Pingen? Es handelt sich um via .htaccess generierte .html-Dateien (mod_rewite), sodass diese real nicht existieren. Gepingt wird mittels @fopen.
Allerdings bedarf dieser Vorgang bei 1.365 zu überprüfenden Links insgesamt gut 15 Sekunden. Dass das ganze etwas dauert, ist mir klar. Trotz alledem bin ich auf der Suche nach schnelleren Möglichkeiten.
Nun mein Anliegen an euch: Gibt es noch bessere bzw. schlauere Vorgehensweisen, die Dateien nach ihrer Existenz zu überprüfen und wenn ja, welche konkret?
Lieben Dank!
Kommentar