hallo zusammen,
bin ein absoluter frischling und hab ein großes problem.
mein projekt: ich möchte anhand eines php-scripts teile aus dem quelltext verschiedener html-seiten auslesen. genauer erklärt: ich habe auf dem server verschiede ordner, die regelmäßig mit nach dem timestamp benannten dateien gefüllt werden.
diese ordner möchte ich nach html-dateien (es liegen auch pdf´s drin)durchsuchen. aus den gefundenen html´s möchte ich die <titel>-tags und einige <meta>-tags herausfiltern und in einer separaten tabelle, sortiert nach timestamp (dateiname) ausgeben.
bisher habe ich bereits den aufruf der einzelnen ordner und die selektion der jeweiligen html-dokumente realisier.
mein problem besteht jetzt darin, wie kann ich aus den einzelnen gefundenen html´s die benötigten textelemente herausfiltern und wie kann ich diese in einer gemeinsamen tabelle ausgeben?
danke im voraus
peter
bin ein absoluter frischling und hab ein großes problem.
mein projekt: ich möchte anhand eines php-scripts teile aus dem quelltext verschiedener html-seiten auslesen. genauer erklärt: ich habe auf dem server verschiede ordner, die regelmäßig mit nach dem timestamp benannten dateien gefüllt werden.
diese ordner möchte ich nach html-dateien (es liegen auch pdf´s drin)durchsuchen. aus den gefundenen html´s möchte ich die <titel>-tags und einige <meta>-tags herausfiltern und in einer separaten tabelle, sortiert nach timestamp (dateiname) ausgeben.
bisher habe ich bereits den aufruf der einzelnen ordner und die selektion der jeweiligen html-dokumente realisier.
mein problem besteht jetzt darin, wie kann ich aus den einzelnen gefundenen html´s die benötigten textelemente herausfiltern und wie kann ich diese in einer gemeinsamen tabelle ausgeben?
danke im voraus
peter
Kommentar