Verarbeiten von 800.000 Dateien

**AmicaNoctis** · 05.07.2011, 14:20

Hallo,

ich würde das Verzeichnis einlesen und in eine Datenbank schreiben. Dort kannst du dann neben einer eindeutigen ID und dem Dateinamen (unique key) auch das Rechnungsdatum, Absender, Empfänger u. s. w. verwalten.

Die eigentliche Frage ist aber die: Sollte das WWS nicht geeignete Auswertungen mitbringen oder wenigstens eine Schnittstelle zum Zugriff darauf anbieten? Ich würde vorsichtshalber nochmal ins Handbuch des WWS gucken.

Gruß,

Amica

**mainclain** · 05.07.2011, 14:24

Warum an der Menge der Dateien?

Kannst doch einfach eine Datenbanktabelle machen, wo schon bearbeitete Datein drin stehen.
Dort speicherst du also nur den Namen + eventuell nen timestamp ab.

Diese überspringst du beim nächsten durchlauf.

Dann siehst du dir an, wieviele Datein du ungefähr in einem PHP-Script durchlauf durchbekommst. Solltest dich da ein wenig zurückhalten, wie ich finde, sodass ein durchlauf Max. 5 Sekunden dauern darf (Von Standart glaube ich 30?).

Wieviel Dateien du in einem Durchlauf schaffst, musst du mal austesten^^.
Danach läd er eine Seite, die, je nach dem z.B. über JS eine weiterleitung und einen Link hat. Nach x Sekunden läd er also die Seite neu. Diesmal werden die nächste X Datein abgearbeitet, bis das Script durch ist.

Edit: Ups hab das mit dem Cronjob überlesen. Naja aber da versteh ich ehrlich gesagt, noch weniger das Problem, da du doch eh mit Datenbank arbeitest?^^

**h3ll** · 05.07.2011, 14:42

Verarbeiten von 800.000 Dateien - PHP Forum: phpforum.de

Verarbeiten von 800.000 Dateien