Hi,
da ich häufiger über Handy meine Mails abrufe, nerven mich die Spams (etwa 50...100 pro Woche) doch ganz schön. Die angebotenen Spamfilter haben alle den Nachteil, dass sie entweder die Mails erst abrufen, dann filtern, oder nach Keyword/Whitelist etc unter PHP auf dem Server arbeiten.
Das beste, was ich entdecken konnte, war spambayes (bei sf.net), die aber ersteres Prinzip verfolgen. Die ganze Sache würde ich gerne auf PHP adaptieren.
Spambayes funktioniert mit einem Algorithmus, der die Wahrscheinlichkeit, dass es sich um Spam handelt, berechnet, und hat eine sehr hohe Trefferquote. Man muss ihm zuerst allerding beibringen, was Spam ist, und was nicht, und das ist für jeden User unterschiedlich. Mein Ansatz wäre, die "guten" Mails (Ham) an ein Konto (zB ham@myserver.de), die "bösen" (Spam) an ein anderes (zB spam@myserver.de) weiterzuleiten (manuell vom Mailclient, sog. Trainingsphase), diese Konten über ein Script zu pollen, und dann nach Abschluss des Trainings (ca. 100 Mails später...) einen CRON-Job für das eigentliche, private Mailkonto zu starten, der die Spammails aufgrund der "erlernten" Kriterien direkt schon auf dem Server löscht, bzw zur Sicherheit zB in einen Folder als txt verschiebt.
So schön, so gut. Mails pollen schaffe ich noch. Löschen ebenfalls. Nur das "Drumrum", nämlich der eigentliche Vorgang von spambayes, ist mir leider völlig schleierhaft. Ich konnte im Source keinen direkten Hinweis auf den Algorithmus entdecken, bin aber in Python auch keine Leuchte.
Hat jemand eine zündende Idee???
Viele Grüsse an alle Spamgequälten,
Jörg
da ich häufiger über Handy meine Mails abrufe, nerven mich die Spams (etwa 50...100 pro Woche) doch ganz schön. Die angebotenen Spamfilter haben alle den Nachteil, dass sie entweder die Mails erst abrufen, dann filtern, oder nach Keyword/Whitelist etc unter PHP auf dem Server arbeiten.
Das beste, was ich entdecken konnte, war spambayes (bei sf.net), die aber ersteres Prinzip verfolgen. Die ganze Sache würde ich gerne auf PHP adaptieren.
Spambayes funktioniert mit einem Algorithmus, der die Wahrscheinlichkeit, dass es sich um Spam handelt, berechnet, und hat eine sehr hohe Trefferquote. Man muss ihm zuerst allerding beibringen, was Spam ist, und was nicht, und das ist für jeden User unterschiedlich. Mein Ansatz wäre, die "guten" Mails (Ham) an ein Konto (zB ham@myserver.de), die "bösen" (Spam) an ein anderes (zB spam@myserver.de) weiterzuleiten (manuell vom Mailclient, sog. Trainingsphase), diese Konten über ein Script zu pollen, und dann nach Abschluss des Trainings (ca. 100 Mails später...) einen CRON-Job für das eigentliche, private Mailkonto zu starten, der die Spammails aufgrund der "erlernten" Kriterien direkt schon auf dem Server löscht, bzw zur Sicherheit zB in einen Folder als txt verschiebt.
So schön, so gut. Mails pollen schaffe ich noch. Löschen ebenfalls. Nur das "Drumrum", nämlich der eigentliche Vorgang von spambayes, ist mir leider völlig schleierhaft. Ich konnte im Source keinen direkten Hinweis auf den Algorithmus entdecken, bin aber in Python auch keine Leuchte.
Hat jemand eine zündende Idee???
Viele Grüsse an alle Spamgequälten,
Jörg
Kommentar