Hallo und Guten Morgen,
da ich jetzt schon einige Tage teste und zu keinem weiteren Fortschritt mehr komme, muss ich mich mal an die Experten wenden.
Ich bin gerade dabei einen Badword - Filter zu erstellen, das klappt auch soweit ganz gut, aber bei ein paar Elementen funktioniert mein preg_replace leider nicht. Ich vermute das es an der Codierung liegt bin da aber noch nicht 100% sicher.
Vielleicht erst einmal die Basics: Der Header hat folgende Codierung
Die Dateien haben auch UTF-8. Ich lese den Text aus Seiten aus mit DOM.
Dann mache ich folgendes:
Also der Badword Filter hat noch einige Keywords mehr, aber daran sollte es ja nicht liegen .
Das Problem ist, das dieser Filter leider die € Zeichen und HTML () Zeichen nicht herausfiltert.
Ich habe auch schon versucht mit utf8_decode und utf8_encode zu arbeiten, leider ohne Erfolg.
Hat vielleicht jemand einen Tipp für mich?
Danke!
da ich jetzt schon einige Tage teste und zu keinem weiteren Fortschritt mehr komme, muss ich mich mal an die Experten wenden.
Ich bin gerade dabei einen Badword - Filter zu erstellen, das klappt auch soweit ganz gut, aber bei ein paar Elementen funktioniert mein preg_replace leider nicht. Ich vermute das es an der Codierung liegt bin da aber noch nicht 100% sicher.
Vielleicht erst einmal die Basics: Der Header hat folgende Codierung
HTML-Code:
<meta http-equiv="content-type" content="text/html;charset=utf-8" />
Dann mache ich folgendes:
PHP-Code:
function get_filter($inhalt ){
$badwords = array('€','€', '€',' ', '[…]' );
$badwords_preg = implode('|', $badwords );
$inhalt = preg_replace_all("/\b(".$badwords_preg.")\b/i", '', $inhalt );
return $inhalt;
}
Das Problem ist, das dieser Filter leider die € Zeichen und HTML () Zeichen nicht herausfiltert.
Ich habe auch schon versucht mit utf8_decode und utf8_encode zu arbeiten, leider ohne Erfolg.
Hat vielleicht jemand einen Tipp für mich?
Danke!
Kommentar