HTML-Cleaner?
Einklappen
X
-
Und einfach alles zwischen <script type="text/javascript" ... > und </script> entfernen ist nicht genug ?
-
HTML-Cleaner?
Hi
Nach langer Zeit mal wieder ein Thread von mir ^^
Ich brauche eine Möglichkeit 1. HTML Code zu reparieren und 2. schädliches Zeug zu entfernen (primär also halt Javascript).
Per Google findet man leider praktisch nur Tidy was jetzt irgendwie nicht das Entfernen von JS unterstützt (zumindest hab ich nichts derartiges im Manual finden können).
Empfohlen wurde mir Privoxy, nur ist das halt schon wieder ein wenig zuviel ... das ganze soll entweder in PHP oder besser noch als cmd-Programm ablaufen (von wegen Geschwindigkeit) und eigentlich nicht gleich einen ganzen Proxy aufsetzen
striptags kommt nicht in Frage, die Funktion ist dermaßen buggy, dass es fast schon eine Schande ist.
Irgendwann irgendwo habe ich mal einen preg gesehen, der jegliche JS-Attribute+Script-Tags entfernt - das zusammen mit tidy wäre eventuell eine Lösung - aber eigentlich würde ich liebend gerne ein kommdanozeilen-basiertes Skript haben, was alles vereint und ggf. auch noch mehr Optionen z.B. hinsichtlich CSS gibt (z.B. keine globalen Befehle im CSS)
Hat da jemand vielleicht eine passende Idee zu? (Oder bin ich da echt schon zu anspruchsvoll? ^^; )
Zur Not müsste denn die preg+tidy-Lösung her... (hat jemand gerade einen derartigen Regex zur Hand? xP)Stichworte: -
Einen Kommentar schreiben: