Hallo zusammen
ich habe mir eine Suche für die HP gebastelt. Funzt alles wunderbar. Damit ich den Parser nicht mit jeder Suchanfrage belästigen muss, habe ich ein Script welches mir per CronJob um Mitternacht alle Seiten abfrage und den html Output in Folder suche speichert. Soweit so gut
Nun machte ich es bis anhin so, dass ich die eingelesenen Files strip_tage, damit man nicht nach dem HTML Code suchen kann.
In den Reultaten habe ich einen Link um die Treffer auf der Seite anzuzeigen.
Jetzt wollte ich, damit HTML Formatierungen erhalten bleiben, gewisse Tags drin lassen (<br>,<h1-h6>,<img>,<input>,<form> und <div>).
Das Problem ist nun, dass ich leider keinen Plan habe, wie ich meinem RegExp beibringen könnte, dass er Suchtreffer, die zwischen < und > stehen, ignoriert werden.
Kann man diesem RegExp irgendwie beibringen, dass er Treffer zwischen spitzen Klammern nicht beachten soll ?
Ich hoffe es hat jemand eine Idee wie ich das umsetzen könnte.
Danke und Gruss
tobi
ich habe mir eine Suche für die HP gebastelt. Funzt alles wunderbar. Damit ich den Parser nicht mit jeder Suchanfrage belästigen muss, habe ich ein Script welches mir per CronJob um Mitternacht alle Seiten abfrage und den html Output in Folder suche speichert. Soweit so gut
Nun machte ich es bis anhin so, dass ich die eingelesenen Files strip_tage, damit man nicht nach dem HTML Code suchen kann.
In den Reultaten habe ich einen Link um die Treffer auf der Seite anzuzeigen.
Jetzt wollte ich, damit HTML Formatierungen erhalten bleiben, gewisse Tags drin lassen (<br>,<h1-h6>,<img>,<input>,<form> und <div>).
Das Problem ist nun, dass ich leider keinen Plan habe, wie ich meinem RegExp beibringen könnte, dass er Suchtreffer, die zwischen < und > stehen, ignoriert werden.
PHP-Code:
preg_replace("/$suchbegriff/i",'<span style="background-color:yellow;">\\\\0</span>',$string);
Ich hoffe es hat jemand eine Idee wie ich das umsetzen könnte.
Danke und Gruss
tobi
Kommentar