Inhalte vom automatischen Verlinken ausschliessen

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • Inhalte vom automatischen Verlinken ausschliessen

    Hallo, ich bin php-Neuling. Ich habe ein Script zum automatischen Verlinken von Keyword. Jedoch habe ich das Problem wenn Bilder <img...> </img> oder Überschriften <h1>...</h1> enthalten sind wird auch hier nach dem Keyword gesucht. Das will ich unterbinden. Das Script soll nur im reinen Text durchsuchen und dann das Keyword verlinken.

    So sieht das Script aus.

    Code:
        /**
         * Durchsucht den Context nach Keyword-Paaren
         */
        public function Parse($Content) {
            $Options = GetOption('KeywordLinker');
            
            if (is_array($Options)){
                extract($Options);
            }
            
            if (!is_array($Pairs)) {
                return $Content;
            }
            
            if (is_array($this->SpecialChars)){
                foreach ($this->SpecialChars as $Char => $Code){
                    $Content = str_replace($Code, $Char, $Content);
                }
            }
            
            $usedUrls = array();
            $currentUrl = 'http://'.$_SERVER['HTTP_HOST'].$_SERVER['REQUEST_URI'];
            
            // Jetzt machen wir die eigentliche Arbeit
            foreach ($Pairs as $Keyword => $Url) {
                
                // Auf die gleiche Url nur 1x verlinken
                if (in_array($Url, $usedUrls)) { 
                    continue;
                }
                
                // Wir haben die Url bereits eingefügt oder der
                // Autor hat sie bereits im Text genutzt
                if (strpos($Content, $Url)) {
                    $usedUrls[] = $Url;
                    continue;
                }
                
                // Wir verlinken nicht auf uns selbst
                if ($Url == $currentUrl) { 
                    $usedUrls[] = $Url;
                    continue;
                }
                
                // Als erstes schauen wir, ob das "target" Attribut gesetzt wurde
                if (false !== strpos($Url, ' ')) {    
                    $Target = trim(substr($Url, strpos($Url, ' ')));
                    $Target = ' target="'.$Target.'"';
                    $Url     = substr($Url, 0, strpos($Url, ' '));
                
                } else {
                    $Target = '';
                }
                
                // Jetzt escapten wir jedes '&' in the URL.
                $Url = str_replace('&amp;', '&', $Url);
                $Url = str_replace('&', '&amp;', $Url);
                
                // Natürlich möchten wir keine Keywords verlinken, die bereits verlinkt worden sind
                // und daher müssen wir diese erstmal filtern und kennzeichnen
                $Content = preg_replace('|(<a[^>]+>)(.*)('.$Keyword.')(.*)(</a[^>]*>)|Ui', '$1$2&&&$3$4$5', $Content);
                $Content = preg_replace('|(<[^>]*)('.$Keyword.')(.*>)|Ui', '$1&&&$2$3', $Content);
                
                if (KEYWORD_LINKER_USE_TITLES) {
                    $Title = ' title="'.$Keyword.'"';
                }
                
                // Zum Schluß noch die Keywords ersetzen
                $Content = preg_replace('|(?<=[\s>;"\'/])('.$Keyword.')(?=[\s<&.,!\'";:\-/])|i', '<a href="'.$Url.'" class="keywordlinker"'.$Target.$Title.'>$1</a>', $Content, 1);
                
                // Die zuvor markierten Links wieder zurücksetzen
                $Content = str_replace('&&&', '', $Content);
            }
    
            return $Content;
        }
    Kann mir jemand dabei helfen?

  • #2
    preg_replace() eignet sich nicht zur Verarbeitung von HTML-Code. Verwende einen HTML-Parser wie zB. DOMDocument dafür.

    Kommentar


    • #3
      Ich habe das Script nicht geschrieben. Es ist so in einer Anwendung integriert. Daher weis ich nicht in wie weit Änderungen möglich sind ohne das es zu Problemen kommt. Ich würde das Script gern nur erweitern mit der Funktion, das bestimmt Elemente nicht bei der Keyword-Linkerstellung berücktsichtig werden.

      Kann mir jemand diese Funktion zur Verfügung stellen oder helfen diese zu erstellen. Ich bin kein PHP-Programmierer.

      Kommentar


      • #4
        Wie gesagt, preg_replace() eignet sich nicht dafür. Wenn, dann ist das nur sehr umständlich möglich und deckt dann immer noch nicht viele Sonderfälle ab. Also eine Bastellösung, die auf einer Bastellösung basiert, die auf einer Bastellösung basiert. Ich wüsste nicht, warum man seine Zeit für eine Lösung verschwenden sollte, die sowieso nicht vernünftig funktioniert und früher oder später ersetzt werden muss.

        Kommentar


        • #5
          Wenn man dein Anliegen ...
          Zitat von shi Beitrag anzeigen
          Kann mir jemand diese Funktion zur Verfügung stellen oder helfen diese zu erstellen. Ich bin kein PHP-Programmierer.
          ... als Auto-Metapher formuliert, wird es dir vielleicht etwas deutlicher, worin das Problem besteht:

          Kann mir bitte jemand (kostenlos) die Bremsbeläge meines Autos wechseln oder helfen, diese zu wechseln? Ich bin kein Kfz-Mechatroniker und möchte unpassendes Werkzeug verwenden.
          Zitat von shi Beitrag anzeigen
          Ich habe das Script nicht geschrieben. Es ist so in einer Anwendung integriert. Daher weis ich nicht in wie weit Änderungen möglich sind ohne das es zu Problemen kommt.
          Der Ersteller des Scripts sollte das wissen und können.

          Ich würde das Script gern nur erweitern mit der Funktion, das bestimmt Elemente nicht bei der Keyword-Linkerstellung berücktsichtig werden.
          Das ist schon klar geworden. Aber wenn man in einem HTML-Dokument Änderungen vornehmen möchte, ohne dessen syntaktischen Aufbau zu beschädigen, braucht man dazu einen HTML-Parser zum zerlegen und einen HTML-Generator zum wieder zusammensetzen. Beides ist in den XML|DOM-Libraries, auf die man von PHP aus zugreifen kann, enthalten.

          Natürlich könnte man prinzipiell so etwas auch mit preg_replace_callback() bauen. Aber wozu das Rad neu erfinden? Nur mit preg_replace() allein geht das sowieso nicht, weil HTML-Elemente ineinander verschachtelt sein können. Sowas kannst du mit PCRE zwar durchsuchen, aber nicht vernünftig bearbeiten.

          Hallo, ich bin php-Neuling. Ich habe ein Script zum automatischen Verlinken von Keyword. Jedoch habe ich das Problem wenn Bilder <img...> </img> oder Überschriften <h1>...</h1> enthalten sind wird auch hier nach dem Keyword gesucht. Das will ich unterbinden. Das Script soll nur im reinen Text durchsuchen und dann das Keyword verlinken.
          In HTML enthalten <img>-Elemente keinen CDATA-Text zwischen den "Tags", weil sie per Definiton Single-Elemente sind. Wenn dein Keyword-Script da Texte markiert, sind das bestenfalls die in den Attributen des <img>-Elements. Dann taugt dieser "Parser" schon jetzt nicht viel.

          Ich habe gerade wenig Lust, den Quellcode genauer zu analysieren. Was trotzdem auffällt, sind Hin- und Her-Ersetzungen mit Platzhaltern. Die sind immer ein schlechtes Zeichen. Ebenso die Verwendung von str_replace(). Die Variable $pairs, die vermutlich die Keyword-Liste enthält, wird per extract() generiert. Es werden weder htmlspecialchars() noch urlencode() aufgerufen. ... Außerdem ersetzt die Funktion Parse() nur das erste Auftreten eines Schlüsselworts und auch nur dann, wenn die Ziel-URL nicht der des aufgerufenen Scripts entspricht. Letzteres könnte man schon beim Zusammenstellen des Keyword-URL-Arrays berücksichtigen. ...
          Zuletzt geändert von fireweasel; 19.05.2015, 21:53.
          Klingon function calls do not have “parameters”‒they have “arguments”‒and they always win them!

          Kommentar

          Lädt...
          X