XSLT: doppelte Einträge entfernen

Einklappen
X
 
  • Filter
  • Zeit
  • Anzeigen
Alles löschen
neue Beiträge

  • XSLT: doppelte Einträge entfernen

    Hallo Forum,

    weiß jemand, ob man mit XSL-Funktionen oder über ein workaround folgendes Problem in den Griff bekommt:

    Es soll am Ende eines Dokuments ein Sachregister erstellt werden. Eigentlich soll es über FOP gemacht werden, aber dort ist es derzeit noch nicht möglich, doppelte Einträge und doppelte Seitennummern zu unterdrücken. Deshalb möchte ich diese doppelten Einträge mit XSL rausflitern:

    (kw steht für keyword)

    Code:
    <DOC>
    text bla und blub
    text <kw>blau</kw> text
    weiterer Text <kw>rot</kw> Wiese Kuh und muh
    text <kw>blau></kw> schluss mit text
    </DOC>
    
    ...
    
    <xsl:for-each select="//DOC//kw">
    <xsl:sort select="." />
    
      <!-- hier sollte nun die doppelten Begriffe gefiltert werden -->
    
    <fo:block>
      
      <xsl:value-of select="." />
      <fo:page-number-citation ref-id="{generate-id()}" />
    
    <!--  <xsl:text>, </xsl:text> -->
    
    </fo:block>
    
    </xsl:for-each>

    Ich habe keine Idee, wie man an soetwas rangeht. Ich habe nur mal gehört, daß man auch in XSLT Variablen mit Werten füllen kann. Vielleicht ist das ein Ansatz, daß man bei jedem Durchgang den aktuellen Elementinhalt mit dem vorhergehenden vergleicht. Sortiert sind die Inhalte ja schon.

    Ein sich anschließendes Problem wäre dann, wie man noch die doppelten Seitenzahlen verhindert.

    Vielen Dank!

  • #2
    Ich bin mir nicht ganz sicher, ob mein Vorschlag funktioniert, aber probier mal das hier aus (du brauchst nicht mal Variablen):
    Pass das @select in deinem xsl:for-each an, sodass es so aussieht:
    Code:
    //kw[preceding-sibling::kw = . or following-sibling::kw = .]
    Beachte, dass ich das //DOC entfernt habe. Der war nicht notwendig, es sei denn die DOC-Elemente können ebenfalls verschachtelt sein. Außerdem setzt der Ausdruck vorraus, dass innerhalb von kw-Elementen nicht noch ein kw-Element vorkommt (was ja auch nicht wirklich Sinn macht).
    Nachteil: Das ganze wird wohl nicht sonderlich schnell sein.

    Edit: Mehr Informationen zu Axes
    Zuletzt geändert von Nezzar; 22.03.2006, 16:04.
    "Ach was soll's? Dann bau ich mir halt meinen eigenen Vergnügungspark mit Blackjack und Nutten." - Bender

    Kommentar


    • #3
      Hallo Nezzar,

      Dein Code funktionierte nicht, gab mir aber den richtigen Anstoß. (Ich sollte mich wohl doch mal mit de XPath-Achsen beschäftigen) Bei Deinem Code blieben nur die doppelten Einträge (und diese auch wirklich doppelt) übrig. Das Problem war, daß die doppelten Einträge in der XML Datei nicht hintereinander standen und deshalb die Ident-Prüfung auf Vorgänger oder Nachfolger dann fehlschlug, wenn zwischendurch ein Element mit anderem Inhalt kam. Die SORT-Anweisung kommt ja erst nach der Ident-Prüfung. Hier kommt das funktionierende Ergebnis:

      Code:
      <xsl:for-each select="//DOC//kw">
      <xsl:sort select="." />
      <xsl:if test="not(preceding-sibling::kw = .)">
        <xsl:value-of select="." />
      </xsl:if>
      </xsl:for-each>
      Weißt Du eigentlich den Vergleichoperator in XSL für "ungleich"? "!=" funktionierte nicht und deshalb mußte ich auf "not" zurückgreifen.

      Vielen Dank.

      Kommentar


      • #4
        Ach ja, stimmt. Dummer Denkfehler meinerseits. Naja, ich bin nicht ganz so groß im "blinden" Schreiben von Code

        "Ach was soll's? Dann bau ich mir halt meinen eigenen Vergnügungspark mit Blackjack und Nutten." - Bender

        Kommentar

        Lädt...
        X