(Silbentrennung) Fehlerquote bei bestimmter Textmenge

cargol

Newbie

Dabei seit: 16.03.2006

Beiträge: 16
- Teilen
- Tweet
#1

(Silbentrennung) Fehlerquote bei bestimmter Textmenge

08.04.2006, 18:30

Hallo,

ich weiß nicht, ob dieser Beitrag hier richtig ist, aber ich poste einfach mal

Ich habe eine Anwendung zur Silbentrennung. Natürlich kommt es dem Anwender darauf an, welche Fehlerquote diese Anwendung beinhaltet. Fehler bzw. unbekannte Wörter sind ja bekanntlich nicht zu vermeiden.

Ich habe nun eine Menge tests vorgenommen und geschaut, wieviele falsche Wörter er in einem Text findet, welcher Art diese sind und wieviele er von den unbekannten Wörtern richtig trennt.

Hier ein Beispiel:

Auf der folgenden Seite ist ein Text:

http://www.bautz.de/bbkl/p/petersen_pe.shtml

Diesen habe ich bis [...] Rolle der Eltern im Schulleben. geprüft.

Dieser Text besteht aus 5236 Wörtern / Fragmenten (und Zahlenkombinationen).

Für meine Datenbank sind insgesamt 462 Wörter erstmal unbekannt.
Nach der algorhytmischen Trennung sind es immerhin noch 90 Wörter, die nicht getrennt werden können.

Darunter befinden sich z.B. Namen:

Catharine, Wundt, Herzog-Friedrich-Stiftung, Lehmann, Dilthey-Schülers,
Marlo, Wundts, Eucken, Brütt usw.

Aber natürlich auch noch andere Fachspezifische Wörter die entweder nur zum Teil, oder gar nicht getrennt werden können.

In welcher Höhe würdet ihr, ausgehend von der angegebenen Anzahl von 5236 Wörtern, die Fehlerquote für "OK" halten?

Viele Grüße
Stichworte: -