Klassifikation von Texten nach Genre

Diese Arbeit stellt ein System zur automatischen Erkennung des Genres eines Textes vor. In einem ersten Schritt wurde eine neue Genre-Hierarchie erstellt und die Besonderheiten der einzelnen Klassen untersucht. Davon ausgehend wurde für jedes Genre ein eigener Erkenner geschrieben. Zur Kombination der Einzelklassifikatoren wurden verschiedene Verfahren entwickelt und evaluiert. Abschließ wurden die Ergebnisse mit automatischen Methoden aus dem Knowledge Discovery verglichen.

Die Evaluation ergibt, dass das von mir entwickelte Verfahren, bei dem für jedes Genre anhand seiner spezifischen Merkmale ein Klassifikator erstellt wird, die besten Ergebnisse liefert. Die durchschnittlichen Werte für Recall und Precision liegen bei knapp 60% und 75%, wobei es jedoch starke Unterschiede zwischen den einzelnen Genres gibt.

Download PDF (1,6 MB)