Der Korpus ist aufgeteilt in Trainings- und Testtexte. Für jedes Genre gibt es jeweils 20 HTML-Dateien und deren getaggte Versionen.
Der Korpus ist aufgeteilt in Trainings- und Testtexte. Für jedes Genre gibt es jeweils 20 HTML-Dateien und deren getaggte Versionen.