KONDE - Kompetenznetzwerk Digitale Edition

Weißbuch

PAGE-XML TEI Download PDF Download

Klug, Helmut W.; helmut.klug@uni-graz.at

Die PAGE-XML-Formate werden verwendet, um den Seiteninhalt von Quellendokumenten, die als Bilddigitalisate vorliegen, zu beschreiben und über Bildkoordinaten in den Digitalisaten zu verorten. Die Daten umfassen Layout, Textinhalt und mögliche Informationen zu Bildbearbeitung (dewarping, deskewing) sowie Ground-Truth-Daten, die eine Beurteilung der Ergebnisse von automatisierten Erkennungsroutinen zulassen, bei denen PAGE-XML gerne als Output verwendet wird.

Literatur:

  • Pletschacher, S; Antonacopoulos, A. 2010. The PAGE (Page Analysis and Ground-truth Elements) Format Framework. In: Proceedings of the 20th International Conference on Pattern Recognition (ICPR2010), Istanbul, Turkey, August 23‐26, 2010, S. 257‐260.

Zitiervorschlag:

Klug, Helmut W. 2021. PAGE-XML. In: KONDE Weißbuch. Hrsg. v. Helmut W. Klug unter Mitarbeit von Selina Galka und Elisabeth Steiner im HRSM Projekt "Kompetenznetzwerk Digitale Edition". Aufgerufen am: . Handle: hdl.handle.net/11471/562.50.154. PID: o:konde.154