Im KONDE-Projekt, das aus Hochschulraumstrukturmitteln finanziert wird, beschäftigten sich sieben universitäre Partner und drei weitere Einrichtungen aus unterschiedlichen Blickwinkeln mit theoretischen und praktischen Aspekten der Digitalen Edition. Ein Outcome des Projektes stellt das Weißbuch dar, welches über 200 Artikel zum Thema Digitale Edition umfasst. Die behandelten Themenkomplexe reichen dabei über Digitale Editionswissenschaft im Allgemeinen, Annotation und Modellierung, Interfaces, Archivierung und Metadaten bis hin zu rechtlichen Aspekten.
Mitarbeiterinnen und Mitarbeiter: Arno Strohmeyer
(Projektleitung), Lisa Brunner, Anna Huemer, Philipp Humer, Carina Koch, Jakob
Sonnberger, Georg Vogeler, Christoph Würflinger
Institutionen: Universität Salzburg – Fachbereich
Geschichte, Universität Graz – Zentrum für Informationsmodellierung
Fördergeber: FWF (P30091-G28)
Das FWF-Projekt Die Medialität diplomatischer Kommunikation
untersucht den Informationstransfer zwischen Konstantinopel und dem Kaiserhof in
Wien anhand schriftlicher Zeugnisse diplomatischer Missionen (Briefe,
Reisebericht, Abschluss- und Geheimbericht, Instruktionen) aus der Mitte des 17.
Jahrhunderts mit digitalen Methoden. Die Quellen geben Auskunft über Probleme
interkultureller und interreligiöser Koexistenz, daraus resultierender Konflikte
und Lösungsstrategien (Meienberger 1973, Droste 2006). Sie vermitteln jedoch keine
objektiven Informationen, da sie von Diskurstraditionen,
den Interessen und der Selbstdarstellung der Akteure sowie von den Bedingungen der
Übermittlung (Postwege, Informationssicherheit) beeinflusst waren. Die Medien
hatten also Einfluss auf den Wissenstransfer zwischen den habsburgischen
Diplomaten und dem Kaiserhof und bestimmten die öffentliche Wahrnehmung des
Osmanischen Reiches (Faulstich et al. 2007). Die ausgewählten Quellen werden
deshalb aus medienwissenschaftlicher Perspektive computergestützt analysiert,
wodurch a) ein besseres Verständnis der Konstruktion des in (Mittel-)Europa
vorhandenen Wissens über die Osmanen und den Islam, das mitunter bis heute
nachwirkt, ermöglicht wird und b) umfangreiches Wissen über die Nutzung von Natural-Language-Processing (NLP) mit deutschen historischen
Texten gesammelt wird.
Ein Ergebnis des Projekts ist die Digitale Edition der Quellen mit verschiedenen
Perspektiven auf die Texte. Digitale Verfahren erzeugen eine transmediale
Darstellung von Text. Zur Transmedialität von Text s. Sahle 2016 und Sahle
2010.
Die historisch-kritische Ausgabe wird nach den TEI-P5-Richtlinien TEI-Consortium: TEI P5-Guidelines for Electronic Text
Encoding and Interchange. 2018.
http://www.tei-c.org/release/doc/tei-p5-doc/en/Guidelines.pdf. Das DTA-Basisformat (DTABf) ist das von Clarin-D und
der DFG empfohlene TEI-Format für historische Texte.
http://www.deutschestextarchiv.de/doku/basisformat. SKOS Reference W3C Recommendation 18 August 2009,
edited by Alistair Miles and Sean Bechhofer,
http://www.w3.org/TR/skos-reference. Gemeinsame Normdatei (GND)
https://www.dnb.de/DE/Standardisierung/GND/gnd_node.html, Virtual Authority
File (VIAF) http://viaf.org, GeoNames https://www.geonames.org. TEI Manuscript Description,
https://www.tei-c.org/release/doc/tei-p5-doc/en/html/MS.html#msov Das Correspondence Metadata Interchange Format wird
von der TEI Correspondence SIG entwickelt,
https://correspsearch.net/index.xql?id=participate_cmi-format&l=de. correspSearch. Search scholarly editions of letters,
https://correspsearch.net, s. Dumont 2016.Semantic Web-Technologien
herangezogen: SKOSGeoNames)msdescription
CorrespSearch
. Basierend auf der Kodierung werden die Inhalte für den
Vergleich der beiden Medientypen aufbereitet.
Ein Teil der Daten wird experimentell mit NLP-Tools verarbeitet. Dies stellt eine
besondere Herausforderung dar, da sich die Werkzeuge für historische Texte erst in
der Entwicklung befinden (Piotrowski 2012). Grundlegende Analysen können mit
N-Grammen durchgeführt werden, um wiederkehrende Textmuster zu erkennen. Mit Hilfe
von DTA-CAB https://kaskade.dwds.de/demo/cab. Das Deutsche
Textarchiv (DTA) hat mit CAB (Cascaded Analysis Broker) ein Programm für die
linguistische Analyse historischer Texte entwickelt, das historische
Schreibvarianten auf moderne Wortformen abbildet, s.
http://www.deutschestextarchiv.de/doku/software#cab.Named-Entity-Recognition
zur Identifizierung von räumlichen Informationen oder Personen und Part-of-Speech-Tagging zur Analyse der Verwendung von Stil
experimentiert. Die Ergebnisse sollen dazu beitragen, Plagiate aufzudecken oder
die Frage zu beantworten, wie Informationen vermittelt werden und welche Meinungen
(positiv, negativ, neutral), insbesondere im Zusammenhang mit der
Charakterisierung von Personen oder der Selbstdarstellung der Schreiber, geäußert
wurden. Für die Sentimentanalyse wird semiautomatisch eine Liste
stimmungstragender Ausdrücke als Sentimentlexikon herangezogen, da für den
betroffenen Zeitraum kein Sentimentlexikon existiert.