
<TEI xmlns="http://www.tei-c.org/ns/1.0" xmlns:h="http://www.w3.org/1999/xhtml" xmlns:t="http://www.tei-c.org/ns/1.0" xml:lang="de">
  <teiHeader xml:lang="de">
    <fileDesc>
      <titleStmt>
        <title type="main">Zweisprachiger Spracherwerb: Longitudinalstudie anhand schriftlicher
               Texte der Hermagoras-Volksschule: Digitalisierung, Auszeichnung, Auswertung</title>
        <author>
          <persName>
            <forename>Ursula</forename>
            <surname>Doleschal</surname>
          </persName>
        </author>
        <author>
          <persName>
            <forename>Lisa</forename>
            <surname>Rieger</surname>
          </persName>
        </author>
        <respStmt>
          <resp>Projektleitung</resp>
          <persName>
            <forename>Helmut W.</forename>
            <surname>Klug</surname>
          </persName>
        </respStmt>
        <respStmt>
          <resp>Datenmodellierung</resp>
          <persName>
            <forename>Selina</forename>
            <surname>Galka</surname>
          </persName>
        </respStmt>
        <respStmt>
          <resp>Datenmodellierung</resp>
          <persName>
            <forename>Elisabeth</forename>
            <surname>Steiner</surname>
          </persName>
        </respStmt>
        <funder>Bundesministerium für Wissenschaft, Forschung und Wirtschaft
                    </funder>
      </titleStmt>
      <publicationStmt>
        <publisher>
          <orgName corresp="https://informationsmodellierung.uni-graz.at" ref="http://d-nb.info/gnd/1137284463">Zentrum für
                        Informationsmodellierung - Austrian Centre for Digital Humanities,
                        Karl-Franzens-Universität Graz</orgName>
          <country>Austria</country>
        </publisher>
        <authority>
          <orgName corresp="https://informationsmodellierung.uni-graz.at" ref="http://d-nb.info/gnd/1137284463">Zentrum für
                        Informationsmodellierung - Austrian Centre for Digital Humanities,
                        Karl-Franzens-Universität Graz</orgName>
          <country>Austria</country>
        </authority>
        <distributor>
          <orgName ref="https://gams.uni-graz.at">GAMS - Geisteswissenschaftliches
                        Asset Management System</orgName>
        </distributor>
        <availability>
          <licence target="https://creativecommons.org/licenses/by/4.0">Creative Commons
                            BY 4.0</licence>
        </availability>
        <date when="2021">2021</date>
        <pubPlace>Graz</pubPlace>
        <idno type="PID">o:konde.p17</idno>
      </publicationStmt>
      <seriesStmt>
        <title ref="http://gams.uni-graz.at/konde">KONDE Weißbuch</title>
        <respStmt>
          <resp>Projektleitung</resp>
          <persName>
            <forename>Helmut W.</forename>
            <surname>Klug</surname>
          </persName>
        </respStmt>
      </seriesStmt>
      <sourceDesc>
        <bibl>
          <title>Projektbeschreibung: Zweisprachiger Spracherwerb: Longitudinalstudie anhand schriftlicher
               Texte der Hermagoras-Volksschule: Digitalisierung, Auszeichnung, Auswertung</title>
          <author>Ursula Doleschal</author>
          <author>Lisa Rieger</author>
          <publisher>Herausgegeben von Helmut W. Klug unter Mitarbeit von Selina Galka und Elisabeth Steiner</publisher>
          <date>2021</date>
          <country>Austria</country>
        </bibl>
      </sourceDesc>
    </fileDesc>
    <encodingDesc>
      <projectDesc>
        <ab>
          <ref target="info:fedora/context:konde" type="context">KONDE Weißbuch</ref>
        </ab>
        <p>Im KONDE-Projekt, das aus Hochschulraumstrukturmitteln finanziert wird,
                        beschäftigten sich sieben universitäre Partner und drei weitere
                        Einrichtungen aus unterschiedlichen Blickwinkeln mit theoretischen und
                        praktischen Aspekten der Digitalen Edition. Ein Outcome des Projektes
                        stellt das Weißbuch dar, welches über 200 Artikel zum Thema Digitale
                        Edition umfasst. Die behandelten Themenkomplexe reichen dabei über
                        Digitale Editionswissenschaft im Allgemeinen, Annotation und
                        Modellierung, Interfaces, Archivierung und Metadaten bis hin zu
                        rechtlichen Aspekten.</p>
      </projectDesc>
    </encodingDesc>
    <profileDesc>
      <langUsage>
        <language ident="de">Deutsch</language>
      </langUsage>
    </profileDesc>
  </teiHeader>
  <text>
    <body>
      <div>
        <head>Zweisprachiger Spracherwerb: Longitudinalstudie anhand schriftlicher Texte der
               Hermagoras-Volksschule: Digitalisierung, Auszeichnung, Auswertung </head>
        <div>
          <head>Ursula Doleschal, Lisa Rieger</head>
          <div type="info">
            <p>
              <hi rend="bold">Mitarbeiterinnen:</hi> Ursula Doleschal (Projektleitung), Lisa
                     Rieger</p>
            <p>
              <hi rend="bold">Institutionen:</hi> Universität Klagenfurt, Institut für
                     Slawistik</p>
            <p>
              <hi rend="bold">Fördergeber:</hi> Fakultät für Kulturwissenschaften der
                     Alpen-Adria-Universität Klagenfurt</p>
            <p>
              <hi rend="bold">Website:</hi>
              <ref target="https://campus.aau.at/cris/project/0f4de0c9610ea75c01611937ce72037f" type="external">https://campus.aau.at/cris/project/0f4de0c9610ea75c01611937ce72037f</ref>
            </p>
          </div>
        </div>
        <div type="text">

          <p>Dieses Projekt hat zum Ziel, mit Methoden der Digital Humanities den Fortschritt
                  in Sprach- und Textkompetenz von Schülerinnen und Schülern der zweisprachigen <hi rend="italic">Mohorjeva ljudska šola/Hermagoras Volksschule</hi> in Klagenfurt
                  (mit dualem deutsch-slowenischem Immersionsunterricht) auf Basis der von diesen
                  verfassten, authentischen Texten zu analysieren. Dafür wurde von 2015 bis 2018
                  eine Klasse von der zweiten bis zur vierten Schulstufe begleitet. In diesem
                  Zeitraum wurden 234 Texte von 11 Schülerinnen und Schülern, zusammengefasst in 24
                  Textsammlungen, digitalisiert, transkribiert, ausgezeichnet und mit einem
                     Auswertungsprogramm<note n="1" place="foot" xml:id="ftn1">
              <p rend="footnote text"> Das Auswertungsprogramm wurde nach gemeinsamer
                        Absprache von der Computerlinguistin am Institut für Germanistik der AAU
                        Klagenfurt, Elisabeth Eder, MA, speziell für den Zweck des Projekts
                        erstellt.</p>
            </note> hinsichtlich quantitativer Parameter analysiert. Nach der
                  Gesamtauswertung folgte eine Auswertung nach Erstsprache(n).</p>
          <p>Die Transkription erfolgte manuell in <hi rend="italic">Transkribus</hi>. Dabei
                  wurde nur das, was von den Schülerinnen und Schülern selbst verfasst wurde, im
                  vorliegenden Wortlaut transkribiert. Durch die Fotokopien ergaben sich folgende
                  Probleme:</p>
          <list>
            <item>An den Seiten abgeschnittene Wörter: Diese wurden nur so weit transkribiert,
                     wie die Buchstaben noch eindeutig erkennbar waren, ansonsten wurde mit dem
                     POS-Tag „gap“ auf die Unvollständigkeit hingewiesen. </item>
            <item>Schwer leserliche und schlecht erkennbare Wörter: Diese wurden so gut wie
                     möglich rekonstruiert, um das Wort im Weiteren lemmatisieren zu können. </item>
            <item>Abgeschnittene oder unleserliche längere Textpassagen: Diese führten dazu,
                     dass der Text aus der Analyse ausgeschieden wurde. </item>
          </list>
          <p>Die slowenischen Texte wurden mit dem morphosyntatkischen Tagger <hi rend="italic">Obeliks </hi>(Romih, Krek, und Kosem, n.d.), die deutschen mit <hi rend="italic">WebLicht</hi> (CLARIN-D, 2017a) ausgezeichnet. Die Zuordnung der
                  Kategorien und Eigenschaften erfolgt bei<hi rend="italic"> Obeliks</hi> anhand der
                  Ergebnisse aus dem Projekt <hi rend="italic">Jezikoslovno označevanje slovenščine
                     (JOS)</hi> (Inštitut Jožef Stefan, n.d.)<hi rend="italic">,</hi> in <hi rend="italic">WebLicht</hi> basiert sie auf dem <hi rend="italic">Stuttgart-Tübingen Tagset</hi> (Schiller et al. 1999). Beim Vergleich der
                  Guidelines (Erjavec et al. 2010) wurde beschlossen, aufgrund folgender Phänomene
                  von einem direkten Vergleich zwischen den beiden Sprachen abzusehen:</p>
          <list>
            <item>Kategorien, welche nur in einer der beiden Sprachen vorhanden sind,</item>
            <item>unterschiedliche Zuordnungen zu den jeweiligen Kategorien und</item>
            <item>unterschiedlicher Umfang bei der Auszeichnung morphologischer und
                     syntaktischer Eigenschaften.</item>
          </list>
          <p>Trotz der statistisch niedrigen Fehlerquote war es notwendig, die
                  Auszeichnungsergebnisse in folgenden Fällen manuell zu berichtigen:</p>
          <list>
            <item>abgeschnittene und unleserliche Wörter </item>
            <item>Rechtschreibfehler</item>
            <item>abgeteilte Wörter</item>
          </list>
          <p>Das Auswertungsprogramm errechnete aus den XML-Dateien für jede Textsammlung,
                  aufgeteilt nach Schülerin bzw. Schüler, folgende Parameter: durchschnittliche
                  Satzanzahl und Satzlänge, durchschnittliche Wortanzahl sowie die durchschnittliche
                  Anzahl von Verben und Konjunktionen. Nach einer Gesamtauswertung wurden die
                  Ergebnisse nach den Erstsprachengruppen Deutsch, Slowenisch, Deutsch und
                  Slowenisch sowie Slowenisch und BKS-Sprachen zusammengefasst. Die Entwicklung der
                  slowenischen und deutschen Texte wurde zuerst getrennt betrachtet, bevor die prozentuellen Veränderungen einander
                  gegenübergestellt wurden. Totale Zahlen wurden nicht berücksichtigt, um einen
                  Vergleich erschwerende Faktoren, wie unterschiedliche Sprachstruktur und
                  Auszeichnungsstandards, möglichst zu minimieren.</p>
          <p>Durch die quantitative computergestützte Analyse konnten objektive Daten für die
                  Beurteilung der Sprachkompetenz der Schülerinnen und Schüler gewonnen werden.
                  Allerdings stellte sich auch heraus, dass die Zahlen Spielraum für
                  Interpretationen lassen und somit in Zukunft nicht als alleiniges Mittel zur
                  Beurteilung von Sprachkompetenz eingesetzt werden sollten, sondern vielmehr als
                  objektive Ergänzung zu einer qualitativen Analyse. Aus technischer Sicht wäre es
                  für die weitere Forschung wünschenswert, durch interdisziplinäre Zusammenarbeit,
                  ausgehend von den aufgezeigten Problemen einen einheitlichen Leitfaden für die
                  Digitalisierung und Auszeichnung von Texten zu erarbeiten und somit einen
                  Vergleich zwischen ähnlich gelagerten Projekten zu ermöglichen.</p>
        </div>
        <div type="literature">
          <listBibl>
            <bibl>CLARIN-D. 2017a. „WebLicht. Main Page“.
                     <ref target="https://weblicht.sfs.uni-tuebingen.de/weblichtwiki/index.php/Main_Page" type="external">https://weblicht.sfs.uni-tuebingen.de/weblichtwiki/index.php/Main_Page</ref>.</bibl>
            <bibl>CLARIN-D. 2017b. „WebLicht. Tools in Detail“.
                     <ref target="https://weblicht.sfs.uni-tuebingen.de/weblichtwiki/index.php/Tools_in_Detail" type="external">https://weblicht.sfs.uni-tuebingen.de/weblichtwiki/index.php/Tools_in_Detail</ref>.</bibl>

            <bibl>Erjavec, Tomaž, Simon Krek, Špela Arhar, Darja Fišer, Nina Ledinek, Amanda
                     Saksida, Breda Sivec, Blaž Trebar. 2010. „Oblikoskladenjske specifikacije JOS.“
                     <ref target="http://nl.ijs.si/jos/msd/html-sl/josMSD-sl.html" type="external">http://nl.ijs.si/jos/msd/html-sl/josMSD-sl.html</ref>.</bibl>

            <bibl>Institut Jožef Stefan. n. d. „Projekt JOS: jezikoslovno označevanje
                     slovenskega jezika“. Zugriff: 05.04.2019.
                     <ref target="http://nl.ijs.si/jos/index-sl.html" type="external">http://nl.ijs.si/jos/index-sl.html</ref>.</bibl>

            <bibl>Romih, Miro, Simon Krek, Iztok Kosem. n. d. „Sporazumevanje v slovenskem
                     jeziku. Označevalnik“. Zugriff: 05.04.2019.
                     <ref target="http://www.slovenscina.eu/tehnologije/oznacevalnik" type="external">http://www.slovenscina.eu/tehnologije/oznacevalnik</ref>.</bibl>

            <bibl>Schiller, Anne, Simone Teufel, Christine Stöckert, Christine Thielen. 1999.
                     „Guidelines für das Tagging deutscher Textcorpora mit STTS (Kleines und großes
                     Tagset)“. <ref target="http://www.sfs.uni-tuebingen.de/resources/stts-1999.pdf" type="external">http://www.sfs.uni-tuebingen.de/resources/stts-1999.pdf</ref>.</bibl>
          </listBibl>
        </div>
      </div>
    </body>
  </text>
</TEI>
