KONDE - Kompetenznetzwerk Digitale Edition

Weißbuch

Named Entity Recognition (NER) TEI Download PDF Download

Eder, Elisabeth; elisabeth.eder@aau.at

Named Entity Recognition (NER) bezeichnet die Erkennung von Eigennamen (named entities) in Texten sowie auch deren Klassifizierung in verschiedene Entitätstypen. In den meisten Fällen wird Named Entity Recognition als Sequence Tagging- oder Sequence Labeling-Aufgabe aufgefasst, bei der jedem Token einer Sequenz eine bestimmte Kategorie bzw. ein bestimmter Entitätstyp zugewiesen wird (siehe auch Part-of-Speech-Tagging). Standardmäßig zählen Personen, Orte und Organisationen zu diesen Entitätstypen. Je nach Anwendungsfall werden aber auch andere Kategorien, wie zum Beispiel kommerzielle Produktnamen, Werktitel oder Fahrzeuge, berücksichtigt. (Jurafsky/Martin 2009, S. 761–768) Im Deutschen können auch Derivative (z  B. ‘österreichisch’) und partielle Entitäten, die nur einen Teil eines Token betreffen (z. B. KONDE-Beitrag), eine Rolle spielen und dementsprechende Unterkategorien bilden. (Benikova et al. 2014) Named Entity Recognition ist in vielen Libraries für NLP implementiert, z. B. spaCy oder Natural Language Toolkit (nltk), und auch WebLicht bietet Tools dafür an.

Literatur:

  • Akbik, Alan; Blythe, Duncan; Vollgraf, Roland. 2018. Contextual String Embeddings for Sequence Labeling. In: Proceedings of the 27th International Conference on Computational Linguistics COLING. Santa Fe, New Mexico, USA, S. 1638–1649.
  • Benikova, Darina; Biemann, Chris; Reznicek, Marc. 2014. NoSta-D Named Entity Annotation for German: Guidelines and Dataset. In: Proceedings of 9th International Conference on Language Resources and Evaluation (LREC '14) LREC. Reykjavik, Iceland, S. 2524–2531.
  • Benikova, Darina; Yimam, Seid Muhie; Santhanam, Prabhakaran; Biemann, Chris. 2015. GermaNER: Free Open German Named Entity Recognition Tool. In: Proceedings of the International Conference of the German Society for Computational Linguistics and Language Technology GSCL.
  • Dernoncourt, Franck; Lee, Ji Young; Szolovits, Peter. 2017. NeuroNER: an easy-to-use program for named-entity recognition based on neural networks. In: Proceedings of the 2017 Conference on Empirical Methods in Natural Language Processing: System Demonstrations EMNLP. Copenhagen, Denmark, S. 97–102.
  • Jurafsky, Daniel; Martin, James H. 2009. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. Upper Saddle River, New Jersey, United States of America.
  • Riedl, Martin; Padó, Sebastian. 2018. A Named Entity Recognition Shootout for German. In: Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers) ACL. Melbourne, Australia, S. 120–125.

Zitiervorschlag:

Eder, Elisabeth. 2021. Named Entity Recognition (NER). In: KONDE Weißbuch. Hrsg. v. Helmut W. Klug unter Mitarbeit von Selina Galka und Elisabeth Steiner im HRSM Projekt "Kompetenznetzwerk Digitale Edition". Aufgerufen am: . Handle: hdl.handle.net/11471/562.50.141. PID: o:konde.141