Transkribus und Topic Modeling

04.05.2022

Automatische Handschriftenerkennung und Inhaltsvisualisierung für die Digital Humanities.

Rund um die Transkriptionsplattform Transkribus werden von PHAIDRA-Services digitale Workflows aufgebaut: Der Datenzyklus von der Digitalisierung der Quellen bis zur Langzeitarchivierung wird so begleitet. Die Daten werden für Forschung und Lehre an der Universität Wien zur Verfügung gestellt: in hoher Qualität und nach den FAIR Kriterien - findable, accessible, interoperable und re-usable.

Transkribus erstellt mit Hilfe der Technologie neuronaler Netze Transkriptionen von handschriftlichem oder gedrucktem Material auf der Basis von hochgeladenen Scans. Umfangreiche (hand)schriftliche Quellen können so zeitsparend transkribiert werden.

In Zusammenarbeit mit diversen Forschungsprojekten wird auch das Service für Topic Modeling aufgebaut. Hier werden Themen auf Grundlage von statistischen Modellen in großen Textmengen erkannt, mit LDA (Latent Dirichlet Allocation), LSI (Latent Semantic Indexing) oder HDP (Hierarchical Dirichlet Process) analysiert und visualisiert.

Transkribus und Topic Modeling bei PHAIDRA-Services