Eine Übersicht aller Sessions/Sitzungen dieser Veranstaltung. Bitte wählen Sie einen Ort oder ein Datum aus, um nur die betreffenden Sitzungen anzuzeigen. Wählen Sie eine Sitzung aus, um zur Detailanzeige zu gelangen.
Chair der Sitzung: Georg Vogeler, Universität Graz
Ort:HSBI C4
Präsentationen
Zum Aufbau digitaler Dramenkorpora. OCR4alltoDraCorTEI als Baustein für die Edition von maschinenlesbaren Versionen historischer Dramendrucke
Katrin Dennerlein, Martin Rupnig, Christian Reul
Julius-Maximilians-Universität Würzburg, Deutschland
Die verfügbaren digitalisierten Dramenkorpora spiegeln Verzerrungen der Dramengeschichtsschreibung der letzten Jahrzehnte wider. Für die Dramengeschichte des 17.-19. Jahrhunderts fehlen besonders Libretti, populäre Komödien, Dramen von Frauen und Übersetzungen, obwohl diese zahlreich und einflussreich waren. Um Korpora für die Computational Literary Studies (CLS) valide zu erweitern und die historische Diversität besser abzubilden, sollten in Zukunft zahlreiche historische Dramentexte volltextdigitalisiert werden. Herausforderungen sind dabei die Frakturschrift und Druckbesonderheiten. Derzeit fehlt es sowohl an einheitlichen Editionsrichtlinien als auch an Skripten zur Konvertierung von OCR-Software zu DraCorTEI. Im Beitrag werden Vorschläge für editorische Richtlinien und zur Digitalisierung mit der freien Software OCR4all gemacht. Zudem wird ein Open Access Python-Skript vorgestellt, das Dramen, die mit OCR4all ausgezeichnet wurden, in DraCorTEI umwandelt.
Korpus 4.0 - Ein innovativer Workflow zur Erstellung eines Korpus wissenschaftlicher Texte
Silke Kalmer, Jens Freund, Angela Hammer, Andreas Geißner, Dario Kampkaspar
Universitäts- und Landesbibliothek Darmstadt, Deutschland
Im Rahmen des DFG-geförderten Projekts Workflow Digitale Medien arbeitet die Universitäts- und Landesbibliothek Darmstadt daran, ein Korpus aus wissenschaftlicher Open-Access-Literatur in einem einheitlich strukturierten TEI/XML-Format über frei zugängliche Schnittstellen bereitzustellen. Forschende sollen die Möglichkeit erhalten, alle Arten wissenschaftlicher Dokumente, zum Beispiel Zeitschriftenartikel, E-Books oder Konferenzbände, in großen Mengen über diese Schnittstellen abzurufen, um sie anschließend beispielsweise für Text- und Data-Mining-Analysen nutzen zu können. Zusätzlich zu den Texten werden alle für den Workflow entwickelten Konzepte und Skripte Open Source zur Verfügung gestellt, um deren Nachnutzbarkeit zu gewährleisten. Im vorliegenden Vortrag wird ein Überblick über den Workflow, die Datengrundlage und Zugriffsmöglichkeiten sowie den aktuellen Entwicklungsstand des Projekts gegeben.
Der texgenetische Apparat in der digitalen Edition – eine Zukunftsvision, die technisch machbar ist
Roland Reichen
Universität Bern, Schweiz / Forschungsstelle Jeremias Gotthelf
Anders als bei den gedruckten Ausgaben messen digitale Editionen Neuerer deutscher Literatur den Mikroprozessen der Textentstehung zumeist keine zentrale Bedeutung zu. Eine entsprechende Ansicht ist die große Ausnahme unter den bestehenden neugermanistischen Online-Editionsprojekten. Die verfügbaren Textansichten sind in der Regel mimetisch-diplomatisch und erlauben es oft nicht, die mikrogenetischen Vorgänge in den Manuskripten lückenlos nachzuvollziehen. Mit der neuen digitalen Gotthelf-Gesamtausgabe, die im Frühjahr 2025 online geht, wird eine Edition vorgestellt, die das philologische Potenzial der digitalen Editorik ausschöpft und den textgenetischen Apparat vollständig oder variabel direkt an den betreffenden Stellen im edierten Text sichtbar macht.