Editionsrichtlinien
Version 0.1Bei der Übertragung des Textes in die digitale Form sollten so viele Eigenheiten wie möglich übernommen werden. Hierbei halten wir uns an den von der DFG empfohlenen Standard für Textauszeichnung und -archivierung in TEI-XML (DFG: Förderkriterien für wissenschaftliche Editionen in der Literaturwissenschaft, 2015), das Basisformat des Deutschen Textarchivs (DTABf), und ergänzen diesen an einigen Stellen um projektspezifische Auszeichnungselemente. Unterschieden wird in zwei Teilbereiche: Metadaten und Textauszeichnung.
Der auf dieser Seite abgebildete Auszug aus den Editionsrichtlinien beschränkt sich aktuell auf die Besonderheiten der Textauszeichnung. Der Umgang mit den Metadaten wird im weitern Projektverlauf ergänzt.
Strukturelemente
Seiten und Blattnummern
Seitenwechsel werden durch das Element <pb/> (pagebreak) gekennzeichnet. Das Attribut @n kennzeichnet die Seiten- bzw. Foliozahl. Bsp.: <pb n=“5v“/>… Der Link zum Digitalisat kann im Attribut @facs (facsimile) angegeben werdem. Als Link werden Permalinks der bestandshaltenden Institution verwendet.
Bsp: <pb n="5v" facs="http://..."/>[Text]</pb>
Absatz
Absätze werden mit dem Element <p/> (paragraph) codiert.
Zeilenumbruch
Zeilenumbrüche werden entsprechend der Vorlage transkribiert und kodiert. Ein Zeilenumbruch wird mit dem Element <lb/> (line beginning) ausgezeichnet. Das Element <lb/> wird ausschließlich am Zeilenbeginn eingefügt.
Leere Seiten
Leere Seiten werden mittels <gap/> Element ausgezeichnet. Es folgt direkt auf den entsprechenden Seitenwechsel mit Angabe der Seitenzahl (<pb/>). Mit den Attributen @unit und @quantity des Elements <gap/> können zusätzlich Anzahl und Wert der leeren Seite definiert werden, ergänzt wird dies mit dem Attribut @reason. Mehrere leere Seiten hintereinander werden einzeln kodiert.
Bsp.: <pb n="132v"/><gap unit="pages" quantity="1" reason="empty"/></pb>
Ebenfalls mit <gap/> ausgezeichnet werden unleserliche oder zerstörte Textstellen. Unter @unit können die nicht lesbaren Segmente entsprechend definiert werden:
@unit | Bedeutung |
chars | Zeichen |
lines | Zeilen |
pages | Seiten |
words | Wörter |
Das Attribut @reason beschreibt zudem den Grund für die Unleserlichkeit:
@reason | Bedeutung |
lost | Zerstörung/Verlust |
illegible | unleserlich |
covered | durch Überschreibung schwer leserlich |
empty | leere Seite |
Listen
Listen werden als solche transkribiert und mit dem Element <list> ausgezeichnet. Die einzelnen Aufzählungspunkte oder Zeilen werden mit dem Element <item> umschlossen. Titel werden, wenn vorhanden, durch das Element <head> markiert.
Abbildungen
Abbildungen werden mit dem Element <figure/> erfasst und mittels <figDesc/> (description of figure) durch die Bearbeiter:innen näher beschrieben. Bildunterschriften werden im Element <head> (heading) angegeben. Im Attribut @facs wird der Dateiname notiert.
Bsp.: <figure facs="Dateiname Abbildung"> <head>[Bildunterschrift im Manuskript]</head>
<figDesc>[Bildbeschreibung Bearbeiter:in]</figDesc> </figure>
Textbearbeitung Autor_in
Ergänzungen
Ergänzungen werden durch das Element <add> (addition) gekennzeichnet, das Attribut @place gibt zusätzlich den Ort dieser an. Ergänzungen können sich unter- oder oberhalb der Zeile sowie am linken oder rechten Rand befinden.
Bsp.: innerhalb <add place="interlinear">der Zeile</add> ergänzt
Der Ort wird durch folgende Attribute beschrieben:
@place | Bedeutung |
superlinear | über der Zeile |
sublinear | unter der Zeile |
interlinear | innerhalb der Zeile |
across | über den ursprünglichen Text |
left | am linken Rand |
right | am rechten Rand |
mTop | am oberen Rand |
mBottom | am unteren Rand |
Streichungen
Gestrichener Text wird mit dem Element <del/> (deletion) ausgezeichnet und soweit lesbar transkribiert, hierbei werden zusätzlich alle Textphänomene, Auflösungen, Normalisierungen und Korrekturen berücksichtigt und entsprechend ausgezeichnet.
Bsp.: <del rendition="#s"/>durchgestrichen</del>
Das Attribut @rendition gibt Auskunft über die Art der Streichung:
@rendition | Bedeutung |
#ow | ursprünglicher Text überschrieben |
#s | Textstelle durchgestrichen |
#erased | radierter Text |
Korrektur durch den Autor
Korrekturen durch den Autor werden als Substitutionsprozess innerhalb des Elements <subst/> (substitution) dargestellt. Dieser Prozess besteht aus zwei Teilen: dem Löschungsvorgang mittels Element <del/> (deletion) und der Ergänzung des neuen Textes durch das Element <add/> (addition). Angaben zur Art der Streichung und Art der Einfügung werden, wie unter Streichung und Ergänzung beschrieben, hinzugefügt.
Bsp. Streichung mit Ergänzung: <subst><del rendition="#ow">f</del><add place="across">t</add></subst>
Typographische Besonderheiten
Textteile mit typographischen Besonderheiten werden mit dem Element <hi> (highlighted) ausgezeichnet. Im Attribut @rendition wird notiert, um was für eine Art von typographischer Besonderheit es sich handelt.
Im Folgenden sind einige Arten aufgeführt, die bei handschriftlichen Manuskripten eine Rolle spielen. Für gedruckte Werke, die möglicherweise in die Edition mit aufgenommen werden, können noch weitere Auszeichnungselemente ergänzt werden.
Bsp.: <hi rendition="#u">unterstrichen</hi>
@rendition | Bedeutung |
rendition=“#sub“ | Tiefstellung |
rendition=“#sup“ | Hochstellung |
rendition=“#u“ | Unterstreichung |
rendition=“#uu“ | doppelte Unterstreichung |
Textauszeichnung durch Herausgebende
Ergänzungen
Zu Ergänzungen durch Herausgeber:innen zählen u. a. die Ergänzung abgekürzter Wörter. Herausgeber:innen können Wörter auflösen/ergänzen, um beispielsweise eine bessere Lesbarkeit zu erzielen. Abkürzungen und ihre Auflösung werden mit Hilfe von <choice/> kodiert, näher definiert wird die Auflösung mittels der Kindelemente <abbr/> (abbreviation) und <expan/> (expansion). Im <abbr/>-Element wird die Abkürzung der Vorlage entsprechend festgehalten, im <expan/>-Element wird die Ergänzung/Auflösung notiert.
Bsp.: <choice><abbr>Jan.</abbr><expan>Januar</expan></choice>
Fehlende Wörter, Buchstaben oder Satzzeichen
Fehlende Wörter oder Satzzeichen können mithilfe des <supplied> Elements ausgezeichnet werden. Über das Attribut @cert (certainty) kann zusätzlich angegeben werden, mit welcher Wahrscheinlichkeit die vorgenommene Erweiterung zutrifft – high steht dabei für hoch und low für niedrig.
Auch hierbei geht es in erster Linie um eine bessere Lesbarkeit des Textes. Ergänzungen sind genau abzuwägen und können sich über Buchstaben und Satzzeichen oder auch ganze Wörter erstrecken.
Bsp.: Apfe<supplied cert="high">l</supplied>
Korrekturen
Falls sich im Text Fehler befinden, können diese, soweit es für die Lesbarkeit und das Textverständnis wichtig ist, durch die Herausgeber:innen korrigiert werden. Die Fehlerhaften Textstellen werden dabei zuerst entsprechend der Vorlage transkribiert und dann korrigiert.
Die Korrekturen von Fehlern werden mit dem <choice/>-Element umschlossen. Das fehlerhafte Wort wird mit <sic/> ausgezeichnet und die die Korrektur durch das <corr/>-Element (correction) ergänzt. Mit dem Attribut @cert (certainty) kann zusätzlich angegeben werden, mit welcher Wahrscheinlichkeit eine Korrektur zutrifft, unterschieden wird dabei in high und low.
Bsp.: <choice><sic>daß</sic><corr cert="high">das</corr></choice> […]
Unter Umständen kann der Autor ein Wort irrtümlicherweise mehrfach gesetzt haben. Die Streichung eines Wortes (oder mehrerer Wörter) durch die Herausgeber:innen, was auch eine Korrektur darstellt, wird ebenfalls im Element <choice/> vorgenommen; dabei kennzeichnet das Kindelement <sic/> das zu streichende Wort. Die Streichung selbst wird innerhalb des Elements <corr/> mit dem Attribut @type, welches den Wert deleted trägt, ausgezeichnet.
Bsp.: <choice><sic>Baum</sic><corr type="deleted"/></choice> […]
Unsichere Transkription
siehe: https://www.deutschestextarchiv.de/doku/basisformat/msEditorCert.html
Wenn Textteile nicht sicher lesbar sind, kann das Element <unclear/> verwendet werden. Dies trifft zu wenn z. B. durch Überschreibung oder Verschmutzung die Lesbarkeit des Textes eingeschränkt ist. Mit <unclear/> wird also eine gewisse Unsicherheit in der Transkription gekennzeichnet. Die Ursache der Unsicherheit kann über das Attribut @reason mit den Werten illegible (unleserlich) oder covered (bedeckt) näher beschrieben werden, mit welcher Wahrscheinlichkeit die Transkription zutrifft, wird mit dem Attribut @cert (certainty) und den Werten high oder low angegeben.
Bsp.: durch <unclear reason="covered" cert="low">Überschreibung</unclear> schwer lesbar
Datumsangaben
Datumsangaben sind für die Nachvollziehbarkeit des Reiseverlaufs von großer Bedeutung und werden deshalb im Text ausgezeichnet. Datumsangaben erhalten das Element <date>, das maschinenlesbare Datum wird dabei im Format JJJJ-MM-TT in den Attributen @when, @from und @to sowie @notBefore oder @notAfter notiert.
Folgenden Erscheinungsformen sind möglich:
Datumsangabe | Beispiel |
Genaues Datum |
<date when="1772-12-21">21. Dezember 1772</date>
|
Genaue Zeitspanne |
<date from="1731-11-11" to="1741-09-11">11. November 1731 bis 11. September 1741</date>
|
Ungefährer Zeitraum |
<date notBefore="1804-05-01" notAfter="1804-05-16">
|
Im Attribut @cert (certainty) kann mit den Werten high bzw. low die Wahrscheinlichkeit angegeben werden, mit der die Datumsangabe zutrifft. In dem Attribut @calendar wird definiert, ob sich die Datumsangabe nach dem Julianischen Kalender oder dem Gregorianischen Kalender richtet.
Zeitangaben
Siehe auch: https://tei-c.org/release/doc/tei-p5-doc/de/html/ref-time.html
Zeitangaben werden über das Element <time> definiert. Die Attribute verhalten sich dabei ähnlich wie bei Datumsangaben, siehe hierfür die Tabelle unter “Datumsangabe”.
@dur Angabe einer Zeitspanne: 1 Stunde, 1 Woche
@when Angabe der genauen Zeit und der Zeitzone Bsp.: +01:00 Berlin
@notBefor @notAfter ungefähre Zeitangabe
Maßangaben
Siehe auch: https://www.tei-c.org/release/doc/tei-p5-doc/en/html/ref-measure.html
Maßangaben werden über das Element <measure> gekennzeichnet und durch die folgenden beschriebenen Attribute ergänzt:
@unit bezeichnet die erwähnte Einheit, wie z.B. Rubel. Mittels @type wird die Art der Maßeinheit näher beschrieben, zur Verfügung stehen hier “currency” und “dimension”. Unter @quantity wird die genaue Menge festgehalten.
Bsp.: <measure type=”currency” unit=”Rubel” quantity="4">4 Papier-Rubeln</measure>