Zur Codierung der Volltexte
Inhaltsverzeichnis
Text
- 1 Einleitung
-
2 Zu den Dokumenttypen
- 2. 1 Dokumenttyp I (Volltexterfasste Datensätze)
- 2. 2 Dokumenttyp II (Katalogdatensätze)
- 2. 3 ID-Systematik
- 2. 4 Revisionen
- 2. 5 Status/Zustand der Datensätze
- 2. 6 Zum Umgang mit Dubletten
-
3 Zur Codierung der Volltexte
- 3. 1 Grundsätze der Textübertragung und -auszeichnung
- 3. 2 Typoskripte
- 3. 3 Textstruktur
- 3. 4 Zum Umgang mit Hervorhebungen im Text
- 3. 5 Zeichenebene
- 3. 6 Textkonstitution
- 3. 7 Eingriffe der Herausgebenden
- 3. 8 Quellenangaben/Textzeugen
- 3. 9 Schreiber*innen (Hände)
- 3. 10 Beziehungen zwischen Texten/Dokumenten
- 3. 11 Inhaltliche Auszeichnung
Zur Codierung der Volltexte
Grundsätze der Textübertragung und -auszeichnung
Grundsätzlich werden alle Texte diplomatisch wiedergegeben (unter Einschluss der originalen Orthographie und Zeichensetzung). Außerdem wird der Originalzeilenfall dokumentiert.
Eine Anpassung von ’ss’ zu ’ß’, für welches bis 2020 im Deutschen kein Großbuchstabe exisitierte, wird jedoch nicht vollzogen. Diese Schritte dienen der Lesbarkeit und sind aus Vermittlungsgründen in die Edition eingeführt worden.
Typoskripte
Zahlreiche Briefe dieser Edition wurden mit der Schreibmaschine geschrieben (zur Vorliebe der Autoren vgl. die Beschreibung ihrer Schreibgewohnheiten) und kommt es hierdurch zu Doppelüberlieferungen, da beim Empfänger der abgeschickte Brief erhalten ist und bei dem Absender ggf. der aufgehobene Durchschlag. Diese Überlieferungseigenart (sehr selten gibt es auch Photokopien) wird in der Quellenbeschreibung erfasst. Die Übertragung folgt dem Original. Abweichungen werden ggf. in den Anmerkungen notiert.
Das Medium „Schreibmaschine“ hat einige Besonderheiten, auf die hier verwiesen werden muss.
Zeilenabstand: Der Zeilenabstand konnte in 5 Stufen, von halbem bis zum 2,5-fachen Zeilenabstand, eingestellt werden. Hierbei hat der sog. einzeilige Abstand bereits zwei Stufen. Um den Text eindeutig lesen zu können, war mindestens ein einzeiliger Abstand notwendig, doch wurde gelegentlich auch manuell der halbe Abstand eingestellt. Dies wurde einerseits dazu genutzt, Absätze von einander zu trennen (hier sind also nicht nur die sonst im Dokument genutzten Leerzeilen sondern auch Zwischenstufen möglich), andererseits um vergessene Worte mit der Maschine nachzutragen. Solche Einfügungen waren vor allem möglich, wenn der Grundzeilenabstand mindestens 1,5zeilig war, da dann durch die halbzeilige Versetzung ein anderes Wort leserlich eingefügt werden konnte.
Durch das Einspannen des Blatt Papiers entsteht oben und unten ein Rand von ca. 2cm, da das Blatt sonst nicht fest auf der Walze hielt. Oben wurde von diesem Rand selten abgewichen, doch konnte es vorkommen, dass die Schreibenden nicht bemerkten, dass das Blatt unten zu Ende ging und noch einmal eine Zeilenschaltung machten. Die dann entstehende Zeile war in der Regel nicht mehr gerade, sondern geriet immer weiter nach unten, da das Blatt immer weiter nach oben rutschte. Diese typographische Besonderheit wird nicht wiedergegeben, sondern in der <layoutDesc> beschrieben.
Streichungen: Um Worte zu tilgen hat sich bei der Schreibmaschine nicht der Bindestrich durchgesetzt, sondern es wurde der Buchstabe x verwendet. Diese Form wird mit dem Attribut @rend
und den Werten "typedthrough"
bzw. "overtyped"
gekennzeichnet. Gelegentlich kommt es bei Streichungen von einzelnen Buchstaben vor, dass diese mit einem Schrägstrich / getilgt sind.
Autorkorrekturen: Kleine Fehler wie ein oder zwei falsche Buchstaben wurden häufig einfach überschrieben. Dies wird mit <subst> codiert. Im untergeordneten Element <del> wird vermerkt, dass die Buchstaben "overtyped"
sind.
Buchstabenzusätze wie Akzente: Als Type waren auf den Maschinen der accent aigu (´) und der accent grave (`) vorhanden, aus diesen wurde der accent circonflexe (´` = ^) zusammengesetzt. Weitere Zeichen waren auf deutschen Maschinen nicht vorhanden und wurden deshalb weggelassen oder später handschriftlich ergänzt. Für die im Spanischen häufige Tilde wurde gelegentlich ein accent circonflexe gesetzt und für den französischen Cedille (ç) ein Komma in das c geschrieben.
Sonderzeichen: In anderen Sprachen übliche Zeichen wie ¡! bzw. ¿? im Spanischen sind auf fremdsprachigen Maschinen möglich. Auf deutschen Maschinen werden sie im allgemeinen ausgelassen. Gelegentlich findet sich allerdings ein Semikolon (;) als Ersatz für das anführende Exklamationszeichen (¡).
Fehlende Zeichen: Gegenüber heutigen Tastaturen fehlen auf verschiedenen Schreibmaschinen einige Zeichen. Besonders auffällig ist das Fehlen der Null, die durch ein O ersetzt wurde, wobei häufig ein kleines o verwendet wird. Auf anderen Maschinen fehlte dagegen die 1, die dann durch ein l (auch I) ersetzt wurde. Dies wird diplomatisch wiedergegeben.
Leerstellen: Da bei Schreibmaschinen die Buchstabenabstände eine feste Breite haben (Festbreitenschrift), lassen sich Lücken sehr genau bestimmen. Die diplomatische Übertragung gibt deshalb fehlende und überflüssige Leerzeichen wieder. Entsteht eine Lücke von zwei und mehr Zeichen wird diese als <space> codiert und die Zahl der Leerzeichen mit "quantity"
angegeben.
<p>Eine Lücke mit einem doppelten
<space unit='chars' quantity='2'></space>Leerzeichen.
</p>
Farbband: Für Schreibmaschinen gab es zweifarbige Farbbänder, im allgemeinen mit den Farben rot und schwarz. Wurde die Mehrfarbigkeit eingesetzt, so sind die einzelnen Farben in <handNote> beschrieben und die Wechsel im Dokument mit <handShift> codiert bzw. bei Einfügungen mit dem Attribut @hand
verknpüft.
In Typoskripten werden (Zeilen-)Abstände abweichend von 1,0 in der <layoutDesc> beschrieben. In allen Dokumenten werden Standard-Einrückungen (erste Zeile eines Absatzes) in der <layoutDesc> angemerkt. Von der Regel abweichende Einschübe werden als <space> oder <p> codiert. Fehlt ein regulär zu erwartender Einschub, wird dies ebenfalls vermerkt (<p rend="noIndent">).
Textstruktur
Die Struktur der Texte kann mit folgenden Elementen untergliedert werden:
Es folgen nur Erläuterungen zu einzelnen Gliederungspunkten, wenn die Verwendung in Henze-Digital Besonderheiten gegenüber der allgemeinen Verwendung in TEI aufweist.
Abschnitte (<div>)
In der Regel enthält ein Brief nur einen <div>. Ausnahmen sind Briefe, die von verschiedenen Personen geschrieben sind und Briefe, die eindeutig an verschiedenen Tagen (writingSessions) geschrieben sind. Beilagen wie Dokumente oder Rezensionen aber auch Umschläge werden getrennt erfasst, aber in dem Brief verlinkt.
Zur Verwendung von <div> bei komplexeren Strukturen siehe Telegramme
Absätze (<p>)
Die grundsätzliche Gestaltung der Absätze wird in den Angaben zum Layout <layoutDesc> beschrieben: Zeilenabstand, Einzüge, Abstände, wobei die Angaben bei Typoskripten exakter sein können als bei handschriftlich überlieferten Dokumenten. Weicht ein Absatz davon ab, wird dies als Attribut in <p> vermerkt. Für den Sondereinzug wird hierbei das <space> verwendet. Die Breite des Einzugs wird wie auch bei anderen Abständen in der Zahl der Buchstaben oder in relativen Abständen angegeben. Wird in der <layoutDesc> kein Einzug standardmäßig für die Absätze angegeben, beginnen Absätze ohne weitere Bezeichnung am linken Rand.
Zum Umgang mit Hervorhebungen im Text
Texthervorhebungen wie Unterstreichungen, Hochstellung, etc. im laufenden Text werden mit dem Element <hi> gekennzeichnet.
Unterstreichungen: Einfache, doppelte oder mehrfache Unterstreichungen werden mit dem Element <hi> (highlighted) im Text vermerkt. Im Attribut @rend
wird dabei einerseits die Tatsache, dass es sich um eine Unterstreichung handelt und ggf. im Attribut @n
die Zahl der Striche angegeben (<hi rend="underline" n="3">). Sofern zusätzliche Binnenunterstreichungen gesetzt sind, werden diese geschachtelt angegeben und zur grundsätzlich vorhandenen Zahl der Striche addiert, d. h. ein innerhalb einer Doppelunterstreichung dreifach unterstrichenes Wort erhält zusätzlich die Binnenangabe <hi rend="underline" n="1">. Die Wiedergabe im angezeigten Text erfolgt zur Zeit nur mit einer Zahl von bis zu zwei Strichen.
In Telegrammen ist der Inhalt oft ausschließlich in Großbuchstaben bzw. Kleinbuchstaben abgedruckt. Dieser Umstand ist historisch-technisch bedingt. In der Edition werden Inhalte in ausschließlicher Großschreibung entsprechend der heute üblichen Groß- und Kleinschreibung übertragen. Damit diese Änderung transparent bleibt, sind diese Abschnitte mit <hi rend="capital"> ausgezeichnet. Sie werden im Onlineportal in Großbuchstaben angezeigt.
<hi rend='capital'>Dieser Text war in Grossbuchstaben abgedruckt</hi>
Zeichenebene
Trennstriche
Ein "normaler" Zeilenumbruch wird durch <lb> dargestellt. Ein Zeilenumbruch, der innerhalb eines Wortes vorkommt und durch einen Trennstrich orthographisch realisiert ist, wird mit <lb break="no"> codiert. Ein fehlender Trennstrich wird mit <lb break="no" rend="noHyphen"> codiert.
Abkürzungen <abbr>
Abkürzungen, die unverständlich bleiben und nicht z. B. mit Hilfe des Dudens aufgelöst werden können, werden entweder mit <supplied> ergänzt oder in ihrer originalen Form und zusätzlich als wahlweise aufzurufende Vollform wiedergegeben:
<choice>
<abbr>bzgl.</abbr>
<expan>bezüglich</expan>
</choice><choice>
<abbr>Sal:</abbr>
<expan resp='editor'>Salzburg</expan>
</choice><choice>
<abbr>br.</abbr>
<expan resp='editor'>bringe</expan>
</choice> bitte was mit [...]
Schreibversehen
Schreibversehen (wie z. B. versehentliche Wortwiederholungen) werden in der Regel so übernommen und durch das Element <sic> markiert, um eine spätere irrtümliche Korrektur durch einen Editor zu verhindern. Dort, wo solche Schreibversehen zu Leseschwierigkeiten führen, kann in einem <choice>-Element neben der originalen Schreibung (<sic>) eine vom Editor angebotene Korrektur angeboten werden (mit Verweis auf die für den Vorschlag verantwortliche Person<corr resp="DR">).
Fremdsprachliche Textteile
In den Korrespondenzen von Henze und seinen Korrespondenzpartner*innen werden unterschiedliche Sprachen verwendet und immer wieder Wörter, Satzteile oder ganze Passagen in anderen Sprachen eingefügt. Die Grundsprache eines Briefes wird in den Metadaten angegeben, hiervon abweichende Sprachen werden mit <foreign> gekennzeichnet. Wenn es sich bei den verwendeten Sprachen um andere als deutsch und englisch handelt, kann eine Übersetzungshilfe beigegeben werden, vor allem wenn die Wortbedeutung nicht offensichtlich ist.
Das den fremdsprachlichen Anteil kennzeichnende Element <foreign> erhält hierzu eine @xml:id
nach dem Muster "foreign.\d+"
. Die einzelnen Vorkommen werden dokumentweise durchgezählt.
Im <notesStmt> werden die Übersetzungen hinterlegt und mit dem korrespondierenden Element im Text assoziiert.
Im Header:
<note type='translation' xml:lang='de' corresp='#foreign.1'>eine etwas melancholische Umarmung</note>
(Beispiel aus A040C964)
Im Body:
<foreign xml:lang='es' xml:id='foreign.1'>un abrazo un poco melancólico</foreign>
(Beispiel aus A040C964)
Dieses Vorgehen kann auch verwendet werden, um eine Übersetzungshilfe für einen Abschnitt (<seg>) oder einen ganzen Absatz (<p>) zu geben, bspw. in Telegrammen deren Grundsprache nicht eine der Editionssprachen ist. In diesen Fällen wird <p> bzw. <seg> durch eine ID (@xml:id
) nach dem Muster "sec.\d+"
adressierbar gemacht. Die Anmerkung mit der Übersetzung ist nach obigem Vorbild analog anzulegen:
Im Header:
<note type='translation' resp='EM' xml:lang='de' corresp='#sec.1'>–Bitte teile mir so bald wie möglich mit, ob Du das Konzert in Zürich am 17. Oktober 1975 dirigieren kannst. Grüße – Paul Sacher</note>
(Beispiel aus A04200B0)
Im Body:
<p xml:id='sec.1'>
<hi rend='capital'>
<seg type='strip'>–Prego informarmi al
<app>
<lem wit='#wit.1'>piu</lem>
<rdg wit='#wit.2'>più</rdg>
</app> presto se puoi
<app>
<lem wit='#wit.1'>dirigere</lem>
<rdg wit='#wit.2'>dirigente</rdg>
</app> concerto
<settlement key='A1303988'>Zurigo</settlement>
<date when='1975-10-17'>17</date>
</seg>
<lb></lb>
<seg type='strip'>
<date when='1975-10-17'>ottobre 1975</date> saluti –
<persName key='A00094F9'>Paul Sacher</persName>
</seg>
</hi>
</p>
(Beispiel aus A04200B0)
Bei Dokumenten, die gänzlich in Übersetzung vorliegen (z. B. Barnet/Henze, auf Spanisch verfasste Dokumente, vgl. auch Übersetzungen) sind diejenigen Passagen, die im Original bereits in der Zielsprache (meist Englisch) verfasst waren, mit <foreign xml:lang="en" source="original"> markiert.
Anführungszeichen
Die Verwendung von Anführungszeichen zur Hervorhebung einer Phrase ist von einem Zitat zu unterscheiden. Während das Element <q> lediglich die Anführungszeichen repräsentiert, markiert das Element <quote> ein Zitat. Im Rahmen der Edition werden Anführungzeichen durch die Verwendung dieser beiden Elemente ersetzt, sodass im codierten Text keine Symbole für Anführungszeichen enthalten sind. Damit aus inhaltlicher Sicht kein Defizit entsteht, werden Abweichungen "von der Norm" codiert.
Diese anzulegende Norm wird in mehreren Schritten definiert:
- Sprache des Dokumentes
- Schreibeigenheiten des/der Autors/Autorin
- Eigenheiten des Dokumentes
Finden sich keine weiteren Angaben, so ist die Sprache des Dokumentes maßgebend. Das heißt, dass <q> oder <quote> doppelte Anführungszeichen in der definierten Sprache des Dokumentes repräsentieren. Sind Schreibeigenheiten der Verfassenden bekannt, die durch die Häufigkeit ihrer Verwendung eine Art Norm bilden, so haben diese Vorrang vor der Sprache des Dokumentes. Weist ein Dokument jedoch Eigenheiten auf, die innerhalb des Dokumentes als Standard anzusehen sind (bspw. die konsequente Verwendung von Sternchen als Anführungszeichen) haben diese die oberste Priorität.
Codiert werden immer nur Abweichungen von der jeweils geltenden Norm!
Die unterstützen Zeichen sind:
- „[...]“ und ,[...]‘ (deutsch)
- “[...]” und ‘[...]’ (englisch)
- «[...]» und ‹[...]› (französisch)
Werden also keine näheren Angaben gemacht, stehen die Elemente <q> und <quote> stellvertretend für doppelte Anführungszeichen in der definierten Sprache des Dokumentes.
<p>Dieser deutsche Satz enthält
<q>doppelte</q> Zeichen.
</p><p>Dieser deutsche Satz enthält „doppelte“ Zeichen.</p>
Handelt es sich um einfache Anführungszeichen, so ist das entsprechend zu codieren:
<p>Dieser deutsche Satz enthält
<q rend='single'>einfache</q> Zeichen.
</p><p>Dieser deutsche Satz enthält ,einfache‘ Zeichen.</p>
Wenn Anführungszeichen einer anderen Sprache verwendet werden, dient das Attribut @xml:lang
dazu diese Sprache zu definieren.
<p>Dieser deutsche Satz
<q xml:lang='fr'>enthält</q> französische Zeichen.
</p>
Wenn die Zeichen ungleichmäßig voneinander abweichen, kann dies über eigens dafür definierte Attribute (@rendLeft
, @rendRight
) angegeben werden.
<p>Dieser deutsche Satz
<q rendRight='single'>enthält</q> solche Abweichungen.
</p>
Auch der Fall, dass eines der beiden Zeichen oder beide fehlen, kann auf diese Art codiert werden. Für ein Fehlen wird der Wert "none"
verwendet. Durch den Umstand, dass bei der Verwendung der Elemente <q> und <quote> ein Anfangs- und Endpunkt zwangsläufig definiert werden muss, kommt diese Form der Codierung einer editorischen Ergänzung gleich.
<p>In diesem deutschen Satz
<q rendRight='none'>fehlt</q> das rechte Anführungszeichen.
</p>
Zum Hintergrund dieses Modells: Ziel der Edition ist es den Inhalt im Code adäquat abzubilden. Gleichzeitig ist auch die Vermittlung der Forschungsdaten ein wichtiger Aspekt. Ersteres ließe sich auch dadurch realisieren, dass die Anführungszeichen als Textzeichen in die Dateien eingegeben werden. Ein solches Vorgehen verwehrt jedoch die Möglichkeit eine Lesefassung anzubieten, in der z.B. sämtliche Zeichen normalisiert sein könnten. Um also eine Steuerung dieser Zeichen in der späteren Anzeige zu ermöglichen, ist es notwendig diese ansteuerbar zu machen. Gleichzeitig soll der Inhalt aber nicht defizitär werden, indem Rückschlüsse auf das Original (Diplomatik) nicht mehr möglich sind. Aus diesen Gründen werden die Anführungszeichen entsprechend auscodiert. Das Modell der Norm-Hierarchie bringt zwar eine weitere Ebene hinein, durch welche die Komplexität steigt, jedoch müssen dadurch nur wenige Stellen explizit codiert werden, nämlich die Abweichungen. In der Konstitution komplex, erleichtert dieses Modell die Erarbeitung der Edition.
Musiknotation
Sind in den Dokumente Notenbeispiele erhalten, so werden diese mit dem Element <notatedMusic> repräsentiert. Hierbei gibt es die Möglichkeit, dass innerhalb von <notatedMusic> eine Beschreibung (<desc>) angefertigt wird, was besonders bei abstrakter Notation zu Empfehlen ist.
<notatedMusic>
<desc>drei 32stel auf einer Höhe gebalkt</desc>
</notatedMusic>
(Beispiel aus A042BD62)
Alternativ kann ein Notenbeispiel als Bild eingebunden werden
<figure>
<figDesc>Notenbeispiel 1</figDesc>
<graphic url='A042D1E2_NB1.png' height='75px'></graphic>
</figure>
(Beispiel aus A042D1E2)
Zukünftig sollen die Notenbeispiele in einer separaten MEI-Datei erfasst werden, auf die verwiesen wird.
Seitenzahlen
Ist auf einem Dokument eine Seitenzählung vorhanden, welche auf die Verfassenden zurückgeht, so wird diese mit <num> erfasst und mit dem Attribut @type
als "page"
klassifiziert.
Textkonstitution
Textkonstitutionelle Merkmale im Text werden mit den folgenden Elementen erfasst und beschrieben:
Autoreigene Tilgungen
Das einfache Streichen von Worten oder Absätzen wird durch das Element <del> (deleted) gekennzeichnet. Die Form der Streichung sollte dabei durch das Attribut @rend
(rendition) angegeben werden (in der Regel als <del rend="strikethrough"/>). Geschieht das Streichen als Sofort-Korrektur in der Zeile, genügt diese Kennzeichnung. Doppelte Durchstreichungen sind folgendermaßen zu codieren:
<del>
<hi rend='strikethrough' n='2'>...</hi>
</del>
Autoreigene Ergänzungen
Einfügungen, welche die Autor*innen (Schreiber*innen) nachträglich oder im Schreibvorgang vorgenommen haben, werden (sofern es sich nicht um Korrekturen durch Eingriffe in die ursprüngliche Substanz) handelt, mit dem Element <add> (addition) vermerkt. Dabei sollte der Ort der Einfügung mit Hilfe des Attributs @place
bezeichnet werden. Als Attributwerte kommen dabei in Frage: "inline"
, "margin"
, "above"
(the line), "below"
(the line) oder "mixed"
. Stammen solche Einfügungen von anderer Hand, kann die Hand durch das Attribut @hand
zugewiesen werden.
Hinweis: Einfügungen und Zusätze der Herausgebenden werden nie mit <add>, sondern stets mit <corr> oder <subst> vorgenommen.
Besonderheit „Randanmerkungen“: Es kommt vor, dass Hinzufügungen z. B. aus Platzgründen nicht im Fließtext sondern am Rand ausgeführt sind. Für die Edition wurden diese Randanmerkungen in den Text integriert und hervorgehoben. In der zugehörigen Anmerkung ist vermerkt, an welchem Rand sich die Hinzufügung im Original befindet.
Autoreigene Korrekturen
(siehe auch: Autoreigene Ergänzungen): Korrekturen, die die Autor*innen (Schreiber*innen) in ihrem Text vorgenommen haben, werden als Substitutionsprozess innerhalb des Elements <subst> dargestellt. Dieser Prozess besteht in der Regel aus zwei Teilen: dem Löschungsvorgang (durch Streichen, Überschreiben o. ä.) und der Ergänzung des neuen Textes (durch Einfügen, Überschreiben o. a.). Der Vorgang ist sowohl hinsichtlich der Art des Löschvorgangs als auch des Ortes, an dem der Ersatztext zu finden ist, näher zu beschreiben. Hinweis: Die Art und Weise der Streichung wird am Element <del> festgehalten, nicht an <subst>. Ist der ersetzte Text nicht zu entziffern, so wird dies innerhalb von <del> duch das Element <gap> ausgedrückt (das durch @unit
und @quantity
näher charakterisiert sein kann). Ein Ersetzungsvorgang, bei dem das Wort „wollte“ durch „musste“ überschrieben wurde, sieht daher in der Codierung wie folgt aus:
<subst>
<del rend='overwritten'>wollte</del>
<add place='inline'>musste</add>
</subst>
Sind z. B. in Typoskripten notwendige Korrekturen, oft nachträglich, nur mit Korrekturzeichen angegeben (z. B. zu tauschende Buchstaben mit dem entsprechenden Korrekturzeichen) so wird dies in einer Anmerkung beschrieben.
Unleserliche Stellen/Beschädigungen
Hier sind zwei Fälle zu unterscheiden: 1. Wenn durch Wasserschäden, Lochungen oder sonstige äußere Einwirkungen (nicht aktives Eingreifen der Schreibenden in den Text!) Teile nicht lesbar sind, wird dies durch das Element <damage> gekennzeichnet. Dabei wird die Ursache der Lesebeeinträchtigung durch das Attribut @agent
angegeben. Die Auszeichnung kann als bloße Kennzeichnung der „Schadenstatsache“ erfolgen oder aber unklare bzw. vom Herausgeber ergänzte Lesungen kennzeichnen.
An die<damage agent='water'>
<unclear>ser roten</unclear>
</damage> Stelle war etwas beschädigt.
Wenn die Ergänzung (<unclear> oder <supplied>) auf die Herausgebenden zurückgeht und, wie im vorstehenden Falle, etwas „nicht Selbstverständliches“ (zu letzterem gehören Ergänzungen einzelner Buchstaben) umfasst, sollte sich der Herausgebende als verantwortliche Person eintragen: @resp="EM". Komplett unlesbare Bereiche werde durch das Element <gap> gekennzeichnet, wobei der Vollständigkeit halber der Umfang mit den Attributen @unit
und @quantity
notiert werden kann (als Werte kommen z. B. "characters"
in Frage). Die Entzifferungsprobleme können zusätzlich durch das Attribut @reason="illegible" vermerkt sein.
Unsichere Lesung
Alle nur aus Leseschwierigkeiten der Handschrift resultierenden Unklarheiten werden in das Element <unclear> eingeschlossen. Sofern mehrere Deutungsmöglichkeiten vorhanden sind, werden diese innerhalb des Elements <choice> zur Auswahl gestellt. In diesem Falle sollte bei den Einzellesungen das Element <unclear> durch ein Attribut @cert
(certainty) ergänzt werden. Als Werte kommen dafür "high"
, "medium"
, "low"
oder "unknown"
in Frage. Durch das hinzugefügte Attribut @resp
ist dabei der/die für diese Einschätzung verantwortliche Editor*in erkennbar.
Lesarten
Für Apparateinträge stehen folgende Elemente zur Verfügung:
Während <app> als Container fungiert, markiert <lem> als Lemma die Textstelle, zu der es eine Abweichung gibt, und ergänzt mit <rdg> eine oder mehrere Lesarten. Der in <lem> hinterlegte Text, ist der in der Edition angezeigte Text, der ggf. von der Hauptquelle abweichen kann. Aus welcher Quelle der Text in <lem> stammt gibt das Attribut @wit
wider.
<seg type='strip'>–Prego informarmi al
<app>
<lem wit='#wit.1'>piu</lem>
<rdg wit='#wit.2'>più</rdg>
</app> presto se puoi
<app>
<lem wit='#wit.1'>dirigere</lem>
<rdg wit='#wit.2'>dirigente</rdg>
</app> concerto
<settlement key='A1303988'>Zurigo</settlement>
<date when='1975-10-17'>17</date>
</seg><lb></lb><seg type='strip'>
<date when='1975-10-17'>ottobre 1975</date> saluti –
<persName key='A00094F9'>Paul Sacher</persName>
</seg>
(Beispiel aus A04200B0)
Eingriffe der Herausgebenden
Ergänzungen der Herausgebenden
Gelegentlich kann es vorkommen, dass die Herausgebenden zum besseren Textverständnis einzelne fehlende Zeichen oder auch Zeichenfolgen bzw. Worte ergänzen müssen/möchten (wenn dies die Folge von Textverlusten ist, vgl. allerdings die Rubrik Unleserliche Stellen/Beschädigungen). Diese Ergänzungen werden mit dem Attribut @resp
am Element <supplied> vorgenommen (Bsp.: heute kam Friedr<supplied resp="DR">i</supplied>ch). Alle auf diese Weise vorgenommenen Ergänzungen erscheinen im Text in eckigen Klammern.
Korrekturen der Herausgebenden
(sofern für das Verständnis zwingend): Es kommt vor, dass ganz offensichtlich Falsches zu Missverständnissen führt und besser korrigiert werden sollte. Zur Kennzeichnung der originalen Schreibung wird <sic> verwendet (das auch eingetragen werden kann, um die Tatsache eigenartiger Schreibungen hervorzuheben, damit in späteren Korrekturgängen an dieser Stelle nicht fälschlich ein Verschreiber des Übertragenden angenommen wird). Die Korrektur selbst kann dann durch <corr> angegeben werden und die Verantwortlichen sollten sich mit dem Attribut @resp
zu erkennen geben. Das Ganze wird in ein <choice>-Element eingeschlossen, um eine wahlweise Darstellung zu ermöglichen.
Kommentare der Herausgebenden
Kommentare (<note>) sind grundsätzlich zu klassifizieren. Die folgende Liste gibt einen Überblick über die Klassifikation
Wert | Beschreibung |
"textConst"
|
Text-Constitution (Textkonstitution) |
"definition"
|
Definition |
"commentary"
|
Commentary (Einzelstellenkommentar) |
"editorial"
|
Generalvermerk |
"summary"
|
Zusammenfassung/Regeste |
"thematicCom"
|
thematic Commentary (Erläuterungstext): |
Quellenangaben/Textzeugen
Liegen mehrere Textzeugen vor (bspw. Kopien, Durchschläge, Urschriften bei Telegrammen, Drucke als einzige Textzeugen), so werden diese in der Quellenbeshdreibung als <witness> einzeln erfasst.
Zusätzliche Materialien (z.B. angeklebte/geklammerte Zettel oder beiliegende abgefallene Zettel) können innerhalb von <accMat> beschrieben werden.
Die Quellenbeschreibung wird im Element <physDesc> abgelegt.
Die Quellenbeschreibung erfolgt durch die Verwendung der entsprechenden Elemente. Semantischen Elemente (<dimensions>, <height>) werden anstatt der generischen Variante (<dim>) verwendet.
<physDesc>
<objectDesc form='letter'>
<supportDesc>
<support>
<material function='copy.carbon'>Durchschlagpapier</material>
</support>
<extent>
<measure unit='folio'>1</measure>
<measure unit='pages' type='written'>1</measure>
<dimensions>
<height unit='mm' quantity='206'></height>
<width unit='mm' quantity='210'></width>
</dimensions>
</extent>
<condition>gelocht</condition>
</supportDesc>
<layoutDesc>
<layout>Datumsangabe rechts oben, dann links das Adressfeld</layout>
</layoutDesc>
</objectDesc>
</physDesc>
(Beispiel aus A040C872)
Erstveröffentlichungen und ggf. weitere Veröffentlichungen werden in <additional> in einer <biblList> angegeben.
<additional>
<listBibl>
<bibl key='A110107A'>Nr. 137, 17. Februar 1968</bibl>
<bibl key='A1100413'>S. 223f.</bibl>
</listBibl>
</additional>
(Beispiel aus A1000709)
Schreiber*innen (Hände)
Die Erfassung der Schreiber*innen (Hände) wird in <handNotes> vorgenommen. Das erste Element <handNote> definiert den Grundtyp der Schreibweise (Manuskript bzw. Typoskript). Ferner werden hier das Schreibmittel (@medium
), ggf. die Farbe (@hendi:color
) und (soweit identifizierbar) der/die Schreiber*in (@scribe
) angegeben.
<handNotes>
<handNote xml:id='hand.1' script='typescript'></handNote>
<handNote xml:id='hand.2' script='manuscript' scribe='A0002EA0'></handNote>
<handNote xml:id='hand.3' script='manuscript' medium='pen'></handNote>
<handNote xml:id='hand.4' script='manuscript' medium='pencil' hendi:color='blue'></handNote>
</handNotes>
(Beispiel aus A042C2A2)
Die ID-Vergabe erfolgt dokumentweise und folgt dem im Beispiel vorgeführten Schema ("hand\.\d+"
). Im Text kann mit dem Attribut @hand
eine Beziehung zur entsprechenden <handNote> hergestellt werden.
Beziehungen zwischen Texten/Dokumenten
Zu den Relationsverweisen siehe Grundstruktur des Textes, Umschläge und Schriftstücke.
Inhaltliche Auszeichnung
Personen
Bei der Auszeichnung von Personen ist zu unterscheiden, ob der Name einer Person explizit genannt wird oder eine Be- bzw. Umschreibung verwendet wird. Wird der Name explizit genannt, ist <persName> zu verwenden; bei einer (indirekten) Beschreibung einer Person wie „sein Bruder“, „die Ärtze“ oder „die Musiker“ ist <rs> mit der @type
-Klassifizierung "person"
oder "persons"
zu verwenden. Auszeichnungen von Personen sollten immer zur eindeutigen Bestimmung mit einem @key
verwendet werden. Werden mehrere Personen in einem Wort angesprochen, z. B. „Ehepaar Müller“, sind die IDs beider Personen in dem Element als Attributwerte (whitespace separated list) zu ergänzen. Achtung: Da die Personennamen dann nicht eindeutig sind wird in diesem Fall, trotz Namensnennung, <rs> verwendet. Nur in <rs> können ID-Listen innerhalb von @key
verwendet werden.
Bei biblischen oder mythologischen Namen wird <name> verwendet und jeweils präzisiert mit "myth"
oder "biblical"
. Ebenso werden Namen von dramatis personae (Rollen) aus Schauspielen oder Musiktheaterstücken, z. B. Elisabeth Zimmer, Dr. Wilhelm Reischmann (aus: „Elegie für junge Liebende“) mit "actingRole"
oder Figuren aus Prosatexten wie Wilhelm Meister mit "character"
spezifiziert
Weitere Namen
Geopolitische Namen werden direkt mit den zugehörigen Elementen <district>, <settlement>, <region>, <country>, <bloc> ausgezeichnet und mit einem @key
versehen. In dem zugehörigen Datensatz wird dann über „geoNames“ die Angabe präzisiert. Ortsangaben, die keine politische sondern geographische Einheiten bezeichnen, werden mit <geogName> und @type
codiert: z. B. forest, island, lake, mountain, river.
Es bleiben jedoch einige Namen, die mit <name> und einem Attribut (@type
) bestimmt werden müssen: vor allem Werke/Werktitel ("work"
oder "works"
) und Aufführungsorte ("venue"
). Gerade bei Theatern ist dabei sorgfältig zu unterscheiden, ob in dem Brief z. B. „Mailander Scala“ als Aufführungsort oder als Organisation angesprochen ist.
Die Nennung von Zeitschriften und Zeitungen wird ebenfalls mit <name> vorgenommen. Die Attributwerte für @type
sind in diesem Falle "journal"
und "newspaper"
. Bspw. <name type="newspaper">Juventud Rebelde<name>.1
Indirekte Angaben
Für alle indirekten Erwähnungen, nicht nur für Namen (s. o.), ist <rs> zu verwenden und mit Attributen zu präzisieren. Dies wird auch verwendet, um auf angesprochene postalische Dokumente zu verweisen wie z. B.: "dein letzter Brief". Anschließend folgt die ID des angesprochenen Gegenstandes als Wert von @key
. Die erlaubten Werte sind in der Elementdefinition von <rs> aufgeführt.
Datumsangaben
Alle Datumsangaben werden, damit sie prozessierbar werden, mit <date> ausgezeichnet und mit Hilfe eines Attributs in ein normiertes Datum (ISO) umgesetzt, z. B. wird 3. Januar 1956 als <date> ausgezeichnet mit @when="1956-01-03". Zeiträume werden in den Attributen @from
und @to
wiedergegeben, d. h. „zwischen dem 5. und 8. März 1958 werde ich bei Euch sein“ wird zu @from="1958-03-05" @to="1958-03-08". Ist nur ein ungefährer Zeitraum wie Ende März angegeben, so wird dies mit @notBefore="1958-03-20" @notAfter="1958-03-30" ausgezeichnet. Die Jahreszahl muss in jedem Fall ergänzt werden, auch wenn sie wie im letzten Beispiel im Text nicht genannt ist.
Datierungen
Die Datumsangabe in der in einem Brief üblichen <dateline> wird codiert wie alle anderen Daten. Wird ein Datum oder ein Teil davon erschlossen, so wird dieses Datum mit <supplied> als vom Herausgeber ergänzt markiert.
<dateline>Edinburgh Monday
<date when='1970-08-17'>17th August
<supplied>1970</supplied>
</date>
</dateline>
<dateline>
<date when='1958-01-03'>
<supplied>3. Januar 1958</supplied>
</date>
</dateline>
Die Verantwortlichkeit für die Ergänzung kann mit @resp
angegeben werden. Bei vollständiger Erschließung des Datums sollte eine Begründung in einer Anmerkung (<note>) festgehalten werden.
<dateline>
<supplied resp='IC'>
<date notBefore='1972-06-10' notAfter='1972-06-20'>Mitte Juni 1972</date>
</supplied>
</dateline><note resp='IC' type='commentary'>Die Datierung ergibt sich aus dem direkten Bezug Enzensberger auf die
<rs type='postals' key='A042BE54 A042BE67'>Briefe Henzes vom 5. Juni und 6. Juni 1972</rs>.
</note>
(Beispiel aus A040CB61)
In den Metadaten unter <correspAction> wird das erschlossene Datum „normal“ eingetragen, allerdings erhält das Element <date> dann ein Attribut @type
mit dem Wert "editor"
. Datumsangaben, die mit dem Wert "postal"
klassifiziert sind, gehen auf postalische Angaben wie Stempel oder Postvermerke zurück. Bei allen <date>-Angaben ohne spezifikation ist davon auszugehen, dass diese von der Quelle herrühren ("source"
). Da dies der Normalfall ist, wird er nur dann ausdrücklich codiert, wenn mehrere Datumsangaben vorliegen.
Einzelnachweise
- 1Dies gilt nicht für Zeitschriftentitel in bibliographischen Angaben. Vgl. .