Zur Codierung der Volltexte

Zur Codierung der Volltexte

Grundsätze der Textübertragung und -auszeichnung

Grundsätzlich werden alle Texte diplomatisch wiedergegeben (unter Einschluss der originalen Orthographie und Zeichensetzung). Außerdem wird der Originalzeilenfall dokumentiert.

Eine Anpassung von ’ss’ zu ’ß’, für welches bis 2020 im Deutschen kein Großbuchstabe exisitierte, wird jedoch nicht vollzogen. Diese Schritte dienen der Lesbarkeit und sind aus Vermittlungsgründen in die Edition eingeführt worden.

Typoskripte

Zahlreiche Briefe dieser Edition wurden mit der Schreibmaschine geschrieben (zur Vorliebe der Autoren vgl. die Beschreibung ihrer Schreibgewohnheiten) und kommt es hierdurch zu Doppelüberlieferungen, da beim Empfänger der abgeschickte Brief erhalten ist und bei dem Absender ggf. der aufgehobene Durchschlag. Diese Überlieferungseigenart (sehr selten gibt es auch Photokopien) wird in der Quellenbeschreibung erfasst. Die Übertragung folgt dem Original. Abweichungen werden ggf. in den Anmerkungen notiert.

Das Medium „Schreibmaschine“ hat einige Besonderheiten, auf die hier verwiesen werden muss.

Zeilenabstand: Der Zeilenabstand konnte in 5 Stufen, von halbem bis zum 2,5-fachen Zeilenabstand, eingestellt werden. Hierbei hat der sog. einzeilige Abstand bereits zwei Stufen. Um den Text eindeutig lesen zu können, war mindestens ein einzeiliger Abstand notwendig, doch wurde gelegentlich auch manuell der halbe Abstand eingestellt. Dies wurde einerseits dazu genutzt, Absätze von einander zu trennen (hier sind also nicht nur die sonst im Dokument genutzten Leerzeilen sondern auch Zwischenstufen möglich), andererseits um vergessene Worte mit der Maschine nachzutragen. Solche Einfügungen waren vor allem möglich, wenn der Grundzeilenabstand mindestens 1,5zeilig war, da dann durch die halbzeilige Versetzung ein anderes Wort leserlich eingefügt werden konnte.

Durch das Einspannen des Blatt Papiers entsteht oben und unten ein Rand von ca. 2cm, da das Blatt sonst nicht fest auf der Walze hielt. Oben wurde von diesem Rand selten abgewichen, doch konnte es vorkommen, dass die Schreibenden nicht bemerkten, dass das Blatt unten zu Ende ging und noch einmal eine Zeilenschaltung machten. Die dann entstehende Zeile war in der Regel nicht mehr gerade, sondern geriet immer weiter nach unten, da das Blatt immer weiter nach oben rutschte. Diese typographische Besonderheit wird nicht wiedergegeben, sondern in der <layoutDesc> beschrieben.

Streichungen: Um Worte zu tilgen hat sich bei der Schreibmaschine nicht der Bindestrich durchgesetzt, sondern es wurde der Buchstabe x verwendet. Diese Form wird mit dem Attribut @rend und den Werten "typedthrough" bzw. "overtyped" gekennzeichnet. Gelegentlich kommt es bei Streichungen von einzelnen Buchstaben vor, dass diese mit einem Schrägstrich / getilgt sind.

Autorkorrekturen: Kleine Fehler wie ein oder zwei falsche Buchstaben wurden häufig einfach überschrieben. Dies wird mit <subst> codiert. Im untergeordneten Element <del> wird vermerkt, dass die Buchstaben "overtyped" sind.

Buchstabenzusätze wie Akzente: Als Type waren auf den Maschinen der accent aigu (´) und der accent grave (`) vorhanden, aus diesen wurde der accent circonflexe (´` = ^) zusammengesetzt. Weitere Zeichen waren auf deutschen Maschinen nicht vorhanden und wurden deshalb weggelassen oder später handschriftlich ergänzt. Für die im Spanischen häufige Tilde wurde gelegentlich ein accent circonflexe gesetzt und für den französischen Cedille (ç) ein Komma in das c geschrieben.

Sonderzeichen: In anderen Sprachen übliche Zeichen wie ¡! bzw. ¿? im Spanischen sind auf fremdsprachigen Maschinen möglich. Auf deutschen Maschinen werden sie im allgemeinen ausgelassen. Gelegentlich findet sich allerdings ein Semikolon (;) als Ersatz für das anführende Exklamationszeichen (¡).

Fehlende Zeichen: Gegenüber heutigen Tastaturen fehlen auf verschiedenen Schreibmaschinen einige Zeichen. Besonders auffällig ist das Fehlen der Null, die durch ein O ersetzt wurde, wobei häufig ein kleines o verwendet wird. Auf anderen Maschinen fehlte dagegen die 1, die dann durch ein l (auch I) ersetzt wurde. Dies wird diplomatisch wiedergegeben.

Leerstellen: Da bei Schreibmaschinen die Buchstabenabstände eine feste Breite haben (Festbreitenschrift), lassen sich Lücken sehr genau bestimmen. Die diplomatische Übertragung gibt deshalb fehlende und überflüssige Leerzeichen wieder. Entsteht eine Lücke von zwei und mehr Zeichen wird diese als <space> codiert und die Zahl der Leerzeichen mit "quantity" angegeben.

Eine Lücke mit einem doppelten <space unit='chars' quantity='2'></space>Leerzeichen. 

Farbband: Für Schreibmaschinen gab es zweifarbige Farbbänder, im allgemeinen mit den Farben rot und schwarz. Wurde die Mehrfarbigkeit eingesetzt, so sind die einzelnen Farben in <handNote> beschrieben und die Wechsel im Dokument mit <handShift> codiert bzw. bei Einfügungen mit dem Attribut @hand verknpüft.

In Typoskripten werden (Zeilen-)Abstände abweichend von 1,0 in der <layoutDesc> beschrieben. In allen Dokumenten werden Standard-Einrückungen (erste Zeile eines Absatzes) in der <layoutDesc> angemerkt. Von der Regel abweichende Einschübe werden als <space> oder codiert. Fehlt ein regulär zu erwartender Einschub, wird dies ebenfalls vermerkt ().

Textstruktur

Die Struktur der Texte kann mit folgenden Elementen untergliedert werden:

<div>



<pb>

<cb>

<lb>

<table>

<list>

<item>

<lg>

<l>

Es folgen nur Erläuterungen zu einzelnen Gliederungspunkten, wenn die Verwendung in Henze-Digital Besonderheiten gegenüber der allgemeinen Verwendung in TEI aufweist.

Abschnitte (<div>)

In der Regel enthält ein Brief nur einen <div>. Ausnahmen sind Briefe, die von verschiedenen Personen geschrieben sind und Briefe, die eindeutig an verschiedenen Tagen (writingSessions) geschrieben sind. Beilagen wie Dokumente oder Rezensionen aber auch Umschläge werden getrennt erfasst, aber in dem Brief verlinkt.

Zur Verwendung von <div> bei komplexeren Strukturen siehe Telegramme

Absätze ()

Die grundsätzliche Gestaltung der Absätze wird in den Angaben zum Layout <layoutDesc> beschrieben: Zeilenabstand, Einzüge, Abstände, wobei die Angaben bei Typoskripten exakter sein können als bei handschriftlich überlieferten Dokumenten. Weicht ein Absatz davon ab, wird dies als Attribut in vermerkt. Für den Sondereinzug wird hierbei das <space> verwendet. Die Breite des Einzugs wird wie auch bei anderen Abständen in der Zahl der Buchstaben oder in relativen Abständen angegeben. Wird in der <layoutDesc> kein Einzug standardmäßig für die Absätze angegeben, beginnen Absätze ohne weitere Bezeichnung am linken Rand.

Zum Umgang mit Hervorhebungen im Text

Texthervorhebungen wie Unterstreichungen, Hochstellung, etc. im laufenden Text werden mit dem Element <hi> gekennzeichnet.

<hi>

Unterstreichungen: Einfache, doppelte oder mehrfache Unterstreichungen werden mit dem Element <hi> (highlighted) im Text vermerkt. Im Attribut @rend wird dabei einerseits die Tatsache, dass es sich um eine Unterstreichung handelt und ggf. im Attribut @n die Zahl der Striche angegeben (<hi rend="underline" n="3">). Sofern zusätzliche Binnenunterstreichungen gesetzt sind, werden diese geschachtelt angegeben und zur grundsätzlich vorhandenen Zahl der Striche addiert, d. h. ein innerhalb einer Doppelunterstreichung dreifach unterstrichenes Wort erhält zusätzlich die Binnenangabe <hi rend="underline" n="1">. Die Wiedergabe im angezeigten Text erfolgt zur Zeit nur mit einer Zahl von bis zu zwei Strichen.

In Telegrammen ist der Inhalt oft ausschließlich in Großbuchstaben bzw. Kleinbuchstaben abgedruckt. Dieser Umstand ist historisch-technisch bedingt. In der Edition werden Inhalte in ausschließlicher Großschreibung entsprechend der heute üblichen Groß- und Kleinschreibung übertragen. Damit diese Änderung transparent bleibt, sind diese Abschnitte mit <hi rend="capital"> ausgezeichnet. Sie werden im Onlineportal in Großbuchstaben angezeigt.

<hi rend='capital'>Dieser Text war in Grossbuchstaben abgedruckt</hi>

Zeichenebene

Trennstriche

Ein "normaler" Zeilenumbruch wird durch <lb> dargestellt. Ein Zeilenumbruch, der innerhalb eines Wortes vorkommt und durch einen Trennstrich orthographisch realisiert ist, wird mit <lb break="no"> codiert. Ein fehlender Trennstrich wird mit <lb break="no" rend="noHyphen"> codiert.

Abkürzungen <abbr>

Abkürzungen, die unverständlich bleiben und nicht z. B. mit Hilfe des Dudens aufgelöst werden können, werden entweder mit <supplied> ergänzt oder in ihrer originalen Form und zusätzlich als wahlweise aufzurufende Vollform wiedergegeben:

<choice> <abbr>bzgl.</abbr> <expan>bezüglich</expan> </choice><choice> <abbr>Sal:</abbr> <expan resp='editor'>Salzburg</expan> </choice><choice> <abbr>br.</abbr> <expan resp='editor'>bringe</expan> </choice> bitte was mit [...]

Schreibversehen

Schreibversehen (wie z. B. versehentliche Wortwiederholungen) werden in der Regel so übernommen und durch das Element <sic> markiert, um eine spätere irrtümliche Korrektur durch einen Editor zu verhindern. Dort, wo solche Schreibversehen zu Leseschwierigkeiten führen, kann in einem <choice>-Element neben der originalen Schreibung (<sic>) eine vom Editor angebotene Korrektur angeboten werden (mit Verweis auf die für den Vorschlag verantwortliche Person<corr resp="DR">).

Regularisierungen

Für Anpassungen, die eine Form der Regularisierung darstellen, sind die Elemente <orig> und <reg> zu verwenden. Auf diese Weise kann sowohl der originale Text bewahrt und gleichzeitig auch wahlweise eine „Lesefassung“ erzeugt werden.

Fremdsprachliche Textteile

In den Korrespondenzen von Henze und seinen Korrespondenzpartner*innen werden unterschiedliche Sprachen verwendet und immer wieder Wörter, Satzteile oder ganze Passagen in anderen Sprachen eingefügt. Die Grundsprache eines Briefes wird in den Metadaten angegeben, hiervon abweichende Sprachen werden mit <foreign> gekennzeichnet. Wenn es sich bei den verwendeten Sprachen um andere als deutsch und englisch handelt, kann eine Übersetzungshilfe beigegeben werden, vor allem wenn die Wortbedeutung nicht offensichtlich ist.

Das den fremdsprachlichen Anteil kennzeichnende Element <foreign> erhält hierzu eine @xml:id nach dem Muster "foreign.\d+". Die einzelnen Vorkommen werden dokumentweise durchgezählt. Im <notesStmt> werden die Übersetzungen hinterlegt und mit dem korrespondierenden Element im Text assoziiert.

Im Header:

<note type='translation' xml:lang='de' corresp='#foreign.1'>eine etwas melancholische Umarmung</note>

(Beispiel aus A040C964)

Im Body:

<foreign xml:lang='es' xml:id='foreign.1'>un abrazo un poco melancólico</foreign>


Dieses Vorgehen kann auch verwendet werden, um eine Übersetzungshilfe für einen Abschnitt (<seg>) oder einen ganzen Absatz () zu geben, bspw. in Telegrammen deren Grundsprache nicht eine der Editionssprachen ist. In diesen Fällen wird bzw. <seg> durch eine ID (@xml:id) nach dem Muster "sec.\d+" adressierbar gemacht. Die Anmerkung mit der Übersetzung ist nach obigem Vorbild analog anzulegen:

Im Header:

<note type='translation' resp='EM' xml:lang='de' corresp='#sec.1'>–Bitte teile mir so bald wie möglich mit, ob Du das Konzert in Zürich am 17. Oktober 1975 dirigieren kannst. Grüße – Paul Sacher</note>

(Beispiel aus A04200B0)

Im Body:

 <hi rend='capital'> <seg type='strip'>–Prego informarmi al <app> <lem wit='#wit.1'>piu</lem> <rdg wit='#wit.2'>più</rdg> </app> presto se puoi <app> <lem wit='#wit.1'>dirigere</lem> <rdg wit='#wit.2'>dirigente</rdg> </app> concerto <settlement key='A1303988'>Zurigo</settlement> <date when='1975-10-17'>17</date> </seg> <lb></lb> <seg type='strip'> <date when='1975-10-17'>ottobre 1975</date> saluti – <persName key='A00094F9'>Paul Sacher</persName> </seg> </hi> 


Bei Dokumenten, die gänzlich in Übersetzung vorliegen (z. B. Barnet/Henze, auf Spanisch verfasste Dokumente, vgl. auch Übersetzungen) sind diejenigen Passagen, die im Original bereits in der Zielsprache (meist Englisch) verfasst waren, mit <foreign xml:lang="en" source="original"> markiert.

Anführungszeichen

Die Verwendung von Anführungszeichen zur Hervorhebung einer Phrase ist von einem Zitat zu unterscheiden. Während das Element <q> lediglich die Anführungszeichen repräsentiert, markiert das Element <quote> ein Zitat. Im Rahmen der Edition werden Anführungzeichen durch die Verwendung dieser beiden Elemente ersetzt, sodass im codierten Text keine Symbole für Anführungszeichen enthalten sind. Damit aus inhaltlicher Sicht kein Defizit entsteht, werden Abweichungen "von der Norm" codiert.

Diese anzulegende Norm wird in mehreren Schritten definiert:

Sprache des Dokumentes

Schreibeigenheiten des/der Autors/Autorin

Eigenheiten des Dokumentes

Finden sich keine weiteren Angaben, so ist die Sprache des Dokumentes maßgebend. Das heißt, dass <q> oder <quote> doppelte Anführungszeichen in der definierten Sprache des Dokumentes repräsentieren. Sind Schreibeigenheiten der Verfassenden bekannt, die durch die Häufigkeit ihrer Verwendung eine Art Norm bilden, so haben diese Vorrang vor der Sprache des Dokumentes. Weist ein Dokument jedoch Eigenheiten auf, die innerhalb des Dokumentes als Standard anzusehen sind (bspw. die konsequente Verwendung von Sternchen als Anführungszeichen) haben diese die oberste Priorität.

Codiert werden immer nur Abweichungen von der jeweils geltenden Norm!

Die unterstützen Zeichen sind:

„[...]“ und ,[...]‘ (deutsch)

“[...]” und ‘[...]’ (englisch)

«[...]» und ‹[...]› (französisch)

Werden also keine näheren Angaben gemacht, stehen die Elemente <q> und <quote> stellvertretend für doppelte Anführungszeichen in der definierten Sprache des Dokumentes.

Dieser deutsche Satz enthält <q>doppelte</q> Zeichen. Dieser deutsche Satz enthält „doppelte“ Zeichen.

Handelt es sich um einfache Anführungszeichen, so ist das entsprechend zu codieren:

Dieser deutsche Satz enthält <q rend='single'>einfache</q> Zeichen. Dieser deutsche Satz enthält ,einfache‘ Zeichen.

Wenn Anführungszeichen einer anderen Sprache verwendet werden, dient das Attribut @xml:lang dazu diese Sprache zu definieren.

Dieser deutsche Satz <q xml:lang='fr'>enthält</q> französische Zeichen. 

Wenn die Zeichen ungleichmäßig voneinander abweichen, kann dies über eigens dafür definierte Attribute (@rendLeft, @rendRight) angegeben werden.

Dieser deutsche Satz <q rendRight='single'>enthält</q> solche Abweichungen. 

Auch der Fall, dass eines der beiden Zeichen oder beide fehlen, kann auf diese Art codiert werden. Für ein Fehlen wird der Wert "none" verwendet. Durch den Umstand, dass bei der Verwendung der Elemente <q> und <quote> ein Anfangs- und Endpunkt zwangsläufig definiert werden muss, kommt diese Form der Codierung einer editorischen Ergänzung gleich.

In diesem deutschen Satz <q rendRight='none'>fehlt</q> das rechte Anführungszeichen. 

Zum Hintergrund dieses Modells: Ziel der Edition ist es den Inhalt im Code adäquat abzubilden. Gleichzeitig ist auch die Vermittlung der Forschungsdaten ein wichtiger Aspekt. Ersteres ließe sich auch dadurch realisieren, dass die Anführungszeichen als Textzeichen in die Dateien eingegeben werden. Ein solches Vorgehen verwehrt jedoch die Möglichkeit eine Lesefassung anzubieten, in der z.B. sämtliche Zeichen normalisiert sein könnten. Um also eine Steuerung dieser Zeichen in der späteren Anzeige zu ermöglichen, ist es notwendig diese ansteuerbar zu machen. Gleichzeitig soll der Inhalt aber nicht defizitär werden, indem Rückschlüsse auf das Original (Diplomatik) nicht mehr möglich sind. Aus diesen Gründen werden die Anführungszeichen entsprechend auscodiert. Das Modell der Norm-Hierarchie bringt zwar eine weitere Ebene hinein, durch welche die Komplexität steigt, jedoch müssen dadurch nur wenige Stellen explizit codiert werden, nämlich die Abweichungen. In der Konstitution komplex, erleichtert dieses Modell die Erarbeitung der Edition.

Musiknotation

Sind in den Dokumente Notenbeispiele erhalten, so werden diese mit dem Element <notatedMusic> repräsentiert. Hierbei gibt es die Möglichkeit, dass innerhalb von <notatedMusic> eine Beschreibung (<desc>) angefertigt wird, was besonders bei abstrakter Notation zu Empfehlen ist.

<notatedMusic> <desc>drei 32stel auf einer Höhe gebalkt</desc> </notatedMusic>

(Beispiel aus A042BD62)

Alternativ kann ein Notenbeispiel als Bild eingebunden werden

<figure> <figDesc>Notenbeispiel 1</figDesc> <graphic url='A042D1E2_NB1.png' height='75px'></graphic> </figure>

(Beispiel aus A042D1E2)

Zukünftig sollen die Notenbeispiele in einer separaten MEI-Datei erfasst werden, auf die verwiesen wird.

Sonstige Symbole und Grafiken

Eingefügte Zeichnungen und Graphiken werden mit <figure> codiert und in der <figDesc> beschrieben.

Seitenzahlen

Ist auf einem Dokument eine Seitenzählung vorhanden, welche auf die Verfassenden zurückgeht, so wird diese mit <num> erfasst und mit dem Attribut @type als "page" klassifiziert.

Textkonstitution

Textkonstitutionelle Merkmale im Text werden mit den folgenden Elementen erfasst und beschrieben:

<del>

<add>

<subst>

<space>

<damage>

<gap>

<unclear>

Autoreigene Tilgungen

Das einfache Streichen von Worten oder Absätzen wird durch das Element <del> (deleted) gekennzeichnet. Die Form der Streichung sollte dabei durch das Attribut @rend (rendition) angegeben werden (in der Regel als <del rend="strikethrough"/>). Geschieht das Streichen als Sofort-Korrektur in der Zeile, genügt diese Kennzeichnung. Doppelte Durchstreichungen sind folgendermaßen zu codieren:

<del> <hi rend='strikethrough' n='2'>...</hi> </del>

Autoreigene Ergänzungen

Einfügungen, welche die Autor*innen (Schreiber*innen) nachträglich oder im Schreibvorgang vorgenommen haben, werden (sofern es sich nicht um Korrekturen durch Eingriffe in die ursprüngliche Substanz) handelt, mit dem Element <add> (addition) vermerkt. Dabei sollte der Ort der Einfügung mit Hilfe des Attributs @place bezeichnet werden. Als Attributwerte kommen dabei in Frage: "inline", "margin", "above" (the line), "below" (the line) oder "mixed". Stammen solche Einfügungen von anderer Hand, kann die Hand durch das Attribut @hand zugewiesen werden.

Hinweis: Einfügungen und Zusätze der Herausgebenden werden nie mit <add>, sondern stets mit <corr> oder <subst> vorgenommen.

Besonderheit „Randanmerkungen“: Es kommt vor, dass Hinzufügungen z. B. aus Platzgründen nicht im Fließtext sondern am Rand ausgeführt sind. Für die Edition wurden diese Randanmerkungen in den Text integriert und hervorgehoben. In der zugehörigen Anmerkung ist vermerkt, an welchem Rand sich die Hinzufügung im Original befindet.

Autoreigene Korrekturen

(siehe auch: Autoreigene Ergänzungen): Korrekturen, die die Autor*innen (Schreiber*innen) in ihrem Text vorgenommen haben, werden als Substitutionsprozess innerhalb des Elements <subst> dargestellt. Dieser Prozess besteht in der Regel aus zwei Teilen: dem Löschungsvorgang (durch Streichen, Überschreiben o. ä.) und der Ergänzung des neuen Textes (durch Einfügen, Überschreiben o. a.). Der Vorgang ist sowohl hinsichtlich der Art des Löschvorgangs als auch des Ortes, an dem der Ersatztext zu finden ist, näher zu beschreiben. Hinweis: Die Art und Weise der Streichung wird am Element <del> festgehalten, nicht an <subst>. Ist der ersetzte Text nicht zu entziffern, so wird dies innerhalb von <del> duch das Element <gap> ausgedrückt (das durch @unit und @quantity näher charakterisiert sein kann). Ein Ersetzungsvorgang, bei dem das Wort „wollte“ durch „musste“ überschrieben wurde, sieht daher in der Codierung wie folgt aus:

<subst> <del rend='overwritten'>wollte</del> <add place='inline'>musste</add> </subst>

Sind z. B. in Typoskripten notwendige Korrekturen, oft nachträglich, nur mit Korrekturzeichen angegeben (z. B. zu tauschende Buchstaben mit dem entsprechenden Korrekturzeichen) so wird dies in einer Anmerkung beschrieben.

Unleserliche Stellen/Beschädigungen

Hier sind zwei Fälle zu unterscheiden: 1. Wenn durch Wasserschäden, Lochungen oder sonstige äußere Einwirkungen (nicht aktives Eingreifen der Schreibenden in den Text!) Teile nicht lesbar sind, wird dies durch das Element <damage> gekennzeichnet. Dabei wird die Ursache der Lesebeeinträchtigung durch das Attribut @agent angegeben. Die Auszeichnung kann als bloße Kennzeichnung der „Schadenstatsache“ erfolgen oder aber unklare bzw. vom Herausgeber ergänzte Lesungen kennzeichnen.

An die<damage agent='water'> <unclear>ser roten</unclear> </damage> Stelle war etwas beschädigt.

Wenn die Ergänzung (<unclear> oder <supplied>) auf die Herausgebenden zurückgeht und, wie im vorstehenden Falle, etwas „nicht Selbstverständliches“ (zu letzterem gehören Ergänzungen einzelner Buchstaben) umfasst, sollte sich der Herausgebende als verantwortliche Person eintragen: @resp="EM". Komplett unlesbare Bereiche werde durch das Element <gap> gekennzeichnet, wobei der Vollständigkeit halber der Umfang mit den Attributen @unit und @quantity notiert werden kann (als Werte kommen z. B. "characters" in Frage). Die Entzifferungsprobleme können zusätzlich durch das Attribut @reason="illegible" vermerkt sein.

Unsichere Lesung

Alle nur aus Leseschwierigkeiten der Handschrift resultierenden Unklarheiten werden in das Element <unclear> eingeschlossen. Sofern mehrere Deutungsmöglichkeiten vorhanden sind, werden diese innerhalb des Elements <choice> zur Auswahl gestellt. In diesem Falle sollte bei den Einzellesungen das Element <unclear> durch ein Attribut @cert (certainty) ergänzt werden. Als Werte kommen dafür "high", "medium", "low" oder "unknown" in Frage. Durch das hinzugefügte Attribut @resp ist dabei der/die für diese Einschätzung verantwortliche Editor*in erkennbar.

Lesarten

Für Apparateinträge stehen folgende Elemente zur Verfügung:

<app>

<lem>

<rdg>

Während <app> als Container fungiert, markiert <lem> als Lemma die Textstelle, zu der es eine Abweichung gibt, und ergänzt mit <rdg> eine oder mehrere Lesarten. Der in <lem> hinterlegte Text, ist der in der Edition angezeigte Text, der ggf. von der Hauptquelle abweichen kann. Aus welcher Quelle der Text in <lem> stammt gibt das Attribut @wit wider.

<seg type='strip'>–Prego informarmi al <app> <lem wit='#wit.1'>piu</lem> <rdg wit='#wit.2'>più</rdg> </app> presto se puoi <app> <lem wit='#wit.1'>dirigere</lem> <rdg wit='#wit.2'>dirigente</rdg> </app> concerto <settlement key='A1303988'>Zurigo</settlement> <date when='1975-10-17'>17</date> </seg><lb></lb><seg type='strip'> <date when='1975-10-17'>ottobre 1975</date> saluti – <persName key='A00094F9'>Paul Sacher</persName> </seg>


Eingriffe der Herausgebenden

<supplied>

<choice>

<sic>

<corr>

<abbr>

<expan>

<note>

Ergänzungen der Herausgebenden

Gelegentlich kann es vorkommen, dass die Herausgebenden zum besseren Textverständnis einzelne fehlende Zeichen oder auch Zeichenfolgen bzw. Worte ergänzen müssen/möchten (wenn dies die Folge von Textverlusten ist, vgl. allerdings die Rubrik Unleserliche Stellen/Beschädigungen). Diese Ergänzungen werden mit dem Attribut @resp am Element <supplied> vorgenommen (Bsp.: heute kam Friedr<supplied resp="DR">i</supplied>ch). Alle auf diese Weise vorgenommenen Ergänzungen erscheinen im Text in eckigen Klammern.

Korrekturen der Herausgebenden

(sofern für das Verständnis zwingend): Es kommt vor, dass ganz offensichtlich Falsches zu Missverständnissen führt und besser korrigiert werden sollte. Zur Kennzeichnung der originalen Schreibung wird <sic> verwendet (das auch eingetragen werden kann, um die Tatsache eigenartiger Schreibungen hervorzuheben, damit in späteren Korrekturgängen an dieser Stelle nicht fälschlich ein Verschreiber des Übertragenden angenommen wird). Die Korrektur selbst kann dann durch <corr> angegeben werden und die Verantwortlichen sollten sich mit dem Attribut @resp zu erkennen geben. Das Ganze wird in ein <choice>-Element eingeschlossen, um eine wahlweise Darstellung zu ermöglichen.

Kommentare der Herausgebenden

Kommentare (<note>) sind grundsätzlich zu klassifizieren. Die folgende Liste gibt einen Überblick über die Klassifikation

Wert Beschreibung

"textConst" Text-Constitution (Textkonstitution)

"definition" Definition

"commentary" Commentary (Einzelstellenkommentar)

"editorial" Generalvermerk

"summary" Zusammenfassung/Regeste

"thematicCom" thematic Commentary (Erläuterungstext):

Quellenangaben/Textzeugen

<witness>

<accMat>

<physDesc>

<additional>

Liegen mehrere Textzeugen vor (bspw. Kopien, Durchschläge, Urschriften bei Telegrammen, Drucke als einzige Textzeugen), so werden diese in der Quellenbeshdreibung als <witness> einzeln erfasst.

Zusätzliche Materialien (z.B. angeklebte/geklammerte Zettel oder beiliegende abgefallene Zettel) können innerhalb von <accMat> beschrieben werden.

Die Quellenbeschreibung wird im Element <physDesc> abgelegt.

Die Quellenbeschreibung erfolgt durch die Verwendung der entsprechenden Elemente. Semantischen Elemente (<dimensions>, <height>) werden anstatt der generischen Variante (<dim>) verwendet.

<physDesc> <objectDesc form='letter'> <supportDesc> <support> <material function='copy.carbon'>Durchschlagpapier</material> </support> <extent> <measure unit='folio'>1</measure> <measure unit='pages' type='written'>1</measure> <dimensions> <height unit='mm' quantity='206'></height> <width unit='mm' quantity='210'></width> </dimensions> </extent> <condition>gelocht</condition> </supportDesc> <layoutDesc> <layout>Datumsangabe rechts oben, dann links das Adressfeld</layout> </layoutDesc> </objectDesc> </physDesc>


Erstveröffentlichungen und ggf. weitere Veröffentlichungen werden in <additional> in einer <biblList> angegeben.

<additional> <listBibl> <bibl key='A110107A'>Nr. 137, 17. Februar 1968</bibl> <bibl key='A1100413'>S. 223f.</bibl> </listBibl> </additional>

(Beispiel aus A1000709)

Schreiber*innen (Hände)

Die Erfassung der Schreiber*innen (Hände) wird in <handNotes> vorgenommen. Das erste Element <handNote> definiert den Grundtyp der Schreibweise (Manuskript bzw. Typoskript). Ferner werden hier das Schreibmittel (@medium), ggf. die Farbe (@hendi:color) und (soweit identifizierbar) der/die Schreiber*in (@scribe) angegeben.

<handNotes> <handNote xml:id='hand.1' script='typescript'></handNote> <handNote xml:id='hand.2' script='manuscript' scribe='A0002EA0'></handNote> <handNote xml:id='hand.3' script='manuscript' medium='pen'></handNote> <handNote xml:id='hand.4' script='manuscript' medium='pencil' hendi:color='blue'></handNote> </handNotes>

(Beispiel aus A042C2A2)

Die ID-Vergabe erfolgt dokumentweise und folgt dem im Beispiel vorgeführten Schema ("hand\.\d+"). Im Text kann mit dem Attribut @hand eine Beziehung zur entsprechenden <handNote> hergestellt werden.

Beziehungen zwischen Texten/Dokumenten

Zu den Relationsverweisen siehe Grundstruktur des Textes, Umschläge und Schriftstücke.

Inhaltliche Auszeichnung

<persName>

<placeName>

<rs>

<date>

Personen

Bei der Auszeichnung von Personen ist zu unterscheiden, ob der Name einer Person explizit genannt wird oder eine Be- bzw. Umschreibung verwendet wird. Wird der Name explizit genannt, ist <persName> zu verwenden; bei einer (indirekten) Beschreibung einer Person wie „sein Bruder“, „die Ärtze“ oder „die Musiker“ ist <rs> mit der @type-Klassifizierung "person" oder "persons" zu verwenden. Auszeichnungen von Personen sollten immer zur eindeutigen Bestimmung mit einem @key verwendet werden. Werden mehrere Personen in einem Wort angesprochen, z. B. „Ehepaar Müller“, sind die IDs beider Personen in dem Element als Attributwerte (whitespace separated list) zu ergänzen. Achtung: Da die Personennamen dann nicht eindeutig sind wird in diesem Fall, trotz Namensnennung, <rs> verwendet. Nur in <rs> können ID-Listen innerhalb von @key verwendet werden.

Bei biblischen oder mythologischen Namen wird <name> verwendet und jeweils präzisiert mit "myth" oder "biblical". Ebenso werden Namen von dramatis personae (Rollen) aus Schauspielen oder Musiktheaterstücken, z. B. Elisabeth Zimmer, Dr. Wilhelm Reischmann (aus: „Elegie für junge Liebende“) mit "actingRole" oder Figuren aus Prosatexten wie Wilhelm Meister mit "character" spezifiziert

Weitere Namen

Geopolitische Namen werden direkt mit den zugehörigen Elementen <district>, <settlement>, <region>, <country>, <bloc> ausgezeichnet und mit einem @key versehen. In dem zugehörigen Datensatz wird dann über „geoNames“ die Angabe präzisiert. Ortsangaben, die keine politische sondern geographische Einheiten bezeichnen, werden mit <geogName> und @type codiert: z. B. forest, island, lake, mountain, river.

Es bleiben jedoch einige Namen, die mit <name> und einem Attribut (@type) bestimmt werden müssen: vor allem Werke/Werktitel ("work" oder "works") und Aufführungsorte ("venue"). Gerade bei Theatern ist dabei sorgfältig zu unterscheiden, ob in dem Brief z. B. „Mailander Scala“ als Aufführungsort oder als Organisation angesprochen ist.

Die Nennung von Zeitschriften und Zeitungen wird ebenfalls mit <name> vorgenommen. Die Attributwerte für @type sind in diesem Falle "journal" und "newspaper". Bspw. <name type="newspaper">Juventud Rebelde<name>.1

Indirekte Angaben

Für alle indirekten Erwähnungen, nicht nur für Namen (s. o.), ist <rs> zu verwenden und mit Attributen zu präzisieren. Dies wird auch verwendet, um auf angesprochene postalische Dokumente zu verweisen wie z. B.: "dein letzter Brief". Anschließend folgt die ID des angesprochenen Gegenstandes als Wert von @key. Die erlaubten Werte sind in der Elementdefinition von <rs> aufgeführt.

Datumsangaben

Alle Datumsangaben werden, damit sie prozessierbar werden, mit <date> ausgezeichnet und mit Hilfe eines Attributs in ein normiertes Datum (ISO) umgesetzt, z. B. wird 3. Januar 1956 als <date> ausgezeichnet mit @when="1956-01-03". Zeiträume werden in den Attributen @from und @to wiedergegeben, d. h. „zwischen dem 5. und 8. März 1958 werde ich bei Euch sein“ wird zu @from="1958-03-05" @to="1958-03-08". Ist nur ein ungefährer Zeitraum wie Ende März angegeben, so wird dies mit @notBefore="1958-03-20" @notAfter="1958-03-30" ausgezeichnet. Die Jahreszahl muss in jedem Fall ergänzt werden, auch wenn sie wie im letzten Beispiel im Text nicht genannt ist.

Datierungen

Die Datumsangabe in der in einem Brief üblichen <dateline> wird codiert wie alle anderen Daten. Wird ein Datum oder ein Teil davon erschlossen, so wird dieses Datum mit <supplied> als vom Herausgeber ergänzt markiert.

<dateline>Edinburgh Monday <date when='1970-08-17'>17th August <supplied>1970</supplied> </date> </dateline>

<dateline> <date when='1958-01-03'> <supplied>3. Januar 1958</supplied> </date> </dateline>

Die Verantwortlichkeit für die Ergänzung kann mit @resp angegeben werden. Bei vollständiger Erschließung des Datums sollte eine Begründung in einer Anmerkung (<note>) festgehalten werden.

<dateline> <supplied resp='IC'> <date notBefore='1972-06-10' notAfter='1972-06-20'>Mitte Juni 1972</date> </supplied> </dateline><note resp='IC' type='commentary'>Die Datierung ergibt sich aus dem direkten Bezug Enzensberger auf die <rs type='postals' key='A042BE54 A042BE67'>Briefe Henzes vom 5. Juni und 6. Juni 1972</rs>. </note>

(Beispiel aus A040CB61)

In den Metadaten unter <correspAction> wird das erschlossene Datum „normal“ eingetragen, allerdings erhält das Element <date> dann ein Attribut @type mit dem Wert "editor". Datumsangaben, die mit dem Wert "postal" klassifiziert sind, gehen auf postalische Angaben wie Stempel oder Postvermerke zurück. Bei allen <date>-Angaben ohne spezifikation ist davon auszugehen, dass diese von der Quelle herrühren ("source"). Da dies der Normalfall ist, wird er nur dann ausdrücklich codiert, wenn mehrere Datumsangaben vorliegen.

Einzelnachweise

1Dies gilt nicht für Zeitschriftentitel in bibliographischen Angaben. Vgl. .

Wert	Beschreibung
`"textConst"`	Text-Constitution (Textkonstitution)
`"definition"`	Definition
`"commentary"`	Commentary (Einzelstellenkommentar)
`"editorial"`	Generalvermerk
`"summary"`	Zusammenfassung/Regeste
`"thematicCom"`	thematic Commentary (Erläuterungstext):

Zur Codierung der Volltexte

Dokument

Inhaltsverzeichnis

Text

Anhang

Zur Codierung der Volltexte

Grundsätze der Textübertragung und -auszeichnung

Typoskripte

Textstruktur

Abschnitte (<div>)

Absätze (<p>)

Zum Umgang mit Hervorhebungen im Text

Zeichenebene

Trennstriche

Abkürzungen <abbr>

Schreibversehen

Regularisierungen

Fremdsprachliche Textteile

Anführungszeichen

Musiknotation

Sonstige Symbole und Grafiken

Seitenzahlen

Textkonstitution

Autoreigene Tilgungen

Autoreigene Ergänzungen

Autoreigene Korrekturen

Unleserliche Stellen/Beschädigungen

Unsichere Lesung

Lesarten

Eingriffe der Herausgebenden

Ergänzungen der Herausgebenden

Korrekturen der Herausgebenden

Kommentare der Herausgebenden

Quellenangaben/Textzeugen

Schreiber*innen (Hände)

Beziehungen zwischen Texten/Dokumenten

Inhaltliche Auszeichnung

Personen

Weitere Namen

Indirekte Angaben

Datumsangaben

Datierungen

Einzelnachweise

XML

Loading … 1