Zur Codierung der Volltexte

Zurück

Text

Anhang

Zur Codierung der Volltexte

Grundsätze der Textübertragung und -auszeichnung

Grundsätzlich werden alle Texte diplomatisch wiedergegeben (unter Einschluss der originalen Orthographie und Zeichensetzung). Außerdem wird der Originalzeilenfall dokumentiert.

Einen Sonderfall stellen die Telegramme dar, die ihre Inhalte stets in Großbuchstaben wiedergeben. Dieser Umstand ist historisch-technisch bedingt. In diesen Fällen, also dass Groß- und Kleinschreibung aufgrund äußerer Einflüsse historisch nicht beachtet werden konnte, werden die Inhalte entsprechend der heute üblichen Groß- und Kleinschreibung übertragen. Damit diese Änderung transparent bleibt, sind sämtliche übertragene Abschnitte mit einem entsprechenden Markup ausgezeichnet. Eine Anpassung von ’ss’ zu ’ß’, für welches bis 2020 im Deutschen kein Großbuchstabe exisitierte, wird jedoch nicht vollzogen. Diese Schritte dienen der Lesbarkeit und sind aus Vermittlungsgründen in die Edition eingeführt worden.

<hi rend='capital'>Dieser Text war in Grossbuchstaben abgedruckt</hi>

Typoskripte

Ungefähr die Hälfte der Briefe dieser Edition wurden mit der Schreibmaschine geschrieben (zur Vorliebe der Autoren vgl. die Beschreibung ihrer Schreibgewohnheiten) und kommt es hierdurch gelegentlich zu Doppelüberlieferungen, da an der einen Stelle der abgeschickte Brief erhalten ist und an anderer Stelle der ev. aufgehobene Durchschlag. Diese Überlieferungseigenart (sehr selten gibt es auch Photokopien) wird in der Quellenbeschreibung erfasst. Die Übertragung folgt dem Original.

Das Medium „Schreibmaschine“ hat einige Besonderheiten, auf die hier verwiesen werden muss.

Zeilenabstand: Der Zeilenabstand konnte fest eingestellt werden von halbem bis 2,5fachen (?) Zeilenabstand, also in 5 Stufen. Hierbei hat der sog. einfache Abstand bereits zwei Stufen. Um den Text eindeutig lesen zu können, war mindestens ein einzeiliger Abstand notwendig, doch wurde gelegentlich auch manuell der halbe Abstand eingestellt. Dies wurde einerseits dazu genutzt, Absätze von einander zu trennen (hier sind also nicht nur die sonst im Dokument genutzten Leerzeilen sondern auch Zwischenstufen möglich), andererseits um vergessene Worte mit der Maschine nachzutragen. solche Einfügungen waren vor allem möglich, wenn der Grundzeilenabstand größer als 1,5 war, da dann durch die halbzeilige Versetzung ein anderes Wort leserlich eingefügt werden konnte.

Durch das Einspannen des Blatt Papiers entsteht oben und unten ein Rand von ca. 2cm, da das Blatt sonst nicht fest auf der Walze hielt. Oben wurde von diesem Rand selten abgewichen, doch konnte es vorkommen, dass der Schreiber nicht merkte, dass das Blatt unten zu Ende ging und noch einmal eine Zeilenschaltung machte. Die dann entstehende Zeile war in der Regel nicht mehr gerade, sondern das Blatt rutschte immer weiter nach oben, so dass die letzte Zeile immer weiter nach unten geriet. Diese typographische Besonderheit wird nicht wiedergegeben, sondern nur in der <layoutDesc> beschrieben.

Streichungen: Um Worte zu tilgen hat sich bei der Schreibmaschine nicht der Bindestrich durchgesetzt, sondern wurde der Buchstabe x verwendet. Diese Form wird mit dem Attribut @typedthrough bzw. @overtyped gekennzeichnet. Gelegentlich kommt es vor allem bei Streichungen von einzelnen Buchstaben vor, dass diese mit einem Schrägstrich / getilgt sind.

Autorkorrekturen: kleine Fehler wie ein oder zwei falsche Buchstaben wurden häufig einfach überschrieben. Dies wird mit <subst> codiert und im <del> wird vermerkt, dass die Buchstaben overtyped sind.

Buchstabenzusätze wie Akzente: als Type waren auf den Maschinen der accent aigu ´ und der accent grave ` vorhanden, aus diesen wurde der accent circonflexe zusammengesetzt. Weitere Zeichen waren auf deutschen Maschinen nicht vorhanden und wurden deshalb weggelassen oder später handschriftlich ergänzt. Für die im Spanischen häufige Tilde wurde gelegentlich ein accent circonflexe gesetzt und für den Strich im c ein Komma in das c geschrieben.

Sonderzeichen: In anderen Sprachen übliche Zeichen wie ¡! ¿? sind auf fremdsprachigen Maschinen möglich. Auf deutschen Maschinen werden sie im allgemeinen ausgelassen. Gelegentlich findet sich allerdings ein ; als Ersatz für ¡.

Fehlende Zeichen: Gegenüber heutigen Tastaturen fehlen auf Schreibmaschinen einige Zeichen. Besonders auffällig ist das Fehlen der Null 0, die durch ein O ersetzt wurde, wobei häufig ein kleines o verwendet wird. Auf anderen Maschinen fehlte dagegen die 1, die dann durch ein l ersetzt wurde. Dies wird diplomatisch wiedergegeben.

Leerstellen: Da bei Schreibmaschinen die Buchstabenabstände eine feste Breite haben (Festbreitenschrift), lassen sich Lücken sehr genau bestimmen. Die diplomatische Übertragung gibt deshalb fehlende und überflüssige Leerzeichen wieder. Entsteht eine Lücke von zwei und mehr Zeichen wird diese als <space> codiert und die Zahl der Leerzeichen mit @n angegeben.

<p>Eine Lücke mit einem doppelten 
   <space unit='chars' quantity='2'></space>Leerzeichen.
</p>

Farbband: Für Schreibmaschinen gab es zweifarbige Farbbänder, im allgemeinen mit den Farben rot und schwarz. Wurde die Mehrfarbigkeit eingesetzt, so ist dies in <handNote> beschrieben und wird dies im Dokument mit <handShift> codiert.

In Typoskripten werden (Zeilen-)Abstände abweichend von 1,0 in der <layoutDesc> beschrieben. In allen Dokumenten werden Standard-Einrückungen (erste Zeile eines Absatzes) in der <layoutDesc> angemerkt. Von der Regel abweichende Einschübe werden als <space> oder <p>codiert.

Textstruktur

Die Struktur der Texte kann mit folgenden Elementen untergliedert werden:

Es folgen nur Erläuterungen zu einzelnen Gliederungspunkten, wenn die Verwendung in Henze-Digital Besonderheiten gegenüber der allgemeinen Verwendung in TEI aufweist.

Abschnitte <div>

In der Regel enthält ein Brief nur einen <div>. Ausnahmen sind Briefe, die von verschiedenen Personen geschrieben sind, und Briefe, die eindeutig an verschiedenen Tagen (writingSessions) geschrieben sind. Beilagen wie Dokumente oder Rezensionen aber auch Umschläge werden getrennt erfasst, aber in dem Brief verlinkt.

Absätze <p>

Die grundsätzliche Gestaltung der Absätze wird in den Angaben zum Layout <layoutDesc> beschrieben: Zeilenabstand, Einzüge, Abstände, wobei die Angaben bei Typoskripten exakter sein können als bei handschriftlich überlieferten Dokumenten. Weicht ein Absatz davon ab, wird dies als Attribut in <p> vermerkt. Für den Einzug wird hierbei das <space> verwendet. Die Breite des Einzugs wird wie auch bei anderen Abständen in der Zahl der Buchstaben oder in Abständen von ca. 2cm angegeben. Wird in der <layoutDesc> kein Einzug standardmäßig für die Absätze angegeben, beginnen Absätze ohne weiteres Attribut am linken Rand.

Zum Umgang mit Hervorhebungen im Text

Texthervorhebungen wie Unterstreichungen, Hochstellung, etc. im laufenden Text werden mit dem Element <hi> gekennzeichnet.

Unterstreichungen: Einfache, doppelte oder mehrfache Unterstreichungen werden mit dem Element (highlighted) im Text vermerkt. Als Attribute werden dabei einerseits die Tatsache der Unterstreichung und die Zahl der Striche angegeben. @rend="underline" n="3". Sofern zusätzliche Binnenunterstreichungen gesetzt sind, werden diese geschachtelt angegeben und zur grundsätzlich vorhandenen Zahl der Striche addiert, d. h. ein innerhalb einer Doppelunterstreichung dreifach unterstrichenes Wort erhält zusätzlich die Binnenangabe @rend="underline" n="1". Die Wiedergabe im angezeigten Text erfolgt zur Zeit nur mit einer Zahl von bis zu zwei Strichen.

Zeichenebene

Trennstriche

Ein "normaler" Zeilenumbruch wird durch lb dargestellt. Ein Zeilenumbruch, der innerhalb eines Wortes vorlommt und durch einen Trennstrich orthographisch realisiert ist, wird mit lb break="no" codiert. Ein vergessener Trennstrich wird mit <lb break="no" rend="noHyphen"> codiert!

Abkürzungen <abbr>

Abkürzungen, die unverständlich bleiben und sich nicht durch bloße Ergänzung auflösen lassen, werden in ihrer originalen Form und zusätzlich als wahlweise aufzurufende Vollform wiedergegeben:

<choice>
   <abbr>bzgl.</abbr>
   <expan>bezüglich</expan>
</choice><choice>
   <abbr>Sal:</abbr>
   <expan resp='editor'>Salzburg</expan>
</choice>
				[...]
				<choice>
   <abbr>br.</abbr>
   <expan resp='editor'>bringe</expan>
</choice>
				bitte was mit [...] 
			

Schreibversehen

Schreibversehen (wie z. B. versehentliche Wortwiederholungen) werden in der Regel so übernommen und durch das Element <sic> markiert, um eine spätere irrtümliche Korrektur durch einen Editor zu verhindern. Dort, wo solche Schreibversehen zu Leseschwierigkeiten führen, kann in einem <choice>-Element neben der originalen Schreibung (<sic> oder <orig>) eine vom Editor angebotene Korrektur angeboten werden (mit <corr resp="XY">.

Fremdsprachliche Textteile

In den Korrespondenzen von Henze und seinen Korrespondenzpartner*innen werden unterschiedliche Sprachen verwendet und immer wieder Wörter, Satzteile oder ganze Passagen in anderen Sprachen eingefügt. Die Grundsprache eines Briefes wird in den Metadaten angegeben, hiervon abweichende Sprachen werden mit <foreign> gekennzeichnet. Wenn es sich bei den verwendeten Sprachen um andere als deutsch und englisch handelt, so wird eine Übersetzungshilfe beigegeben.

Das den fremdsprachlichen Anteil kennzeichnende Element <foreign> erhält hierzu eine @xml:id nach dem Muster "foreign.\d+". Die einzelnen Vorkommen werden dokumentweise durchgezählt. Im <notesStmt> werden die Übersetzungen hinterlegt und mit dem correspondierenden Element im Text assoziiert.

<note type='translation' xml:lang='de' corresp='#foreign.1'>eine etwas melancholische Umarmung</note><foreign xml:lang='es' xml:id='foreign.1'>un abrazo un poco melancólico</foreign>

(Beispiel aus A040C964)

Bei Dokumenten, die in Übersetzung vorliegen (z. B. Barnet/Henze, auf Spansich verfasste Dokumente) sind diejenigen Passagen, die im Original bereits in der Zielsprache (meist Englisch) verfasst waren, mit <foreign xml:lang="en" source="original"> markiert.

Anführungszeichen

Die Verwendung von Anführungszeichen zur Hervorhebung einer Phrase ist von einem Zitat zu unterscheiden. Während das Element <q> lediglich die Anführungszeichen repräsentiert, markiert das Element <quote> ein Zitat. Im Rahmen der Edition werden Anführungzeichen durch die Verwendung dieser beiden Elemente ersetzt, sodass im codierten Text keine Anführungszeichen enthalten sind. Damit aus inhaltlicher Sicht kein Defizit entsteht, werden Abweichungen "von der Norm" codiert.

Diese anzulegende Norm wird in mehreren Schritten definiert:

  • Sprache des Dokumentes
  • Schreibeigenheiten des Autors
  • Eigenheiten des Dokumentes

Finden sich keine weiteren Angaben, so ist die Sprache des Dokumentes maßgebend. Das heißt, dass <q> oder <quote> doppelte Anführungszeichen in der definierten Sprache des Dokumentes darstellen. Sind Schreibeigenheiten des Autors bekannt, die durch die Häufigkeit ihrer Verwendung eine Art Norm bilden, so haben diese Vorrang vor der Sprache des Dokumentes. Weist ein Dokument jedoch Eigenheiten auf, die innerhalb des Dokumentes als Standard anzusehen sind (bspw. die konsequente Verwendung von Sternchen als Anführungszeichen) haben diese die oberste Priorität.

Codiert werden immer nur Abweichungen von der jeweils geltenden Norm!

Die unterstützen Zeichen sind:

  • „[...]“ und ,[...]‘ (deutsch)
  • “[...]” und ‘[...]’ (englisch)
  • «[...]» und ‹[...]› (französisch)

Werden also keine näheren Angaben gemacht, stehen die Elemente <q> und <quote> stellvertretend für doppelte Anführungszeichen in der definierten Sprache des Dokumentes.

<p>Dieser deutsche Satz 
   <q>enthält</q> doppelte Zeichen.
</p>

Handelt es sich um einfache Anführungszeichen, so ist das entsprechend zu codieren:

<p>Dieser deutsche Satz 
   <q rend='single'>enthält</q> einfache Zeichen.
</p>

Wenn Anführungszeichen einer anderen Sprache verwendet werden, dient das Attribut @xml:lang dazu diese Sprache zu definieren.

<p>Dieser deutsche Satz 
   <q xml:lang='fr'>enthält</q> französische Zeichen.
</p>

Wenn die Zeichen ungleichmäßig voneinander abweichen, kann dies über eigens dafür definierte Attribute (@rendLeft, @rendRight) angegeben werden.

<p>Dieser deutsche Satz 
   <q rendRight='single'>enthält</q> solche Abweichungen.
</p>

Auch der Fall, dass eines der beiden Zeichen oder beide fehlen kann auf diese Art codiert werden. Für ein Fehlen wird der Wert "none" verwendet. Durch den Umstand, dass bei der Verwendung der Elemente <q> und <quote> ein Anfangs- und Endpunkt zwangsläufig definiert werden muss, kommt diese Form der Codierung einer editorischen Ergänzung gleich.

<p>In diesem deutschen Satz 
   <q rendRight='none'>fehlt</q> das rechte Anführungszeichen.
</p>

Zum Hintergrund dieses Modells: Ziel der Edition ist es den Inhalt im Code adäquat abzubilden. Gleichzeitig ist auch die Vermittlung der Forschungsdaten ein wichtiger Aspekt. Ersteres ließe sich auch dadurch realisieren, dass die Anführungszeichen als Textzeichen in die Dateien eingegeben werden. Ein solches Vorgehen verwehrt jedoch die Möglichkeit eine Lesefassung anzubieten, in der z.B. sämtliche Zeichen normalisiert sein könnten. Um also eine Steuerung dieser Zeichen in der späteren Anzeige zu ermöglichen, ist es notwendig diese ansteuerbar zu machen. Gleichzeitig soll der Inhalt aber nicht dadurch defizitär werden, dass Rückschlüsse auf das Original (Diplomatik) nicht mehr möglich sind. Aus diesen Gründen werden die Anführungszeichen entsprechend auscodiert. Das Modell der Norm-Hierarchie bringt zwar eine weitere Ebene hinein, durch welche die Komplexität weiter steigt, jedoch müssen dadurch nur wenige Stellen explizit codiert werden, nämlich die Abweichungen. In der Konstitution komplex, erleichtert dieses Modell die Erarbeitung der Edition.

Musiknotation

Sind in den Dokumente Notenbeispiele erhalten, so werden sie innerhalb des Elements <notatedMusic> als MEI-Datei eingefügt.

Sonstige Symbole und Grafiken

Eingefügte Zeichnungen und Graphiken werden mit <figure> codiert und in der <figDesc> beschrieben.

Seitenzahlen

Ist auf einem Dokument eine Seitenzählung vorhanden, die von einem Autor hinzugefügt wurde, so wird diese mit <num> erfasst und mit @type als "page" klassifiziert.

Textkonstitution

Textkonstitutionelle Merkmale im Text werden mit den folgenden Elementen erfasst und beschrieben:

Autoreigene Tilgungen

Das einfache Streichen von Worten oder Absätzen wird durch das Element <del> (deleted) gekennzeichnet, die Form der Streichung sollte dabei durch das Attribut @rend (rendition) angegeben werden (in der Regel als <del rend="strikethrough"/>). Geschieht das Streichen und Ersetzen als ad-hoc-Korrektur in der Zeile, genügt diese Kennzeichnung und es muss kein Substitutionsvorgang bezeichnet werden. Doppelte Durchstreichungen sind folgendermaßen zu codieren:

<del>
   <hi rend='strikethrough' n='2'>...</hi>
</del>

Autoreigene Ergänzungen

Einfügungen, die der Autor (Schreiber) nachträglich oder im Schreibvorgang vorgenommen hat, werden (sofern es sich nicht um Korrekturen durch Eingriffe in die ursprüngliche Substanz) handelt, mit dem Element <add> (addition) vermerkt. Dabei sollte der Ort der Einfügung mit Hilfe des Attributs @place bezeichnet werden. Als Attributwerte kommen dabei in Frage: „inline“, „margin“, „above“ (the line), „below“ (the line) oder „mixed“. Stammen solche Einfügungen von anderer Hand, kann dies im Attribut @hand ausgewiesen werden. Hinweis: Einfügungen und Zusätze des Herausgebers werden nie mit <add>, sondern mit <corr> oder <subst> vorgenommen!

Besonderheit „Randanmerkungen“: Es kommt vor, dass Hinzufügungen z. B. aus Platzgründen nicht im Fließtext sondern am Rand ausgeführt sind. In der Edition wurden diese Randanmerkungen in den Text integriert und hervorgehoben. In der zugehörigen Anmerkung ist vermerkt an welchem Rand sich die Hinzufügung im Original befindet.

Autoreigene Korrekturen

(siehe auch: Autoreigene Ergänzungen): Korrekturen, die der Autor (Schreiber) in seinem Text vorgenommen hat, werden als Substitutionsprozess innerhalb des Elements <subst> dargestellt. Dieser Prozess besteht in der Regel aus zwei Teilen: dem Löschungsvorgang (durch Streichen, Überschreiben o. ä.) und der Ergänzung des neuen Textes (durch Einfügen, Überschreiben o. a.). Der Vorgang ist sowohl hinsichtlich der Art des Löschvorgangs als auch des Ortes, an dem der Ersatztext zu finden ist, näher zu beschreiben. Hinweis: Die Art und Weise der Streichung wird am Element <del> festgehalten, nicht an <subst>. Ist der ersetzte Text nicht zu entziffern, so wird innerhalb des Elements <del> ein Element <gap> angegeben (das durch @unit und @quantity näher charakterisiert sein kann). Ein Ersetzungsvorgang, bei dem das Wort „wollte“ durch „musste“ überschrieben wurde, sieht daher in der Codierung wie folgt aus:

<subst>
   <del rend='overwritten'>wollte</del>
   <add place='inline'>musste</add>
</subst>

Sind z. B. in Typoskripten notwendige Korrekturen, oft nachträglich, nur mit Korrekturzeichen angegeben (z. B. zu tauschende Buchstaben mit dem entsprechenden Korrekturzeichen) so wird dies in einer Anmerkung beschrieben.

Unleserliche Stellen

Hier sind zwei Möglichkeiten zu unterscheiden: 1. Wenn durch Wasserschäden, Siegelloch oder sonstige äußere Einwirkungen (nicht aktives Eingreifen des Schreibers in den Text!) Teile nicht lesbar sind, wird dies durch das Element <damage> gekennzeichnet. Dabei wird die Ursache der Lesebeeinträchtigung durch das Attribut @agent angegeben. Die Auszeichnung kann als bloße Kennzeichnung der „Schadenstatsache“ erfolgen oder aber unklare bzw. vom Herausgeber ergänzte Lesungen kennzeichnen.


					An die<damage agent='water'>
   <unclear>ser roten</unclear>
</damage> Stelle war etwas beschädigt&quot;).
				

Wenn die Ergänzung auf den Hg. zurückgeht und, wie im vorstehenden Falle, etwas „nicht Selbstverständliches“ (zu letzterem gehören Ergänzungen einzelner Buchstaben) umfasst, sollte sich der Hg. als Verantwortlicher eintragen: @resp="EM". Komplett unlesbare Bereiche werde durch das Element […] gekennzeichnet, wobei der Vollständigkeit halber der Umfang mit den Attributen @unit und @quantity notiert werden kann (als Werte kommen z. B. „characters“ in Frage), die Entzifferungsprobleme können zusätzlich durch das Attribut @reason="illegible" vermerkt sein.

Unsichere Lesung

Alle nur aus Leseschwierigkeiten der Handschrift resultierenden Unklarheiten werden in das Element <unclear> eingeschlossen. Sofern mehrere Deutungsmöglichkeiten vorhanden sind, werden diese innerhalb des Elements <choice> zur Auswahl gestellt. In diesem Falle sollte bei den Einzellesungen das Element <unclear> durch ein Attribut @cert (certainty) ergänzt werden. Als Werte kommen dafür „"high"“, „"medium"“, „"low"“ oder „"unknown"“ in Frage. Durch das hinzugefügte Attribut @resp ist dabei der für diese Einschätzung verantwortliche Editor erkennbar.

Beschädigungen

Ist eine Quelle beschädigt, so wird die entsprechende Stelle mit <damage> markiert. Die Art der Beschädigung wird durch das Attribut @agent klassifiziert. Im Falle, dass eine Ergänzung durch die herausgebenden vorgenommen wurde, ist diese als <supplied> innerhalb des <damage>-Elements zu codieren. Die Darstellung im Online-Portal erfolgt dann durch eckige Klammern.

<damage agent='punch'>
   <supplied resp='EM'>bec</supplied>
</damage>ause
			

(Beispiel aus A04145F1)

Eingriffe der Herausgebenden

Ergänzungen der Herausgebenden

Gelegentlich kann es vorkommen, dass der Autor zum besseren Textverständnis einzelne fehlende Zeichen oder auch Zeichenfolgen bzw. Worte ergänzen muss/möchte (wenn dies die Folge von Textverlusten ist, vgl. allerdings die Rubrik „Unleserliches 1“). Diese Ergänzungen werden mit dem Attribut @resp innerhalb von <supplied> vorgenommen (Bsp.: heute kam Friedr<supplied resp="editor">i</supplied>ch). Alle auf diese Weise vorgenommenen Ergänzungen erscheinen z.Zt. im Text in eckigen Klammern.

Korrekturen der Herausgebenden

(sofern für das Verständnis zwingend): Es kommt vor, dass ganz offensichtlich Falsches zu Missverständnissen führt und besser korrigiert werden sollte. Zur Kennzeichnung der originalen Schreibung wird nun ein <sic>-Element verwendet (das auch eingetragen werden kann, um die Tatsache eigenartiger Schreibungen hervorzuheben, damit in späteren Korrekturgängen an dieser Stelle nicht fälschlich ein Verschreiber des Übertragenden angenommen wird). Die Korrektur selbst kann dann durch <corr> angegeben werden und der Urheber sollte sich als Verantwortlicher (@resp="IC") eintragen. Das Ganze wird in ein <choice>-Element eingeschlossen, um eine wahlweise Darstellung zu ermöglichen.

Kommentare der Herausgebenden

<note @attribut>
@textConst text-Constitution (Textkonstitution):
@definition Definition:
@part
@commentary Commentary (Einzelstellenkommentar)
@editorial
@summary
@thematicCom thematic Commentary (Themenkommentar):

Quellenangaben/Textzeugen

Schreiber*innen (Hände)

Sie Erfassung der Schreiber*innen (Hände) wird in <handNotes> vorgenommen. Das erste Element <handNote> definiert den Grundtyp der Schreibweise (Manuskript bzw. Typoskript). Ferner werden hier das Schreibmittel (@medium), ggf. die Farbe (@hendi:color) und (soweit identifizierbar) der/die Schreiber*in (@scribe) angegeben.

<handNotes>
   <handNote xml:id='hand.1' script='typescript'></handNote>
   <handNote xml:id='hand.2' script='manuscript' scribe='A0002EA0'></handNote>
   <handNote xml:id='hand.3' script='manuscript' medium='pen'></handNote>
   <handNote xml:id='hand.4' script='manuscript' medium='pencil' hendi:color='blue'></handNote>
</handNotes>

(Beispiel aus A042C2A2)

Die ID-Vergabe erfolgt dokumentweise und folgt dem im Beispiel vorgeführten Schema. Im Text kann mit dem Attribut @hand eine Beziehung zur entsprechenden <handNote> hergestellt werden.

Beziehungen zwischen Texten/Dokumenten

Briefkontexte, Entwürfe, mehrteilige Schriften, floatingText

Zu den Relationsverweisen siehe Grundstruktur des Textes, Umschläge und Schriftstücke.

Inhaltliche Auszeichnung

Personen

In der Auszeichnung von Personen ist zu unterscheiden, ob der Name einer Person genannt wird oder eine Be- bzw. Umschreibung. Wird der Name genannt, ist <persName> zu verwenden, gibt es nur eine (indirekte) Beschreibung einer Person wie „sein Bruder“, „die Ärtze“ oder „die Musiker“, so ist <rs> mit dem @person oder @persons zu verwenden. Auszeichnungen von Personen sollten immer zur eindeutigen Bestimmung mit Hilfe eines @key verwendet werden. Werden mehrere Personen in einem Wort angesprochen, z. B. Ehepaar Müller, sind die keys beider Personen in dem Element als Attribut zu ergänzen. Achtung: da der Personennamen dann nicht eindeutig ist wird in diesem Fall, trotz Namensnennung, <rs> verwendet. Nur in <rs> können mehrere keys gesetzt werden.

Bei biblischen oder mythologischen Namen wird <name> verwendet und jeweils präzisiert mit @myth oder @biblical. Ebenso werden Namen von dramatis personae (Rollen) aus Schauspielen oder Musiktheaterstücken, z. B. Elisabeth Zimmer, Dr. Wilhelm Reischmann (aus: „Elegie für junge Liebende“) mit @actingRole oder Figuren aus Prosatexten wie Wilhelm Meister mit @character spezifiziert

weitere Namen

Geopolitische Namen werden direkt mit den zugehörigen Elementen <district>, <settlement>, <region>, <country>, <bloc> ausgezeichnet und mit einem key versehen. In dem zugehörigen Datensatz wird dann über „geoNames“ die Angabe präzisiert. Ortsangaben, die keine politische sondern geographische Einheiten bezeichnen, werden mit <geogName> und @type codiert: z. B. forest, island, lake, mountain, river.

Es bleiben jedoch einige Namen, die mit <name> und einem Attribut (@type) bestimmt werden müssen: vor allem Werke ("work" oder "works") und Aufführungsorte ("venue"). Gerade bei Theatern ist dabei sorgfältig zu unterscheiden, ob in dem Brief z. B. „Mailander Scala“ als Aufführungsort oder als Organisation angesprochen ist.

Die Nennung von Zeitschriften und Zeitungen wird ebenfalls mit <name> vorgenommen. Die Attributwerte für @type sind in diesem Falle "journal" und "newspaper". Bspw. <name type="newspaper">Juventud Rebelde<name>.1

indirekte Angaben

Für alle indirekten Erwähnungen, nicht nur für Namen (s.o.), ist <rs> zu verwenden und ist das Element mit Attributen zu präzisieren. Dies wird auch verwendet, um auf angesprochene postalische Dokumente zu verweisen wie z. B.: "dein letzter Brief". Anschließend folgt der Key des angesprochenen Gegenstandes. [kann man hier automatisch die Liste der erlaubten types einfügen?]

Datumsangaben

Alle Datumsangaben werden, damit sie prozessierbar werden, mit <date> ausgezeichnet und mit Hilfe eines Attributs in ein normiertes Datum umgesetzt, z. B. wird 3. Januar 1956 als <date> ausgezeichnet mit @when="1956-01-03". Zeiträume werden in dem Element mit @from @to wiedergegeben, also „zwischen dem 5. und 8. März 1958 werde ich bei Euch sein“ wird zu @from="1958-03-05" @to="1958-03-08". Ist nur ein ungefährer Zeitraum wie Ende März angegeben, so wird dies mit @notBefore="1958-03-20" @notAfter="1958-03-30" ausgezeichnet. Die Jahreszahl muss in jedem Fall ergänzt werden, auch wenn sie wie im letzten Beispiel im Text nicht genannt ist.

Datierungen

Die Datumsangaben in der in einem Brief üblichen <dateline> wird codiert wie alle anderen Daten. Wird ein Datum oder ein Teil davon erschlossen, so wird dieses Datum mit <supplied> als vom Herausgeber ergänzt markiert.

<dateline>Edinburgh Monday 
   <date>17th August 
      <supplied>1970</supplied>
   </date>
</dateline>
<dateline>
   <date when='1958-01-03'>
      <supplied>3. Januar 1958</supplied>
   </date>
</dateline>

Die Verantwortlichkeit für die Ergänzung kann mit @resp angegeben werden. Bei vollständiger Erschließung des Datums sollte eine Begründung in einer <note> festgehalten werden.

<dateline>
   <supplied resp='IC'>
      <date notBefore='1972-06-10' notAfter='1972-06-20'>Mitte Juni 1972</date>
   </supplied>
</dateline><note resp='IC'>Enzensberger bezieht sich auf den Brief Henzes vom 2. Juni 1972</note>

In den Metadaten unter <correspAction> wird das erschlossene Datum „normal“ eingetragen, allerdings erhält das Element <date> dann ein Attribut @type mit dem Wert "editor". Ebenfalls hervorgehoben mit dem Wert "postal" sind Datumsangaben, die nicht auf Angaben des Autors, sondern auf postalischen Angaben wie Stempel oder Postvermerke zurückgehen. Bei allen <date>-Angaben ohne Attribut ist von dem Attributwert "source" auszugehen. Da dies der Normalfall ist, wird er nur dann ausdrücklich codiert, wenn mehrere Datumsangaben vorliegen.

Titel von Bibliographika

In bibliographischen Angaben werden Titel mit dem Element <title> ausgezeichnet. Eine Spezifizierung erfolgt über das Attribut @level.

<bibl key='A1100620'>
   <title level='m'>Im Zenit der Moderne</title> Bd. 3, S. 536
</bibl>

(Beispiel aus A042B8CD)

Einzelnachweise

  1. 1Dies gilt nicht für Zeitschriftentitel in bibliographischen Angaben. Vgl. Titel von Bibliographika.

XML

Wenn Ihnen auf dieser Seite ein Fehler oder eine Ungenauigkeit aufgefallen ist,
so bitten wir um eine kurze Nachricht an henze-digital [@] zenmem.de.