Zu den Dokumenttypen

Zu den Dokumenttypen

In der Edition werden zwei Dokumenttypen unterschieden: Unter Kategorie I fallen alle Text-Dokumente, d. h. sowohl die postalischen Dokumente wie Briefe, Postkarten, Telegramme etc., als auch Arbeitsdokumente zu Werken oder zeitgenössische Besprechungen (bspw. Werkrezensionen, Konzertkritiken etc.).

Ergänzt werden die Datensätze zu diesen Dokumenten der Kategorie I durch „Referenzdatensätze“ (Kategorie II), die Angaben zu Personen, musikalischen und literarischen Werken, Institutionen, Orten sowie Ereignisse 1enthalten. Darüber hinaus gibt es Datensätze mit bibliographischen Angaben. Alle Datensätze werden in TEI codiert, nur die Datensätze, die musikalische Werke (und ihre Quellen) verzeichnen, sind mit dem MEI-Standard codiert.

Zahlreiche Objekte der „Referenzdatensätze“ sind in Normdatenbanken wie der GND, geonames oder VIAF verzeichnet. Je nach Dokumenttyp wird eine geeignete Datenbank für Verweise verwendet. Es findet keine direkte Verlinkung statt, sondern die Datensätze von Henze-Digital werden mittels der Identifikatoren der entsprechenden Normdatenbanken z.B. mit <idno> (für TEI) zugeordnet.

Dokumenttyp I (Volltexterfasste Datensätze)

Gesperrte Inhalte

Um der Wahrung von Persönlichkeitsrechten Sorge zu tragen kommt es bei der Publikation von Dokumenten des 20. Jahrhunderts vor, dass Inhalte gesperrt, d. h. von den Rechteinhabenden nicht zur Publikation freigegeben sind. Solche Passagen werden durch eine Auslassung markiert, die den Umfang der Auslassung anzeigt, z. B. „[zweizeiliger Absatz]“.

Dokumente, die im Ganzen gesperrt sind, d. h. in der bestandshaltenden Institution nicht einsehbar sind, werden bis zu ihrer Freigabe im Datenbestand von Henze-Digital nicht geführt.

Zur allgemeinen Struktur volltexterfasster Dokumente

Grundstruktur des Textes

Ein Dokument ist grundsätzlich ein <text> Element, bestehend aus <div> und <p> Elementen, wobei gewöhnlich ein Brief oder ein Dokument auch nur ein <div> Element enthält. Die Verwendung des Elements <p>, welches zur Abtrennung von Absätzen Anwendung findet, orientiert sich an der Struktur, die der zu edierende Text vorgibt.2 Ausnahmen hiervon entstehen zwangsläufig bei Inhalten von komplexer Struktur und an denjenigen Stellen, an denen, bedingt durch das Schema, ein <div> oder <p> erforderlich ist wie z. B. als Wrapper-Element für <address>.3

Grundsätzliche Einzüge von Absätzen werden in der Quellenbeschriebung festgehalten aber nicht wiedergegeben. Besondere Einzüge z. B. bei der Grußformel werden abstrakt behandelt, d.h. ihre Breite wird in relativen Einheiten erfasst. Bei Typoskripten kann die Ausdehnung auch als Anzahl von Zeichen angegeben werden.

<closer> <handShift corresp='#hand.5'></handShift> <space unit='indent' quantity='2'></space> <salute>Love</salute> <lb></lb> <signed> <space unit='indent' quantity='3'></space> <persName key='A0005702'> <hi rend='underline'>Chester</hi> </persName> </signed> </closer>

(Beispiel aus A0402725)

Listen und Tabellen

Listen werden den Regeln der TEI folgend als <list> codiert, Tabellen als <table>. Beides erfolgt ohne projektspezifische Anpassung. Wann für eine Auflistung eine Liste und wann eine Tabelle verwendet wird, hängt von der Vorlage und deren optischer Erscheinung ab. Grundsätzlich kann festgehalten werden, dass Aufzählungen als Listen codiert werden, sofern nicht eine streng schematische Liste mit mehreren wiederholenden Parametern (Tabelle mit Spalten) vorliegt. Der Fokus bei der Codierung liegt nicht auf der visuellen Realisation. Ziel ist es eine Repräsentationsform zu finden, die dem Inhalt adäquat ist. Sofern diese beiden Aspekte stark divergieren, ist der entsprechende Fall in einer Anmerkung dokumentiert.

Für Listen gilt: Sind die einzelnen Listenpunkte gezählt, wird die Liste als geordnet typisiert (<list type="ordered">). Werden nicht-numerische Aufzählungszeichen verwendet, gilt die Liste als unsortiert (<list type="unordered">). Im Falle, dass keine Aufzählungszeichen die Liste kenntlich machen, wird die Liste nicht typisiert.

Lyrik im Text

Die Auszeichnung lyrischer Passagen (eingefügte Verse oder Gedichte) erfolgt jeweils durch einen eigenen Abschnitt (<p>). Darin sind Strophen (<lg>) und Verse (<l>) der Vorlage folgend strukturiert. Ausnahmen hiervon sind in einer entsprechenden Anmerkung dokumentiert.

Postalische Dokumente

In dieser digitalen Briefedition werden die postalischen Dokumente der ausgewählten Korrespondenzen – also Briefe und Gegenbriefe – wiedergegeben. Es handelt sich dabei um verschiedene Medientypen wie Briefe (zum Teil mit Umschlag), Post- und Briefkarten sowie Telegramme, die unterschiedliche Anforderungen an das Datenmodell stellen, weshalb diese im Folgenden getrennt behandelt werden.

Briefe (allgemein)

Bei den Briefen sind grundsätzlich zwei Formen zu unterscheiden: Die formell gestalteten Briefe enthalten (meist zu Beginn des Briefes) eine Adresse. Die informelleren Briefe beginnen dagegen in der Regel direkt mit dem Datum und der Anrede. Hier ist anzunehmen, dass die Adresse nur auf dem Umschlag notiert wurde, der aber nicht in jedem Fall überliefert ist.
Die Grobstruktur eines Briefes besteht also ggf. aus der Adresse (<address>), die sich wiederum aus mehreren Adresszeilen (<addrLine>) zusammensetzt,

<address> <addrLine>Herrn </addrLine> <addrLine>Paul Sacher</addrLine> <addrLine>Schönenberg (Pratteln)</addrLine> <addrLine>bei Basel</addrLine> </address>

(Beispiel aus A041FCBD)

einem zu Beginn stehenden <opener>, der z. B. aus einer Datumszeile (<dateline>) und einer oder mehreren Anredezeilen bestehen kann. Komplementär zur Eröffnung ist ggf. eine Abschlusssektion (<closer>) mit Grußfloskel (<salute>), ggf. mit Unterschrift (<signed>), vorhanden, die das Ende des Briefes bildet. Dazwischen steht der eigentliche Brieftext.

Die einzelnen Abschnitte (Absätze/Paragraphen) des Briefes werden mit <p> gekennzeichnet. In der Regel bestehen die Briefe aus einer Einheit, die insgesamt durch das Element <text> strukturell verankert ist. Der Wert des Attributs @type klassifiziert die Art des Textes; bspw. <text type="letter">.

Beginn und Ende der Abschlusssektion <closer> sollten nicht nach der räumlichen Anordnung auf dem Papier (also nach typographischen Gesichtspunkten), sondern nach inhaltlichen Kriterien (wirklicher Beschluss des Briefes) festgelegt werden: Sie beginnt also nicht mitten in einem Satz, sondern umfasst den ganzen Satz (oder mehrere Sätze) bzw. einen Absatz einschließlich der Unterschrift. Zusätzlich zu der Auszeichnung als <closer> wird die graphische Anordnung im wesentlichen codiert, indem Einrückungen mit <space> Elementen in der Proportion zum Haupttext beschrieben werden. (Zu Einzügen vgl. auch Grundstruktur des Textes)

Schließt die Grußformel direkt in der laufenden Zeile eines Textes an, lässt sich eine Absatzbildung des <closer> durch das Attribut @rend mit dem Wert "inline" (<closer rend="inline">) verhindern.
Nachschriften am Ende des Briefes (also nach dem <closer> ggf. mit Unterschriftsformel) können, wenn es sich um kürzere Zusätze handelt, innerhalb eines <postscript>-Elements erscheinen oder – falls eine längere bzw. stärker strukturierte Nachschrift vorliegt – in ein weiteres <p> Element eingeschlossen werden.

<text type='letter'> <body> <div> <opener> <dateline rend='right'> <handShift corresp='#hand.2'></handShift> <settlement key='A13005F3'>berlin</settlement> <date when='1968-09-05'>5. 9. 68</date> <note type='textConst' resp='IC'>Die Punkte zwischen den Zahlen stehen mittig.</note> <lb></lb> </dateline> <salute> <handShift corresp='#hand.1'></handShift>lieber <persName key='A001000A'>hans</persName> </salute> </opener> <p rend='inline'></p> <closer> <salute> <handShift corresp='#hand.2'></handShift> <foreign xml:lang='es' xml:id='foreign.1'>¡abrazos y abrazos!</foreign> </salute> <space unit='chars' quantity='10'></space> <persName key='A0002EA0'>mang</persName>. </closer> <postscript> <p>P.S. ist <persName key='A001126F'>orsini</persName> nun definitiv aus dem spiel? hoffen wirs! <lb></lb>aber man müßte sich dessen versichern; mit ihm ist <lb></lb>die oper <hi rend='underline'>nicht zu machen</hi> </p> </postscript> </div> </body> </text>

(Beispiel aus A040C8A0)

Enthält ein Brief einen Umschlag oder Beilagen, so werden diese separat erfasst (siehe Umschläge bzw. Schriftstücke). Der Verweis ist obligatorisch:

<sourceDesc> <msDesc> <msIdentifier></msIdentifier> <physDesc></physDesc> </msDesc> <listRelation> <relation name='hasEnclosure' key='{$documentId}'></relation> </listRelation> </sourceDesc>

Ist ein Brief nur durch einen Durchschlag überliefert, so wird dies in der <supportDesc> angegeben.

<supportDesc> <support> <material function='copy.carbon'>Durchschlagpapier</material> </support> </supportDesc>

(Beispiel aus A040C872)

Briefe (auf Briefpapier)

Sowohl Henze als auch einige seiner Korrespondenzpartner (z. B. Paul Sacher) verwenden persönliches Briefpapier. In diesen Fällen werden die vorgedruckten Partien über das Element <fw> (forme work) erfasst und wird dieses als Briefkopf gekennzeichnet.

<fw type='letterhead'> <hi rend='capital'>La Leprara <lb></lb>Via Del fontanile <lb></lb>Marino (Roma) </hi> </fw>

(Beispiel aus A040C9CB)

Nach demselben Prinzip ist mit vorgedruckten Kopf- und Fußzeilen zu verfahren. Auf die Verwendung von gedrucktem Briefpapier wird in der Quellenbeschreibung (<physDesc>) verwiesen.

Ist ein Blatt quer beschrieben, so wird dies in der Layoutbeschreibung (<layout>) vermerkt. In diesem Fall werden vorgedruckte Kopftitel (die am Rand gedreht erscheinen) zu Beginn einer neuen Seite wiedergegeben, um den Textfluss beim Lesen nicht zu unterbrechen (Vgl. Brief von H. W. Henze an M. Barnet, 11. Februar 1974).

Karten/Postkarten

Bei Karten sind folgende Typen zu unterscheiden: Sogenannte Briefkarten, also Faltkarten mit Motiv, werden für gewöhnlich in einem Umschlag verschickt und enthalten daher keine Adress- oder Absenderangaben; daher werden diese wie Briefe behandelt. Die Tatsache, dass es sich um eine Briefkarte handelt, wird in der <physDesc> beschrieben. Ggf. vorhandene Bildmotive werden mit <figureDesc> beschrieben.

Als Postkarten sind die sogenannten Ansichtskarten anzusehen, die zum sofortigen postalischen Versand gedacht sind, sowie die eigentlichen Postkarte (ohne Bild).

„Die Vorderseite der Postkarte ist die Adressseite. Diese Definition gilt für deutsche philatelistische und philokartistische Fachsprache für alle Arten der Postkarten, auch für Ansichtskarten.“ (Zitat siehe Artikel „Postkarte“ in Wikipedia (letzter Abruf 5. Juni 2023), vgl. auch den Eintrag auf Philawiki.ch.

Die von der Post vertriebene Karte (Postkarte, z. T. mit aufgedruckter Briefmarke), die direkt zum Versand vorgesehen ist, enthält zahlreiche vorgedruckte Angaben, die mit <fw> erfasst sind (vgl. Adressen), die aufgedruckten Briefmarken eingeschlossen. Da der Absenderbereich bei solchen Postkarten nur die halbe linke Seite einnimmt, entsteht hier freier Platz, der häufig noch für den Briefschluss, andere Notizen oder auch Bilder genutzt wird.

Die Postkarten werden in ihrer räumlichen Anordnung als zweiseitiges Dokument wiedergegeben. Zur Erfassung der Struktur (Bereiche auf der Karte) siehe Telegramme.

<div type='row'> <div> <p> <address> <addrLine> <fw>Absender: <lb></lb>(Vor- und Zuname) </fw>Henze </addrLine> <addrLine>17a</addrLine> <addrLine>Heidelberg <fw rend='center'>Wohnort, auch Zustell- oder Leitpostamt</fw> </addrLine> <addrLine>Rohrbacher Str. 40 V <fw rend='center'>Straße, Hausnummer, Gebäudeteil, Stockwerk oder Postschließfachnummer; <lb></lb>bei Untermietern auch Name des Vermieters </fw> </addrLine> </address> <figure> <figDesc>eigenhändiges farbiges Bild von Hans Nagel</figDesc> </figure> <lb></lb>ein echter <persName key='A0010552'>Nagel</persName> gratis. <note type='commentary' resp='IC'>Henze wohnte in dieser Zeit bei dem Maler Hans Nagel, vgl. den <rs type='postal' key='A042B97E'>Brief vom 25. Mai 1949</rs>. </note> </p> </div> <div> <p> <seg rend='left'> <fw>Postkarte</fw> </seg> <seg rend='right'> <fw rend='right'>Briefmarke: Deutsche Post, Holstentor, 10 Pfennig</fw> </seg> <stamp type='round'>Rundstempel: Heidelberg 1 [unten:] an, [darin:] 29.6.49 | -17</stamp> <lb></lb> <stamp type='stamp'>blaue Briefmarke: Notopfer 2 Berlin </stamp> <lb></lb> <address> <addrLine>Dr. Walter Jockisch</addrLine> <addrLine>EGERN am Tegernsee</addrLine> <addrLine>Fürstenstrasse</addrLine> <fw rend='center'>Straße, Hausnummer, Gebäudeteil, Stockwerk oder Postschließfachnummer; <lb></lb>bei Untermietern auch Name des Vermieters </fw> </address> </p> </div> </div>

(Beispiel aus A042B840)

Es folgt dann der Brieftext der Rückseite. Da dieses Medium in der Regel nur die eine Seite umfasst, zeigt ein <pb> in diesem Fall den Beginn der Rückseite an <pb n="verso">. Sollte der Textabschluss unterhalb der Absenderangabe notiert sein, wird dieser allerdings am Ende des Brieftextes wiedergegeben und wird die Position des Textes vermerkt. Im übrigen folgt die Codierung des Textes den Regeln für Briefe.

Telegramme

Die Erfassung von Telegrammen in TEI soll zusätzlich zum Inhalt auch die Formularstruktur des Trägermediums abbilden, um dem beschriebenen Medium im Ganzen gerecht zu werden. Hierzu wurde ein TEI-konformes Datenmodell erarbeitet.

Erfassung der Telegrammstruktur

Der Modellansatz für die Erschließung der Formularstruktur ist vom Bootstrap-Framework inspiriert, welches Bereiche mit <div>s organisiert. Zur Nutzung dieser Technik wurde die TEI-Definition von <div> für Henze-Digital erweitert: „(text division) contains a subdivision of the front, body, or back of a text or is used to represent the structure of the text for special documents (e. g., postcards, telegrams)“.

Analog zum Bootstrap-Framework wird jeweils ein <div> als Wrapper für eine Zeile verwendet. Die Kind-Elemente – in diesem Fall ist <div> obligatorisch – stellen dann Bereiche innerhalb einer Zeile (i. e. Spalten) dar.

<div type='row'> <div type='col'></div> <div type='col'></div> </div>

Werden in den <div>-Elementen innerhalb von <div type="row"> keine weiteren Spezifikationen angegeben, so bedeuted dies eine gleichmäßige Verteilung bzw. gleichmäßige horizontale Ausdehnung der Bereiche. Ungleichgroße Bereiche können durch die Werte "col-1" bis "col-11" spezifiziert werden, wobei die Summe aller Bereiche einer Zeile den Wert "12" (analog zu Bootstrap) nicht überschreiten darf.

Eine Zeile mit zwei Bereichen im Verhältnis 1:2 (1/3 der Gesamtbreite + 2/3 der Gesamtbreite) kann wie folgt codiert werden:

<div type='row'> <div type='col-4'></div> <div type='col-8'></div> </div>

Werden nur einzelne Bereiche in ihrer horizontalen Ausdehnung spezifiziert, so sind alle anderen Bereiche als gleichmäßig verteilt (bezogen auf den zur Verfügung stehenden Platz) zu verstehen. In diesem Fall ist es jedoch ratsam explizite Werte zu verwenden oder die gleichmäßig zu verteilenden Spalten als neue Reihe innerhalb einer Spalte zu organisieren.

<div type='row'> <div type='col-2'></div> <div type='col'></div> <div type='col'></div> </div>

Der Wrapper <div type="row"> kann in jedem Bereich verwendet werden, außer in sich selbst. Auf diese Weise lassen sich auch komplexe Formularstrukturen erfassen und mit Hilfe des Bootstrap-Framework darstellen.

Vorgedruckte Formular-Texte werden mit <fw> ausgezeichnet.

Telegramme mit mehreren Quellen

Ist ein Telegramm sowohl als Urschrift bzw. Absendeexemplar als auch als Empfängerexemplar bzw. Empfängerausdruck überliefert, so sind beide Quellen als getrennte Textzeugen (<witness>) zu erfassen. Die Erfassung der Textzeugen erfolgt chronologisch. Für die Edition ist zu beachten, dass die Leitquelle stets der späteste Textzeuge (i. d. R. das Ankunftsexemplar) ist. Das ankommende Telegramm enthält den transportierten Text, auf den die Empfangenden reagierten. Dies ist deshalb von Bedeutung, da Telegramme zum Teil mündlich übermittelt wurden und sich dadurch Irrtümer in der Übertragung ergeben können (v. a. wenn die Mitarbeitenden der Telegraphenanstalten die Sprache, in welcher der Text verfasst wurde, nur auf einfachem Niveau beherrschten). Ggf. ist es ratsam die Lesarten mit einem Apparatus-Element (<app>) zu erfassen.

Umschläge

Die Überlieferung des zum postalischen Dokument gehörigen Umschlags ist nicht häufig, aber in jedem Fall zu berücksichtigen. Gelegentlich kommt es vor, dass ausschließlich ein Umschlag überliefert ist. Der Umschlag wird als eigener Datensatz angelegt und mit dem zugehörigen postalischen Dokument verlinkt.

<sourceDesc> <msDesc> <msIdentifier></msIdentifier> <physDesc></physDesc> </msDesc> <listRelation> <relation name='isEnvelopeOf' key='{$letterId}'></relation> </listRelation> </sourceDesc>

Die Adressseite wird als Vorderseite und die Absenderseite als Rückseite, eingeleitet mit <pb n="verso">, erfasst. (Vgl. auch Karten/Postkarten)

<text type='envelope'> <body> <div> <p> <handShift corresp='#hand.1'></handShift> <address> <addrLine> <fw>Air Mail / Par Avion </fw> </addrLine> <addrLine> <stamp>Par Avion</stamp> </addrLine> <addrLine> <persName key='A001000A'>Herr Hans Werner Henze</persName> </addrLine> <addrLine>La Leprara</addrLine> <addrLine> <settlement key='A13020B0'>Marino (Roma)</settlement> </addrLine> <addrLine> <country key='A1303EAF'>Italia</country> </addrLine> </address> </p> </div> <pb></pb> <div> <p> <address> <addrLine rend='center'> <persName key='A0002EA0'>H.M.E.</persName> c/o <orgName key='A0801AC9'>Casa de las Américas</orgName> </addrLine> <addrLine rend='center'>G y Tercera, Vedado</addrLine> <addrLine rend='center'> <settlement key='A13016A2'>La Habana</settlement> </addrLine> </address> <stamp>Rundstempel: 00947 Marino (Roma) F. [und kleines Posthorn], darin: 3. 1. 69</stamp> </p> </div> </body> </text>


Als zusätzliche Elemente finden sich auf Umschlägen oft vorgedruckte Texte und vor allem Briefmarken und Stempel – in den 1950er Jahren sowohl Ausgangs- als auch Eingangsstempel. Die vorgedruckten Elemente werden – wie im Abschnitt zu den Briefpapieren beschrieben – in <fw> wiedergegeben. Zur Codierung von Stempeln und Briefmarken vgl. den Abschnitt Stempel und Briefmarken.

<text type='envelope'> <body> <div> <p> <fw> <hi rend='spaced_out'>Center for Advanced Studies</hi> <lb></lb> <hi rend='capital'>Wesleyan University . Middletown . Connecticut</hi> 06457 </fw> </p> <p> <foreign xml:lang='es'>companero</foreign> hans werner henze <space unit='chars' quantity='3'></space>la leprara <space unit='chars' quantity='3'></space>marino (roma) <space unit='chars' quantity='3'></space>italia </p> </div> <pb></pb> <div> <p> <stamp type='round'>Poste Roma - Arrivi E distribuzione [darin:] 14 - 15 <lb></lb> 25 -1 <lb></lb> 1968 </stamp> </p> </div> </body> </text>

(Beispiel aus A042CBF1)

Stempel/Briefmarken

Die Codierung von Stempeln und Briefmarken befindet sich im Entwicklungsstadium. Bisher werden vor allem die Inhalte der Stempel und Briefmarken als Text wiedergegeben. Spezielle Informationen zu den Briefmarken und Stempeln finden sich in einer Anmerkung oder ggf. in der <physDesc>. Zum Problem der Codierung dieser Bestandteile der postalischen Dokumente vgl. TEI Guidelines. Vgl. auch Obert, Dewi Josephine/Trautmann, Marjam: Postage stamps, seals, and postmarks, https://web.archive.org/web/20230213065004/https://encoding-correspondence.bbaw.de/v1/stamps-seals-postmarks.html

In der Codierung wird zwischen Briefmarken (<stamp type="stamp">) und verschiedenen Arten von Stempeln unterschieden. Die erlaubten Werte für @type sind in der Elementdefinition von <stamp> aufgelistet.

Schriftstücke

Weitere Dokumente, die im Zusammenhang mit der Korrespondenz überliefert sind, das sind in der Regel Beilagen zu Briefen wie Aufstellungen, Listen, Rechnungen, Zeitschriftenartikel etc., werden einzeln erfasst. Sind die Dokumente eindeutig als Beilage eines Briefes nachzuweisen, so werden diese mit dem entsprechenden Brief in Beziehung gesetzt:4 Sind die Schriftstücke individuell geschrieben, werden sie im Volltext erfasst. Beigelegte gedruckte Materialien wie Rezensionen oder nicht-individuelle Beilagen wie Aufrufe werden dokumentiert, aber nicht im Volltext erfasst.

<sourceDesc> <msDesc> <msIdentifier></msIdentifier> <physDesc></physDesc> </msDesc> <listRelation> <relation name='isEnclosureOf' key='{$letterId}'></relation> </listRelation> </sourceDesc>

Übersetzungen

Übersetzungen von postalischen Dokumenten werden angefertigt, wenn die Dokumente in einer anderen Sprache als deutsch oder englisch vorliegen. Bisher betrifft dies vor allem Dokumente in spanischer oder französischer Sprache. Die Übersetzungen werden mit demselben Schema erfasst wie das Originaldokument, sie erhalten aber nur minimale Metadaten, in denen vor allem auf das Original-Dokument verwiesen wird. (Kleinere fremdsprachige Anteile in Briefen werden mit Hilfe einer Anmerkung übersetzt. Siehe dazu Fremdsprachliche Textteile)

<sourceDesc> <msDesc> <msIdentifier> <repository>Henze-Digital</repository> </msIdentifier> </msDesc> <listRelation> <relation name='isTranslationOf' key='A04037E7'></relation> </listRelation> </sourceDesc>

(Beispiel aus A1400BFA)

In den Übersetzungen werden lediglich Personen, Institutionen und Orte ausgezeichnet. Anmerkungen zur Textkonstitution und Zeilenkommentare bleiben dem Original vorbehalten.

Dokumenttyp II (Katalogdatensätze)

Personen

Personen-Datensätze enthalten innerhalb des Root-Elements <person> die grundlegenden Angaben zur jeweiligen Person: Familienname <surname>, Vorname <forename> und ggf. Namenszusätze (z. B. „von“ <nameLink>) sowie Funktionsnamen (<roleName>). Dabei gibt es eine reguläre Ansetzungform (<persName type="reg">), es können aber auch Alternativnamen erfasst werden (<persName type="alt">), die durch das Attribut @subtype näher spezifiziert werden können, bpsw. bei Angaben zu Taufnamen oder Namensänderungen durch Heirat usw.: <persName type="alt" subtype="married">.

Weitere Bestandteile von Personendokumenten sind Geburtsdaten

<birth> <date when='1926-07-01'></date> <settlement key='A13014E4'>Gütersloh</settlement> </birth><death> <date when='2012-10-27'></date> <settlement key='A1300E27'>Dresden</settlement> </death>

(Beispiel aus A001000A)

sowie Angaben zu Geschlecht (<sex>), zu Beruf(en)/Tätigkeit(en) (<occupation>) und ggf. zu Wohn-/Wirkungsorten (<residence>). Auf Grund der Normdatenverknüpfung und der Anzeige dieser (und weiterer durch die Normatenverknüpfung bereit gestellter Inhalte) in der HenDi-WebApp werden für Personen nur diese Rahmendaten erfasst. Zusätzliche Informationen werden in den Personendatensätzen nur erfasst, wenn sie im Rahmen von Henze-Digital notwendig sind, da sich diese nicht aus den Normdaten herleiten lassen, keine Normdaten existieren oder sie von diesen abweichen. Diese Informationen werden in einer <note type="bioSummary"> erfasst.

Ist eine Person innerhalb einer Organisation tätig oder tätig gewesen, so wird diese Beziehung als Affiliation angegeben (<affiliation key="{$orgId}">). Handelt es sich um eine zeitlich begrenzte Tätigkeit, deren Dauer für die Edition relevant ist, so kann dieser Zeitraum mit den Attributen @from und @to angegeben werden.

Bei biblischen und mythologischen Personen wird der Datensatz verschlankt auf die Angabe des Namens innerhalb des Elements <persName>. Die Auszeichnung innerhalb der Briefe klassifiziert diese als biblische oder mythologische Figur.

<person xml:id='A001148F' status='approved' source='HenDi'> <idno type='gnd'>118590278</idno> <persName type='reg'>Orpheus</persName> <birth> <date notBefore='-0600'></date> </birth> <death> <date notAfter='-0401'></date> </death> <sex>unknown</sex> <occupation>Sänger</occupation> <occupation>Dichter</occupation> <note type='bioSummary'>Mythologische Figur</note> </person>

(Beispiel aus A001148F)

Werke

Dieser Datentyp ist äußerst komplex, da musikalische, literarische, bildnerische und Film-Werke auf unterschiedliche Weisen erfasst werden müssen. Für die musikalischen Werke und AV-Medien finden die Kodierungsempfehlungen der Music Encoding Initiative (MEI) Anwendung; für literarische und bildnerische Werke die der Text Encoding Initiative (TEI). Aus diesem Grund werden die beiden Untergruppen dieses Dokumententyps im Folgenden separat besprochen. Beide Werkgruppen sind noch im Aufbau und werden im Laufe des Projektes weiter differenziert.

Musikalische Werke (MEI)

Bei den musikalischen Werken wird in der Erfassungstiefe zwischen den Werken Hans Werner Henzes und denen anderer Komponisten unterschieden. Allen gemeinsam ist die Angabe von Titel, Komponist*in ggf. weiterer beteiligter Personen und Entstehungsjahr und/oder Uraufführungsdatum. Wenn vorhanden wird ein Verweis auf Normdaten ergänzt.

<worklist> <work> <title> <titlePart type='main'>Die Zauberflöte KV 620</titlePart> <titlePart type='desc'>Oper</titlePart> </title> <composer> <persName codedval='A001023D'>Mozart, Wolfgang Amadeus</persName> </composer> <librettist> <persName>Schikaneder, Emanuel</persName> </librettist> <creation> <date isodate='1791'>Uraufführung: Freihaustheater Wien 1791</date> </creation> </work> </worklist>


Die Werke Hans Werner Henzes werden darüber hinaus um Angaben zur Besetzung, zu Aufführungen und zu einzelnen Versionen ergänzt.

AV-Medien werden analog zu den musikalischen Werken mit MEI erfasst und entsprechend klassifiziert.

Literarische Werke (TEI)

Die literarischen Werke werden als TEI-Dateien erfasst. Auch wenn hierfür zunächst nur der <teiHeader>, also die Metadaten relevant sind, so besteht die Möglichkeit später den Inhalte des verzeichneten Werkes hinzuzufügen. Verzeichnet werden die Werke mittels eines <biblStruct> Elements.

<biblStruct type='book'> <monogr> <title>Les amitiés particulières</title> <title xml:lang='de'>Heimliche Freundschaften</title> <author key='A0010785' role='aut'>Peyrefitte, Roger</author> <imprint> <date when='1944'>1944</date> <pubPlace></pubPlace> <publisher></publisher> </imprint> </monogr> </biblStruct>


Im vorangehenden Beispiel wurde zusätzlich ein übersetzter Titel angegeben. Als erster Titel ist – wenn möglich – der Originaltitel anzugeben und lediglich die u. U. folgenden Titel bedürfen des @xml:lang Attributs, um anzugeben, in welche Sprache der Originaltitel übersetzt wurde.

Die Sprache(n), in der/denen das Werk ursprünglich verfasst ist, werden in <langUsage> angegeben.

<langUsage> <language ident='fr'></language> </langUsage>


Da Übersetzungen in mehrere Sprachen angefertigt werden können, werden bei den Übersetzern auch die Sprachen erfasst, in die sie den Text übersetzt haben. Dies geschieht über das Attribut @label.

<monogr> <title level='m'>The Rise and Fall of the City of Mahagonny</title> <author key='A00110DF' role='aut'>Brecht, Bertolt</author> <editor role='trl' label='en' key='A00006DC'>Auden, Wystan Hugh</editor> <editor role='trl' label='en' key='A0005702'>Kallman, Chester</editor> <imprint> <date when='1976'></date> <pubPlace>Oxford</pubPlace> <publisher>Oxford University Press</publisher> </imprint> </monogr>

(Beispiel aus A02014EA)

Bei Gedichten oder anderen kleineren Werkgattungen wie z. B. Erzählungen ist es ggf. notwendig, diese mit einem übergeordneten Werk bzw. einer übergeordneten Publikation zu verknüpfen.

Bildnerische Werke (TEI)

Die Erfassung von bildnerischen Werken (z. B. Gemälden) erfolgt analog zu den literarischen Werken und wird in der <biblStruct> mit dem Attribut @type und dem Wert "painting" klassifiziert. Zudem ist der <author> mit einer Funktion (@role) zu versehen (z. B. "art" = Artist/Künstler*in).

Orte

Referenzdatensätze zu Orten werden einzeln angelegt, dabei ist es nicht von Belang, ob es sich um ein Land, eine Stadt oder z. B. ein Gebirge handelt: Jeder identifizierbare Ort wird durch einen eigenen Datensatz repräsentiert. Als Normdatenbank wird primär GeoNames verwendet. GeoNames stellt eine äußerst umfangreiche Datensammlung bereit, die neben Städten auch Örtlichkeiten, wie Schlösser, öffentliche Gebäude u. a. enthält; zudem sind die Datensätze von GeoNames hierarchisch organisiert (bspw. Kontinent, Land, Region, Stadt).

Das Datenmodell für Orte ist einfach.

<place xml:id='A13025E2' status='approved' source='HenDi'> <idno type='geonames'>5128581</idno> <placeName type='reg'>New York City (New York)</placeName> <placeName type='alt'>New York</placeName> <placeName type='alt'>N.Y.</placeName> <placeName type='alt'>N.Y.C.</placeName> <placeName type='alt'>NY</placeName> <placeName type='alt'>NYC</placeName> </place>

(Beispiel aus A13025E2)

Für den Fall, dass ein Ort nicht in der GeoNames-Datenbank verfügbar ist, können ggf. die Koordinaten ermittelt und im Datensatz nach folgendem Schema hinterlegt werden.

<place xml:id='A130109C' status='approved' source='HenDi'> <placeName type='reg'>Falkenmühle</placeName> <location> <geo>49.0957712 7.8051705</geo> </location> </place>

(Beispiel aus A130109C)

Organisationen/Institutionen

Bei Referenzdatensätzen zu Organisationen werden neben den Normdaten vorwiegend Name und Ort erfasst. Die Art der Organisation (z. B. Verlag, Theater, Rundfunkanstalt) wird durch das Element <state> wiedergegeben. Das Schema sieht eine geschlossene Liste für die Klassifizierung vor (Werte vgl. hendi.orgType.list). Die Verwendung mehrerer <term>-Elemente ist zulässig. Literaturangaben bzw. Links sind in <listBibl> möglich.

<org xml:id='A08011A3' status='approved' source='HenDi'> <idno type='gnd'>43194-1</idno> <orgName type='reg'>GEMA</orgName> <orgName type='alt'>Gesellschaft für musikalische Aufführungs- und mechanische Vervielfältigungsrechte</orgName> <settlement key='A13005F3'>Berlin</settlement> <country key='A1304712'>Deutschland</country> <state type='orgType'> <desc> <term>company</term> </desc> </state> <listBibl> <bibl>https://www.gema.de</bibl> </listBibl> </org>

(Beispiel aus A08011A3)

Unterorganisationen wie Abteilungen, Projektgruppen oder andere organisationshierarchische Untersektionen werden als eigene Organisation erfasst. Dies gilt auch für Firmen bei Namenswechsel. Die Zuweisung zum Übergeordneten Datensatz erfolgt mittels <relation>:

<listOrg> <relation name='isAssociatedWith' key='{$orgId}'></relation> </listOrg>

Rollen und Charaktere

Erwähnte Rollen aus dramatischen Werken oder Charakteren in Prosawerken oder Lyrik werden im Brieftext ausgezeichnet – <name type="role"> bzw. <name type="character"> – ein Register für diese Namen ist noch nicht angelegt.

Literatur/Schriften

In dieser Kategorie werden Bibliographika erfasst, die als Sekundär-, Sachliteratur oder Schriften bezeichnet werden können. Texte mit literarischer Qualität sind als Werke zu erfassen.

Die Datensätze zu den Bibliographika bestehen aus einem <biblStruct>-Element, mit dessen Hilfe Informationen zu den Autor*innen (<author>) und zum Titel (<title>) hinterlegt werden können. Es werden wie üblich selbstständige und unselbstständige Publikationen unterschieden. Das Element <monogr> verzeichnet eigenständige Publikationen und dokumentiert Angaben zur Veröffentlichung durch die Elemente <imprint>, <biblScope>, <date>, <pubPlace> etc.

<biblStruct> <monogr> <title></title> <imprint> <pubPlace></pubPlace> <date></date> </imprint> </monogr> </biblStruct>

.

Unselbstständige Publikationen werden mittels <analytic> erfasst – hierin: Informationen zu den Autor*innen (<author>) und zum Titel (<title>) – und auf die übergeordnete Publikation wird im Element <monogr> nur mit dem Attribut @sameAs verwiesen. Die individuellen Angaben wie Erscheinungsjahr und Seitenzahl werden mit dem ggf. wiederholten Element <biblScope> erfasst.

<biblStruct type='article' xml:id='A110088C' status='approved' source='HenDi'> <analytic> <title level='a'>Henze's First Opera in a Decade Seen in London</title> <author role='aut' key='A0000C14'>John Rockwell</author> </analytic> <monogr sameAs='A110150E'> <imprint> <date when='1976-07-25'></date> <biblScope unit='pp' from='58' to='58'>58</biblScope> </imprint> </monogr> </biblStruct>

(Beispiel aus A110088C)

(Schriften-)Reihen erhalten ebenfalls einen Datensatz, sodass diese direkt referenziert werden können.

<biblStruct> <series> <title></title> <editor></editor> <date></date> </series> </biblStruct>

Um selbstständige Publikationen einer Reihe zuzuordnen, wird analog das Attribut @sameAs verwendet.

<biblStruct type='book' xml:id='A11009C2' status='approved' source='HenDi'> <monogr> <title level='m'>Grete Weil</title> <editor key='A0003890' role='edt'>Schönborn, Sibylle</editor> <imprint> <pubPlace>München</pubPlace> <date when='2009'></date> <biblScope unit='vol'>182</biblScope> </imprint> </monogr> <series sameAs='A11011E9'></series> </biblStruct>


Periodika werden mit dem Element <monogr> @level (mit dem Wert "j") erfasst. Hier ist zu beachten, dass ausschließlich die Grundinformationen zum Periodikum wie Titel, Herausgebende, Erscheinungszeitraum angelegt werden (vgl. ZDB.) Der Katalogdatensatz zu den Periodika ist lediglich als Ankerpunkt vorgesehen. Informationen wie Jahrgang, Ausgabe bzw. Ausgabennummer oder Band gehören zur Ebene der Artikel und werden im entsprechenden Datensatz erfasst.

<biblStruct type='journal' xml:id='A110150E' status='approved' source='HenDi'> <monogr> <title level='j'>The New York Times</title> <imprint> <pubPlace>New York City</pubPlace> <date from='1851-09-15'></date> </imprint> </monogr> </biblStruct>

(Beispiel aus A110150E)

Erfassung von Ereignissen

Das Datenmodell zur Erfassung von Ereignissen befindet sich im Aufbau.

Briefwechsel/Korrespondenz

Um einen korrespondenzbezogenen Zugang zu den postalischen Dokumenten zu ermöglichen, wurde ein eigener Dokumenttyp (als Katalogdatensatz) eingeführt. Dieser dient ausschließlich als Ankerpunkt für Korrespondenzen.

<TEI xml:id='A1500C9E'> <teiHeader> <fileDesc> <titleStmt> <title xml:lang='de'>Henze | Barnet</title> <title xml:lang='en'>Henze | Barnet</title> </titleStmt> <publicationStmt> <p>Publication Information</p> </publicationStmt> <notesStmt> <note type='annotation' xml:lang='de'>Die Dokumente in spanischer Sprache liegen in englischer Übersetzung vor.</note> <note type='annotation' xml:lang='en'>The documents in Spanish are available in English translation.</note> </notesStmt> <sourceDesc> <listRelation> <relation name='introduction' key='A0900796'></relation> </listRelation> </sourceDesc> </fileDesc> <profileDesc> <correspDesc> <correspAction type='sent'> <persName key='A000090F'>Barnet, Miguel</persName> </correspAction> <correspAction type='received'> <persName key='A001000A'>Henze, Hans Werner</persName> </correspAction> </correspDesc> <correspDesc> <correspAction type='sent'> <persName key='A001000A'>Henze, Hans Werner</persName> </correspAction> <correspAction type='received'> <persName key='A000090F'>Barnet, Miguel</persName> </correspAction> </correspDesc> </profileDesc> </teiHeader> <text> <body> <div></div> </body> </text> </TEI>

(Beispiel aus A1500C9E)

Zusammenhänge werden hergestellt, indem Dokumente als zugehörig zu diesem Ankerpunkt definiert werden. Dies geschieht durch das Element <relation>. Die Art der Beziehung und ein Ziel ist zu definieren (z. B. <relation name="correspondence" key="{$correspId}">). Um einen Vorwort-Text bzw. eine Erläuterung einzubeziehen wird folgende Codierung verwendet: <relation name="introduction" key="{$fileId}">.

ID-Systematik

Im Projekt Henze-Digital sind die IDs nach einheitlichen Patterns organisisert. Jede ID beginnt mit einem Präfix, welches aus einem führenden „A“ und zwei Ziffern besteht. Darauf folgt eine vierstellige Hexadezimalzahl, bevor die ID mit einer Prüfziffer (ebenfalls hexadezimal) abschließt. Buchstaben in den IDs von Henze-Digital werden grundsätzlich großgeschrieben. Diese Struktur lässt sich als regulärer Ausdruck wie folgt darstellen: A\d{2}[0-9A-F]{5}

Präfixe der Dokumenttypen

A00 Personen

A01 nicht belegt

A02 Werke (autoreigen sowie -fremd)

A03 nicht belegt

A04 Postalische Dokumente (Briefe, Postkarten, Telegramme etc.)

A05 News (Nachrichten aus dem Projekt)

A06 nicht belegt

A07 Varia (Impressum, Projektbeschreibung et al.)

A08 Organisationen

A09 Erläuterungen

A10 Dokumente

A11 Bibliographika (aus dem Projektkontext)

A12 nicht belegt

A13 Orte

A14 Übersetzungen (von anderen Dokumenten)

A15 Korrespondenzen (als Ankerpunkte)

A16–A22 nicht belegt

Die Präfixe wurden analog zur Weber-Gesamtausgabe gewählt, um größtmögliche Kompatibilität zur WeGA-WebApp herzustellen. Daher kommt es zu Lücken in der Zählung.

Zur Berechnung der Prüfziffern siehe die constraint-Definition <constraintSpec ident="idCheckDigit">, GitHub-Repository zum ODD, common-specs.odd.xml, die Zeilen 1918–1967 (hash: 148976ebd7).

Revisionen

In der <revisionDesc> werden Veränderungen an der Datei in einer summarischen Beschreibung festgehalten.

Status/Zustand der Datensätze

Mit dem Attribut @status, welches immer im root-Element des jeweiligen Datensatzes zu finden ist, wird der Bearbeitungsstand des Dokuments von Henze-Digital festgehalten. Hierfür sind derzeit drei Stufen vergeben:

proposed Dieser Status gibt an, dass ein Datensatz angelegt oder generiert wurde, derzeit aber noch in einer unkorrigierten Entwurfsfassung vorliegt. In der internen Darstellung werden solche Datensätze als „in Bearbeitung“ gekennzeichnet.

candidate Dieser Status gibt an, dass der Datensatz überarbeitet (d. h. angereichert und korrekturgelesen) wurde, jedoch noch nicht entgültig bearbeitet worden ist. Der Datensatz wird in der internen Ansicht mit „Kommentar in Bearbeitung“ gekennzeichnet.

approved Für die Veröffentlichung freigegebene Datensätze erhalten diesen Status, d. h. dass sie korrekturgelesen, ausgezeichnet und mit den augenblicklich möglichen Anmerkungen versehen sind. Veränderungen der Datei beziehen sich dann in der Regel nur noch auf die Kommentare. Solche Datensätze erhalten den Vermerk „bearbeitet“.

Zum Umgang mit Dubletten

Im Fall der fehlerhaften Verdopplung von Datensätzen werden diese, sofern sie bereits veröffentlicht sind, nicht gelöscht; stattdessen wird eine Referenz gesetzt, die eine Weiterleitung zum korrekten Datensatz ermöglicht. Realisiert wird diese Referenz durch das Element <ref> und dem dort verfügbaren Attribut @target dessen Attributwert die ID der entsprechenden Zieldatei enthält. Zusätzlich wird mit @type="duplicate" dokumentiert, dass es sich beim vorliegenden Datensatz um eine Dublette handelt. Bsp. für eine Dublette bei Personendokumenten:

<person xml:id='A00ID' source='HWH' status='approved'> <ref type='duplicate' target='A00ID'></ref> </person>

Einzelnachweise

1Dieser Datentyp befindet sich derzeit im Aufbau.

2Zu Zeilenumbrüchen siehe Grundsätze der Textübertragung und -auszeichnung und Trennstriche.

3Zu den Besonderheiten bzgl. Postkarten und Telegrammen siehe Karten/Postkarten bzw. Telegramme.

4Der Verweis erfolgt aus technischen Gründen derzeit in beide Richtungen. Vgl. auch Briefe (allgemein).

A00	Personen
A01	nicht belegt
A02	Werke (autoreigen sowie -fremd)
A03	nicht belegt
A04	Postalische Dokumente (Briefe, Postkarten, Telegramme etc.)
A05	News (Nachrichten aus dem Projekt)
A06	nicht belegt
A07	Varia (Impressum, Projektbeschreibung et al.)
A08	Organisationen
A09	Erläuterungen
A10	Dokumente
A11	Bibliographika (aus dem Projektkontext)
A12	nicht belegt
A13	Orte
A14	Übersetzungen (von anderen Dokumenten)
A15	Korrespondenzen (als Ankerpunkte)
A16–A22	nicht belegt

proposed	Dieser Status gibt an, dass ein Datensatz angelegt oder generiert wurde, derzeit aber noch in einer unkorrigierten Entwurfsfassung vorliegt. In der internen Darstellung werden solche Datensätze als „in Bearbeitung“ gekennzeichnet.
candidate	Dieser Status gibt an, dass der Datensatz überarbeitet (d. h. angereichert und korrekturgelesen) wurde, jedoch noch nicht entgültig bearbeitet worden ist. Der Datensatz wird in der internen Ansicht mit „Kommentar in Bearbeitung“ gekennzeichnet.
approved	Für die Veröffentlichung freigegebene Datensätze erhalten diesen Status, d. h. dass sie korrekturgelesen, ausgezeichnet und mit den augenblicklich möglichen Anmerkungen versehen sind. Veränderungen der Datei beziehen sich dann in der Regel nur noch auf die Kommentare. Solche Datensätze erhalten den Vermerk „bearbeitet“.

Zu den Dokumenttypen

Dokument

Inhaltsverzeichnis

Text

Anhang

Zu den Dokumenttypen

Dokumenttyp I (Volltexterfasste Datensätze)

Gesperrte Inhalte

Zur allgemeinen Struktur volltexterfasster Dokumente

Grundstruktur des Textes

Listen und Tabellen

Lyrik im Text

Postalische Dokumente

Briefe (allgemein)

Briefe (auf Briefpapier)

Karten/Postkarten

Telegramme

Erfassung der Telegrammstruktur

Telegramme mit mehreren Quellen

Umschläge

Stempel/Briefmarken

Schriftstücke

Übersetzungen

Dokumenttyp II (Katalogdatensätze)

Personen

Werke

Musikalische Werke (MEI)

Literarische Werke (TEI)

Bildnerische Werke (TEI)

Orte

Organisationen/Institutionen

Rollen und Charaktere

Literatur/Schriften

Erfassung von Ereignissen

Briefwechsel/Korrespondenz

ID-Systematik

Revisionen

Status/Zustand der Datensätze

Zum Umgang mit Dubletten

Einzelnachweise

XML

Loading … 1