Datenmodell
Der nachfolgende Abschnitt gibt einen ersten Überblick über das Datenmodell der edition humboldt digital. Die
umfassende Dokumentation des Datenmodells ist in den Editionsrichtlinien
einsehbar.
Historische Quellen
Die Metadaten und Texte der zu edierenden Schriften (Reisetagebücher,
Dokumente und Briefe) werden nach den Richtlinien der Text Encoding Initiative
(TEI)
kodiert. Dabei wird durch Nutzung von ediarum.BASE.edit
weitgehend das Basisformat des Deutschen Textarchivs (DTABf)
(Haaf/Geyken/Wiegand 2015)
verwendet, das u.a. im Rahmen dieses Editionsvorhabens für die Kodierung von
handschriftlichen Texten erweitert wurde (Haaf/Thomas 2018). Für einige
wenige projektspezifische Belange wurden Ergänzungen und Erweiterungen zum
Tagset vorgenommen, die konform zu den TEI-Richtlinien sind. Diese
Erweiterung betrifft insbesondere projektspezifische Anforderungen, die sich
durch das Material ergeben, wie z.B. die Auszeichnung von Maßangaben oder
eingelegte oder angefügte Notizen. Bei den Erweiterungen gegenüber dem
DTABf-Datenmodell wurde aber darauf geachtet, dass diese möglichst nah an
dessen Systematik anschließen. So wurden in vielen Fällen möglichst wenig
neue Elemente und Attribute ergänzt, sondern vielmehr nur Attributwerte
ergänzt.
Alle Personen-, Orts- und Institutionsnamen sowie Literaturangaben in den Quellentexten (und ihren Metadaten) werden mit ihren jeweiligen Registereinträgen verknüpft.
Begleittexte
Alle weiteren Texte, wie z.B. die einführenden Forschungsbeiträge zum
Tagebuch-Fragment „Isle de
Cube. Antilles en général“
, wurden ebenfalls in TEI-XML gemäß dem
Basisformat des Deutschen Textarchivs erfasst.
Register
Die Register zu Personen
, Orten
und Institutionen
sowie das Glossar
werden in TEI-XML bearbeitet und vorgehalten. Jeder
Eintrag verfügt über eine eigene, eindeutige und permanente ID. Zusätzlich
zu den Basisdaten eines Eintrags wird außerdem eine Kurzbeschreibung
vorgehalten.
Die Einträge werden außerdem mit einer oder ggf. mehreren URIs aus
verschiedenen Normdateien versehen, sofern dort ein Eintrag existiert. Das
ermöglicht sowohl in der ehd selbst als auch bei Nutzung der Schnittstellen
und Datenpublikation eine projektübergreifende
Identifizierung der Personen, Orte und Instituionen (siehe zu Normdateien in
Editionen auch Stadler 2012).
Für Personeneinträge wird vornehmlich die GND, ersatzweise oder zusätzlich
auch VIAF
verwendet. Für Orte dagegen
werden dagegen URIs aus der freien Ortsdatenbank GeoNames
verwendet, da diese
weltweit eine hohe Abdeckung erzielt und Einträge bei Bedarf vom Vorhaben
selbst ergänzt werden können. So wurden einige wenige, in GeoNames fehlende,
Örtlichkeiten (wie die ehemaligen Standorte der Berliner Sternwarte
)
dort nachgetragen.
Darüber hinaus wurden im Rahmen des Projekts die Registerangaben von 25
zwischen 1973 und 2016 veröffentlichten Editionen (Briefe, Dokumente,
Tagebuch-Exzerpte) der Alexander von Humboldt-Forschung retrodigitalisiert
und zusätzlich bereitgestellt. Die Registerinformationen der gedruckten
Editionen sind Teil der zunächst im Akademie-Verlag und schließlich bei De
Gruyter veröffentlichten Reihe Beiträge zur Alexander von Humboldt-Forschung
,
herausgegeben von der Alexander-von-Humboldt-Forschungsstelle (1970–2014)
der BBAW.
Verknüpfungen zu anderen Registereinträgen und den edierten Materialien werden anhand der ehd-ID automatisiert aus der Datenbank ausgelesen.
Humboldt'sche Verweissiglen
Auf Manuskripten von Alexander von Humboldt sind manchmal sog. Siglen zu finden, also Buchstabenkombinationen, die verschiedene Dokumente, Briefe und Tagebuchaufzeichnungen mit einander in Beziehung setzen. Diese Siglen wurden nicht nur transkribiert, sondern auch in einem eigenen TEI-XML-Register eingetragen und von den Textstellen dorthin verknüpft. So können die Beziehungen auch in der digitalen Edition nachverfolgt werden.
Pflanzenregister
Für das Pflanzenregister
werden keine eigenen Einträge in
TEI-XML-Registerdateien angelegt (wie bei den anderen Registern).
Stattdessen werden die wissenschaftlichen Pflanzennamen in den edierten
Texten mit Hilfe der entsprechenden TEI-Kodierung annotiert, ggf.
normalisiert und dann automatisch ausgelesen. Das Pflanzenregister wird
somit komplett dynamisch erstellt. Zu jedem distinkten Pflanzennamen
werden die Belegstellen in den Texten gelistet und automatisiert mit
verschiedenen taxonomischen Datenbanken verlinkt (siehe unten, Abschnitt
Globale Indizes für
wissenschaftliche Namen
).
Seit Version 10 (2024) wird das eigentlich dynamische Pflanzenregister allerdings zusätzlich automatisiert als TEI-XML erstellt (inkl. interne und externe Verweise). Dadurch kann das Pflanzenregister auch in Zukunft der Datenpublikation beigegeben werden.
Zeichnungen und Skizzen
Seit der Version 9 gibt ein virtuelles „Register“ einen Überblick über Zeichnungen und Skizzen aus Humboldts oder anderer zeitgenössischer Hand in den edierten Texten. Es wird – ähnlich wie das Pflanzenregister – automatisiert aus den mit figure ausgezeichneten Abbildungen zusammengestellt.
Bibliographie
Die Bibliographie
der Edition wird in der
Literaturverwaltungssoftware Zotero gepflegt. Die öffentlich einsehbare
Zotero-Gruppe
ermöglicht die kollaborative Pflege der Daten
und kann von allen Interessierten abgerufen werden – auch in
verschiedenen Zitierstilen und Exportformaten (siehe unten).
Dokumentation
Die Dokumentation des Datenmodells erfolgt in DITA
, genauer gesagt in den DITA-Dateien von ediarum.BASE.manual
. Dadurch werden Synergien genutzt sowie
Spezifizierungen oder Modifikationen gegenüber dem Datenmodell von
ediarum.BASE.edit dokumentiert. DITA (und nicht ODD) wurde gewählt, um diese
Kombination von ediarum.BASE.manual und Richtlinien
der edition humboldt digital
zu ermöglichen. Darüber hinaus
beinhaltet die interne DITA-Dokumentation nicht nur die
Kodierungsrichtlinien anhand des konkreten Materials, sondern auch die
konkreten Bedienungsanweisungen in
ediarum.AVHR.edit.
Die Editionsrichtlinien verweisen jeweils auf die entsprechenden Teile der Dokumentation des DTABf.
Schema
Wurde das Schema anfangs in RelaxNG formuliert und gepflegt, liegt es
mittlerweile als TEI-ODD-Datei (Viglianti 2019) vor (aus der aber weiterhin RNG-Derivate
erstellt werden). Es wird mit Hilfe des ODD-Chaining vom ediarum.BASE.schema
abgeleitet, das wiederum vom DTABf ebgeleitet wird. Dadurch ist es möglich,
auf jeder Ebene (ediarum, edition humboldt digital) die jeweiligen
Änderungen zum nächst-"höheren" Schema zu pflegen und nachzuvollzuziehen.
Das Schema (sowohl TEI-ODD-Datei als auch RNG-Datei) sind auf GitHub
veröffentlicht.
Software & Technologien
Die Publikation edition humboldt digital wird von der
Erfassung bis hin zur Publikation in ediarum erstellt.
Die digitale Arbeitsumgebung ediarum
ist eine von der DH-Initiative TELOTA
seit 2012
entwickelte Lösung, die es den Wissenschaftler:innen erlaubt, Transkriptionen
von Manuskripten, Kommentare und Registereinträge in TEI-konformem XML zu
bearbeiten, mit einem Text- und Sachapparat zu versehen und anschließend im Web
und als PDF zu veröffentlichen (Dumont/Fechner 2014). Dabei besteht ediarum
aus mehreren Softwaremodulen, die zur Erarbeitung einer digitalen Edition
entsprechend angepasst wurden. Zur Eingabe und Bearbeitung der Daten wird bei
der edition humboldt digital das Modul ediarum.BASE.edit
benutzt, das – wie es bei ediarum üblich ist – durch eine projektspezifisches
Modul ediarum.AVHR.edit ergänzt wird. Über das Modul
ediarum.REGISTER.edit werden die Registereinträge angelegt und gepflegt.
Ausnahme ist die Bibliographie, die in der Literaturverwaltungssoftware Zotero
gepflegt wird, dafür bietet ediarum.DB eine
entsprechende Schnittstelle zur Synchronisierung.
Die Speicherung der Daten erfolgt zuerst in einem Git (Fechner/Klappenbach/Lampert 2025) und
in einer zweiten Stufe (automatisiert) in einer Instanz der freien XML-Datenbank
existdb
, hier wird auch das
Modul ediarum.DB zur Verwaltung der Daten genutzt.
Existdb dient – zusammen mit dem Webserver Jetty – als Basis der digitalen
Edition, die mit XQuery, XSLT und XPath realisiert wurde und mittlerweile in
einer eXistdb-App gemäß den EXPath packaging specifications vorgehalten wird,
was Deployment und Entwicklung vereinfacht. Für die Suchfunktionen wird die seit
eXistdb 5.0 verfügbare, auf Lucene basierende Facettierung genutzt. Darüber
hinaus verfügt die Edition über mehrere eigens programmierte Caches, die die
Performance insbesondere bei aufwendigen Abfragen erhöhen. Zur Anzeige der
Faksimiles, Zeichnungen und Abbildungen wird die am MPI für
Wissenschaftsgeschichte entwickelte Software digilib
eingesetzt.
Gestaltung & Webdesign
Die Gestaltung der edition humboldt digital entstammt Entwürfen, die der Autor ursprünglich 2014 für das Vorhaben „Schleiermacher in Berlin 1808-1834“ entwickelte. Aufgrund der grundsätzlichen Ähnlichkeit des Editionstypus und der zu präsentierenden Quellengattungen, konnten die Entwürfe nachgenutzt und für die ehd weiterentwickelt werden.
Die Gestaltung lehnt sich an Prinzipien des „Flat Designs“ an, d.h. Schlichtheit, Minimalismus und ein starker Fokus auf Typographie. Gerade letzteres ist ein zentraler Punkt, geht es doch bei dieser digitalen Edition vor allem um eines: Text. Daher wurde sich auch für eine Antiqua (PT Serif) als Hauptschrift entschieden, die über einen echten kursiven Schnitt verfügt. Begleitet wird sie von einer Groteske (PT Sans) aus derselben Schriftsippe, die vor allem in Subnavigationen, kleiner gesetzt Hinweistexten und Metangaben zum Einsatz kommt. Diesen klassischen typographischen Konventionen, soweit sie sich sinnvoll aufs digitale Medium Web übertragen ließen, wurde auch bei der weiteren Gestaltung Rechnung getragen. So wurde beispielsweise auf eine flexible, sich an die Breite des Viewports orientierende Textbreite verzichtet - zugunsten einer festen, die in etwa mit der typographisch empfohlenen Zeilenlänge korrespondiert.
Der Gestaltungsansatz verzichtet auch bewusst auf einen Seitenheader: Um den Texten möglichst viel Platz einzuräumen, wurde nur eine niedrige, aber durch die schwarze Farbe gut sichtbare Navigationsleiste oben platziert. Den Seitenkopf nimmt anstelle von (2014 durchaus üblichen) Website-Titel und Trägerlogos der Dokumenttitel oder Titel der einzelnen Seite ein. Gleichzeitig bietet dieser Raum auch weiteren Metaangaben und Sub-Navigationen Platz (Chronologisches Blättern zw. den Briefen; Unterbereichsnavigation; Buchstaben im Register etc.).
Zwei Herausforderungen hat die Gestaltung zu meistern: Zum einen die Fülle an unterschiedlichen Texttypen (edierte Briefe, Tagebcher, Dokumente; Forschungsbeiträge und Register) und Informationen, die untergebracht werden wollen. Hier verfolgt die Gestaltung ehd das Prinzip, nicht alles sofort zu zeigen, sondern bestimmte Informationen erst auf Nutzerinteraktion einzublenden. Stets soll genügend Weißraum bleiben, um das Auge auch mal ruhen zu lassen bzw. die unterschiedlichen Informationen sinnvoll gruppieren und priorisieren zu können. Eine zweite Herausforderung war (und ist) die Gestaltung an die sich ändernenden Anforderungen und stetig wachsende Material- und Informationsfülle anzupassen. Bei einem so lange laufenden Akademienvorhaben (2015–2032) war am Anfang längst noch nicht jeder Informationstyp und Funktion absehbar. So wurde auch die Gestaltung immer wieder angepasst - von der Einführung einer Subnavigation, über das Redesigns der Startseite und die Einführung der seitenbasierten Text- und Faksimiledarstellung bis hin zu den immer tiefer und komplexer ausgezeichneten edierten Texten. Das ist mal mehr, und sicherlich auch mal weniger gut gelungen.
Bei der Umsetzung des Designs in HTML wurde das 960
Grid System
eingesetzt und stark auf CSS gesetzt. Javascript wird
lediglich für spezielle – notfalls ersetzbare – Funktionen der Oberfläche
eingesetzt; die Generierung der HTML-Seiten erfolgt somit weitgehend
serverseitig, um eine Archivierung im Web Archive oder im Webarchiv der BBAW zu
erleichtern.
Verwendete externe Daten & Webservices
Die vernetzte edition humboldt digital. Gleichzeitig publiziert im
Poster "The networked edition humboldt digital". DH2023 in Graz. Abstract:
https://zenodo.org/record/8107834Für die digitale Edition wurden an mehreren Stellen Daten aus Drittprojekten nachgenutzt bzw. externe Webservices verwendet.
Cascaded Analysis Broker des Deutschen Textarchiv (DTA::CAB)
Die normale Suche kann um eine Funktion erweitert werden, die auch
historische Schreibweisen und andere Wortformen findet. Zu diesem Zweck
werden die edierten Texte mit Hilfe des Webservices DTA::CAB
linguistisch analysiert und annotiert. Dabei werden u.a. auch alle Wörter
lemmatisiert, so dass auf Basis dieses Lemmas gesucht werden kann.
DTA::CAB wurde im Rahmen des Deutschen Textarchivs
von Bryan Jurish entwickelt.
Für weitere Informationen siehe die Dokumentation
oder Jurish
2012.
Humboldts Schriften im Deutschen Textarchiv
Im Deutschen Textarchiv sind über 180
Schriften Alexander von Humboldts
TEI-XML-kodiert im Volltext
verfügbar. In der Chronologie wurde eine Funktion implementiert, die die
Titeldaten dieser Schriften mit anzeigt bzw. durchsucht. Dafür wird die vom
Deutschen Textarchiv bereitgestellte D* OpenSearch API
(dazu:OpenSearch
Description
) verwendet. So können die Volltexte von Humboldts
Schriften nicht nur angezeigt, sondern auch durchsucht werden: Die
Suchfunktion erlaubt es, die Anzahl der Treffer anzugeben und direkt auf die
Trefferliste zu verlinken.
Digitalisate-Bibliographie auf avhumboldt.de
Im Rahmen des Portals avhumboldt.de wird unter der Leitung von Tobias Kraft
seit 2009 eine Digitalisate-Bibliographie
der selbständig erschienenen Schriften
Alexander von Humboldts bereitgestellt. Die Daten dieser Bibliographie
wurden in XML konvertiert und in die Datenbank der edition humboldt digital integriert, um in der Chronologie
angezeigt werden zu können.
correspSearch
Der Webservice correspSearch
aggregiert maschinenlesbare Briefverzeichnisse von gedruckten oder digitalen
Briefeditionen und macht sie zentral recherchierbar (Dumont et al 2023;
Dumont 2018). Darüber
hinaus bietet er eine Schnittstelle
an, die es ermöglicht, diese Daten auch
automatisiert abzufragen und in eigenen Programmen nachzunutzen. Da
Humboldts Korrespondenz (Schwarz
2018) schon in den 1960er Jahren als zu umfangreich angesehen
wurde, um sie in einer Gesamtausgabe zu edieren, wird sie seitdem in
einzelnen Briefwechselausgaben oder gar Aufsätzen (v.a. in der Zeitschrift
Humboldt im Netz
)
verstreut veröffentlicht (Schröder
2008). In correspSearch sind erstmals fast alle über 6000 publizierten Briefe an und von Alexander von Humboldt
zusammengeführt und für die Forschung recherchierbar gemacht.
In der edition humboldt digital werden diese Daten
über die API von correspSearch an zwei Stellen abgefragt: zum einen in der
Chronologie
(bei entsprechender Aktivierung dieser Option);
dadurch werden die über 1600 Einträge zu Humboldts Leben mit seiner
publizierten Korrespondenz zusammengebracht. Zum anderen wird die
correspSearch-API in der Einzelansicht eines Briefes unter „Briefnetz
erkunden“ angefragt. Dort werden Briefe von und an Alexander Humboldt aus
anderen Editionen abgefragt, um sichtbar zu machen, mit welchen anderen
Korrespondenzpartner:innen Humboldt im jeweiligen Zeitraum noch Kontakt
hatte. Darüber hinaus wird auch angezeigt, welche Briefe der jeweilige
Korrespondenzpartner:innen im entsprechenden Zeitraum empfangen und
versendet hat – die Abfrage erfolgt dabei anhand der im Register
hinterlegten GND- oder VIAF-URI. Auf diese Weise wird der „erweiterte
Korrespondenzkontext“ des Briefnetzes sichtbar gemacht (Dumont 2023). Diese Funktion
wurde ursprünglich in der edition humboldt digital
auf Basis von XQuery prototypisch entwickelt und danach im DFG-Projekt
correspSearch als frei nachnutzbares Javascript-Widget csLink
neu umgesetzt (Müller-Laackman / Dumont 2022). Dieses
kommt auch mittlerweile in der ehd zum Einsatz.
Praktiken der Monarchie: Hofkalendarium
Ebenfalls in die Chronologie integriert sind Ereignisse am preußischen Hof, an denen Alexander von Humboldt
teilgenommen hat
und die im Hofkalendarium
,
das Teil der Publikation „Praktiken der Monarchie“ ist, verzeichnet sind. Zu
diesem Zweck werden die TEI-XML-Daten des Hofkalendariums in die edition humboldt digital übernommen und die
Personenerwähnungen anhand der GND-URIs auf das ehd-Register gemappt (sofern
vorhanden, andernfalls verlinken sie auf die Registereinträge der Praktiken der Monarchie).
GeoNames & OpenStreetMap
Die im Register verzeichneten Orte und Institutionsstandorte sind in der
Regel mit einer URI der freien geographischen Datenbank GeoNames
versehen. So können die Orte projektübergreifend identifiziert werden, was
die Nachnutzung der Daten erheblich vereinfacht. Anhand der GeoNames-URI
werden auch die geographischen Koordinaten bezogen, auf deren Basis mit
Hilfe des freien Kartendienstes OpenStreetMap
eine entsprechende Karte bei den Orts- und
Institutionseinträgen angezeigt werden kann. Das ist insbesondere bei
kleineren Orten der verschiedenen Reisen Alexander von Humboldts
hilfreich.
Mit der Version 11 der edition humboldt digital wurden die geodatenbasierten
Funktionen im Ortsregister erweitert: Eine interaktive Weltkarte
gibt nun einen Überblick über alle Orte,
die im Ortsregister verzeichnet sind. Außerdem werden zu einem einzelnen Ort
in seinem Registereintrag benachbarte Orte, die ebenfalls im Register
aufgeführt werden, in einem Umkreis von ca. 30 km angezeigt - sowohl in der
Karte als auch als Liste mit Entfernungsangaben (Beispiel: Zmeëvka
).
Gemeinsame Normdatei & BEACON
Anhand der in einem Eintrag des Personenregisters notierten URI aus der Gemeinsamen Normdatei
(GND) können weitere
Daten über den GND-Webservice „Entity Facts“ bezogen werden. So werden mit
Hilfe der „Entity Facts“ zum einen die Porträts direkt von Wikimedia Commons
eingeblendet, zum anderen werden Informationen zu (familiären,
freundschaftlichen etc.) Beziehungen zwischen Personen bezogen. Diese werden
anhand der GND-URIs auch in der ehd automatisiert ausgewertet und dann
entsprechend den Benutzer:innen angezeigt (siehe z.B. den Eintrag zu Samuel Thomas
Soemmerring
).
Die GND-ID erlaubt es darüber hinaus, weitere Editionen, Lexika und Projekte
zu verlinken, die im Themenbereich der edition humboldt
digital relevant sind. Hierfür werden die BEACON-Schnittstellen
dieser Projekte genutzt. So ist es etwa möglich, thematische
Überschneidungen mit anderen Projekten des Zentrums Preußen-Berlin an der
BBAW
über die Verbindungen in den Registerdaten zu identifizieren
und der Forschung bereitzustellen (Beispiel Wilhelm von Humboldt
oder Friedrich
Schleiermacher
). Aber auch externe Angebote, wie z.B. Hidden Kosmos
oder Die deutsche
Biographie
werden so automatisiert verlinkt.
Globale Indizes für wissenschaftliche Namen
Im Pflanzenregister (siehe
oben
) werden verschiedene Webservices und APIs benutzt, um
wissenschaftliche Pflanzennamen aus Texten der edition
humboldt digital automatisiert mit passenden Einträgen aus
taxonomischen Datenbanken zu verknüpfen. Mithilfe des Webservices Global Names Resolver
verlinkt das Pflanzenregister wissenschaftliche Namen mit Einträgen in der
Encylopedia of Life
, Tropicos - Missouri Botanical
Garden
, The International
Plant Names Index
(IPNI). Darüber hinaus werden der Catalogue of Life
, die
Biodiversity Heritage
Library
und die Global
Biodiversity Information Facility
anhand ihrer eigenen
Schnittstellen abgefragt und ebenfalls verknüpft. Weitere Datenbanken
können, sofern sie über entsprechende technische Schnittstellen verfügen, in
Zukunft ergänzt werden.
Die Abfrage der verschiedenen Datenbanken und automatisierte Verlinkung erfolgt dabei auf Basis des wissenschaftlichen Pflanzennamens, der im edierten Text entsprechend kodiert und ggf. normalisiert wird.
Datenbereitstellung & APIs
Lizenzierung
Die edition humboldt digital nutzt nicht nur externe
Daten und Webservices nach, sondern stellt ihre Daten auch wiederum unter
der freien Creative Commons-Lizenz CC BY-SA 4.0
über eine Schnittstelle und
als eigenständige Datenpublikation
zur Verfügung.
TEI-XML-Schnittstelle
Alle edierten Texte, Forschungsbeiträge und Chronologie- und Registereinrräge
der edition humboldt digital können über die
TEI-XML-Schnittstelle http://edition-humboldt.de/api/v1.2/tei-xml.xql
(man beachte die
Version 1.2) abgerufen werden.
Beim Aufruf ohne die Parameter wird eine Liste aller Daten mit Titel und Permalink der jeweiligen aktuellen Version angeboten. Beim Abruf mit Parameter type wird eine Liste der jeweiligen Dokumenttypen erzeugt (siehe nachstehende Tabelle). Beim Abruf mit Parameter id wird das jeweilige Dokument ausgegeben.
Parameter type
| Werte | Beschreibung |
|---|---|
| [nicht gesetzt] | alle Datensätze im Personenregister; standardmäßig gesetzt, sofern nicht anders angegeben |
| correspondents | alle Korrespondenzpartner |
| personsMentioned | alle erwähnten Personen |
Datenpublikation
Alle edierten Texte, Forschungsbeiträge sowie das Personen-, Orts-, Institutionen- und Siglenregister werden auch als Gesamt-TEI-XML-Datensatz der edition humboldt digital veröffentlicht. Dazu werden die Texte und Einträge nicht einfach aus der eXistdb exportiert, sondern mit Hilfe eines XQuery-Skriptes über die TEI-XML-API 2.0 der ehd abgerufen, damit das Datenbild mit dem der über die API zugänglichen Daten übereinstimmt. Dadurch die dort stattfindenden Anreicherungen (z.B. GNDs; URIs statt IDs), die Harmonisierungen ans DTABf sowie die Aufteilung der Registerlisten in einzelne TEI-XML-Dateien genutzt. Dabei wird auch die Verzeichnisstruktur so geändert, dass die Daten nach Typ (d.h. Briefe, Tagebücher, Forschungsbeiträge, Registereinträge etc.) gegliedert vorliegen.
Zur ersten rein technischen Versionierung werden die so abgerufenen
TEI-XML-Dateien in ein Git-Repositorium gespielt, das auch öffentlich
einsehbar auf GitHub zur Verfügung steht
. Nach einer Überprüfung
und Ergänzung mit dem TEI-XML-Schema der ehd (als RNG) wird der Datensatz
von dort nach Zenodo exportiert, um dort langzeitarchiviert zur freien
Verfügung zu stehen: https://doi.org/10.5281/zenodo.13752841
(kanonische URL, verlinkt stets zur aktuellsten publizierten Version).
Weitere APIs
OAI-PMH
Die Metadaten der edierten Texte sowie der Forschungsbeiträge werden
über die Schnittstelle https://edition-humboldt.de/api/v1.1/oai-pmh.xql?verb=Identify
gemäß dem
Protocoll for
Metadata Harvesting der Open Archive Initiative
bereitgestellt. Dadurch werden diese Texte auch automatisch in der Bielefeld Academic Search
Enginge (BASE)
nachgewiesen. Als Metadatenformat für OAI-PMH
wird derzeit nur Dublin Core unterstützt.
CMIF-Schnittstelle
Über diese Schnittstelle können die Korrspondenzmetadaten aller in dieser
Edition vorhandenen Briefe im Correspondence Metadata Interchange Format (CMIF)
abgerufen
werden. Dadurch werden die in dieser Edition edierten Briefe in
correspSearch nachgewiesen.
Die Schnittstelle unterstützt auch schon einige Erweiterungen von CMIF v2
. So werden die erwähnten
Personen sowie die URL zum jeweiligen TEI-XML-Volltext ausgegeben.
Letzteres ermöglicht es, dass auch in correspSearch diese Briefe im
Volltext durchsucht und gefunden werden können (Beispiel:
“fieber*”
).
URL: http://edition-humboldt.de/api/v1.2/cmif.xql![]()
BEACON-Dateien
Die im ehd-Datenbestand vorhandenen und mit der GND
-URI ausgezeichneten Personen können via http://edition-humboldt.de/api/v1.2/beacon.xql
als Liste im
BEACON-Format
abgerufen und darüber in externen digitalen
Angeboten automatisch verlinkt werden. Es ist dabei möglich, die Liste
auf Personen zu beschränken, die im Brieftext erwähnt werden oder die
Korrespondenzpartner sind (siehe nachfolgende Tabelle).
Parameter
type
| Werte | Beschreibung |
|---|---|
| [nicht gesetzt] | alle Datensätze im Personenregister; standardmäßig gesetzt, sofern nicht anders angegeben |
| correspondents | alle Korrespondenzpartner |
| personMentioned | alle erwähnten Personen |
authority
Alle Personen mit einer Norm-ID einer bestimmten Norm-Datei (eingeschränkt ggf. durch type)
| Wert | Beschreibung |
| gnd | Gemeinsame Normdatei der Deutschen Nationalbiblitothek; standardmäßig gesetzt, sofern nicht anders angegeben |
| viaf | Virtual International Authority File |
Context Objects in span (COinS) & Zotero-API
Die Einträge der Bibliographie sind ebenfalls über APIs zugänglich. Zum
einen werden sie jeweils als maschinenlesbare ContextObjects in Spans
in die HTML-Seite der edition humboldt digital eingebettet. Dadurch
können sie direkt per Mausklick in gängige Literaturverwaltungssysteme
übernommen werden. Zum anderen ist die komplette Biographie als
öffentlich einsehbare Zotero-Gruppe auch über die Zotero-API
unter https://api.zotero.org/groups/667230/items
zugänglich.
Versionierung, Permalinks und Zitierhinweise
Die in edition humboldt digital bereitgestellten Texte
und Daten werden versioniert vorgehalten, d.h. jede veröffentlichte Version
(i.d.R. eine pro Jahr) der Inhalte wird zum Abruf vorgehalten. Versioniert wird
dabei stets der gesamte, veröffentlichte Datenbestand. Dadurch bilden auch die
Registereinträge die Verknüpfungen der jeweiligen Version ab (vgl. z.B. den
Eintrag zu Georg Forster in Version 1
gegenüber
Version 9
).
Einen Überblick über die Veränderungen zwischen den Versionen der edition humboldt digital gibt die mit Version 8
eingeführte Versionsgeschichte
. Dabei werden auch die Anzahl der edierten Seiten,
angelegten Chronologie- und Registereinträge sowie kodierten
Entitätenverknüpfungen ausgewertet.
Alle Texte sind sowohl mit einem Zitierhinweis, als auch mit Permalinks versehen,
die auf die jeweilige Version referenzieren (z.B.: http://edition-humboldt.de/v1/H0002656
; zur Zitier- und
Referenzierbarkeit bei digitalen Editionen vgl. Bleier 2021). Bei Bedarf kann dabei
bei edierten Texten auch auf das jeweilige Folium referenziert werden, indem
einfach die Folio-Angabe im Pfad ergänzt wird z.B. https://edition-humboldt.de/v9/H0002656/2v
. Forschungsbeiträge, die
aufgrund ihres „digital born“-Charakters nicht über Seitenzahlen verfügen,
können dagegen absatzweise zitiert werden. Dazu wird die Absatznummer (die stets
links oben nebem jeden Absatz angezeigt wird) als sog. Fragment-Identifier mit
einer # angehängt, z.B. https://edition-humboldt.de/v9/H0016432#3
. Neben den Texten und
Registereinträgen sind auch bestimmte Unterbereiche (Themenschwerpunkte und
verschiedene Briefwechsel), die sich – wie ein Band – eigentlich aus mehreren
Texten zusammensetzen, mit eigenen Zitierhinweisen inkl. Permalinks versehen
(z.B. https://edition-humboldt.de/X0000003
).
Darüber hinaus sind die einzelnen Texte und Datensätze auch mit einer kanonischen
URL versehen, die stets auf die aktuellste Version weiterleitet. Dabei entfällt
einfach der Versionshinweis im Pfad, z.B. http://edition-humboldt.de/H0002656
.
Durch die kanonischen und gleichförmigen URLs („H“ und eine siebenstellige Ziffer) ist es auch möglich geworden, dass die gedruckten Bände der edition humboldt print bei edierten Texten auf das digitale Pendant zurückverlinken.
Die Oberfläche an sich, d.h. die XQL-, XSLT- und JS-Skripte sowie CSS- und
sonstige Dateien, wird derzeit nicht öffentlich versioniert. Sie wird aber für
Entwicklungszwecke in einem Git versioniert und vorgehalten. Für die Zukunft ist
darüber hinaus angedacht, jede Version der digitalen Edition (als Oberfläche)
zusätzlich im Web-Archiv der
BBAW
abzulegen und dort vorzuhalten. Dabei wird die edition humboldt digital derzeit schon so technisch vorbereitet, dass
sie sich bestmöglichst archivieren lässt.
Davon unabhängig werden zusätzlich die Daten dauerhaft auf Zenodo publiziert und archviert (siehe Abschnitt „Datenpublikation“).