edition humboldt digital

Digitale Methodik

Ein Überblick über Datenmodellierung, Technologien und Schnittstellen in der edition humboldt digital

Stefan Dumont

Datenmodell

Der nachfolgende Abschnitt gibt einen ersten Überblick über das Datenmodell der edition humboldt digital. Die umfassende Dokumentation des Datenmodells ist in den Editionsrichtlinien einsehbar.

Historische Quellen

Die Metadaten und Texte der zu edierenden Schriften (Reisetagebücher, Dokumente und Briefe) werden nach den Richtlinien der Text Encoding Initiative (TEI) kodiert. Dabei wird durch Nutzung von ediarum.BASE.edit weitgehend das Basisformat des Deutschen Textarchivs (DTABf) (Haaf/Geyken/Wiegand 2015) verwendet, das u.a. im Rahmen dieses Editionsvorhabens für die Kodierung von handschriftlichen Texten erweitert wurde (Haaf/Thomas 2018). Für einige wenige projektspezifische Belange wurden Ergänzungen und Erweiterungen zum Tagset vorgenommen, die konform zu den TEI-Richtlinien sind. Diese Erweiterung betrifft insbesondere projektspezifische Anforderungen, die sich durch das Material ergeben, wie z.B. die Auszeichnung von Maßangaben oder eingelegte oder angefügte Notizen. Bei den Erweiterungen gegenüber dem DTABf-Datenmodell wurde aber darauf geachtet, dass diese möglichst nah an dessen Systematik anschließen. So wurden in vielen Fällen möglichst wenig neue Elemente und Attribute ergänzt, sondern vielmehr nur Attributwerte ergänzt.

Alle Personen-, Orts- und Institutionsnamen sowie Literaturangaben in den Quellentexten (und ihren Metadaten) werden mit ihren jeweiligen Registereinträgen verknüpft.

Begleittexte

Alle weiteren Texte, wie z.B. die einführenden Forschungsbeiträge zum Tagebuch-Fragment „Isle de Cube. Antilles en général“, wurden ebenfalls in TEI-XML gemäß dem Basisformat des Deutschen Textarchivs erfasst.

Register

Die Register zu Personen, Orten und Institutionen sowie das Glossar werden in TEI-XML bearbeitet und vorgehalten. Jeder Eintrag verfügt über eine eigene, eindeutige und permanente ID. Zusätzlich zu den Basisdaten eines Eintrags wird außerdem eine Kurzbeschreibung vorgehalten.

Die Einträge werden außerdem mit einer oder ggf. mehreren URIs aus verschiedenen Normdateien versehen, sofern dort ein Eintrag existiert. Das ermöglicht sowohl in der ehd selbst als auch bei Nutzung der Schnittstellen und Datenpublikation eine projektübergreifende Identifizierung der Personen, Orte und Instituionen (siehe zu Normdateien in Editionen auch Stadler 2012). Für Personeneinträge wird vornehmlich die GND, ersatzweise oder zusätzlich auch VIAF verwendet. Für Orte dagegen werden dagegen URIs aus der freien Ortsdatenbank GeoNames verwendet, da diese weltweit eine hohe Abdeckung erzielt und Einträge bei Bedarf vom Vorhaben selbst ergänzt werden können. So wurden einige wenige, in GeoNames fehlende, Örtlichkeiten (wie die ehemaligen Standorte der Berliner Sternwarte) dort nachgetragen.

Darüber hinaus wurden im Rahmen des Projekts die Registerangaben von 25 zwischen 1973 und 2016 veröffentlichten Editionen (Briefe, Dokumente, Tagebuch-Exzerpte) der Alexander von Humboldt-Forschung retrodigitalisiert und zusätzlich bereitgestellt. Die Registerinformationen der gedruckten Editionen sind Teil der zunächst im Akademie-Verlag und schließlich bei De Gruyter veröffentlichten Reihe Beiträge zur Alexander von Humboldt-Forschung, herausgegeben von der Alexander-von-Humboldt-Forschungsstelle (1970–2014) der BBAW.

Verknüpfungen zu anderen Registereinträgen und den edierten Materialien werden anhand der ehd-ID automatisiert aus der Datenbank ausgelesen.

Humboldt'sche Verweissiglen

Auf Manuskripten von Alexander von Humboldt sind manchmal sog. Siglen zu finden, also Buchstabenkombinationen, die verschiedene Dokumente, Briefe und Tagebuchaufzeichnungen mit einander in Beziehung setzen. Diese Siglen wurden nicht nur transkribiert, sondern auch in einem eigenen TEI-XML-Register eingetragen und von den Textstellen dorthin verknüpft. So können die Beziehungen auch in der digitalen Edition nachverfolgt werden.

Pflanzenregister

Für das Pflanzenregister werden keine eigenen Einträge in TEI-XML-Registerdateien angelegt (wie bei den anderen Registern). Stattdessen werden die wissenschaftlichen Pflanzennamen in den edierten Texten mit Hilfe der entsprechenden TEI-Kodierung annotiert, ggf. normalisiert und dann automatisch ausgelesen. Das Pflanzenregister wird somit komplett dynamisch erstellt. Zu jedem distinkten Pflanzennamen werden die Belegstellen in den Texten gelistet und automatisiert mit verschiedenen taxonomischen Datenbanken verlinkt (siehe unten, Abschnitt Globale Indizes für wissenschaftliche Namen).

Seit Version 10 (2024) wird das eigentlich dynamische Pflanzenregister allerdings zusätzlich automatisiert als TEI-XML erstellt (inkl. interne und externe Verweise). Dadurch kann das Pflanzenregister auch in Zukunft der Datenpublikation beigegeben werden.

Zeichnungen und Skizzen

Seit der Version 9 gibt ein virtuelles „Register“ einen Überblick über Zeichnungen und Skizzen aus Humboldts oder anderer zeitgenössischer Hand in den edierten Texten. Es wird – ähnlich wie das Pflanzenregister – automatisiert aus den mit figure ausgezeichneten Abbildungen zusammengestellt.

Bibliographie

Die Bibliographie der Edition wird in der Literaturverwaltungssoftware Zotero gepflegt. Die öffentlich einsehbare Zotero-Gruppe ermöglicht die kollaborative Pflege der Daten und kann von allen Interessierten abgerufen werden – auch in verschiedenen Zitierstilen und Exportformaten (siehe unten).

Dokumentation

Die Dokumentation des Datenmodells erfolgt in DITA, genauer gesagt in den DITA-Dateien von ediarum.BASE.manual. Dadurch werden Synergien genutzt sowie Spezifizierungen oder Modifikationen gegenüber dem Datenmodell von ediarum.BASE.edit dokumentiert. DITA (und nicht ODD) wurde gewählt, um diese Kombination von ediarum.BASE.manual und Richtlinien der edition humboldt digital zu ermöglichen. Darüber hinaus beinhaltet die interne DITA-Dokumentation nicht nur die Kodierungsrichtlinien anhand des konkreten Materials, sondern auch die konkreten Bedienungsanweisungen in ediarum.AVHR.edit.

Die Editionsrichtlinien verweisen jeweils auf die entsprechenden Teile der Dokumentation des DTABf.

Schema

Wurde das Schema anfangs in RelaxNG formuliert und gepflegt, liegt es mittlerweile als TEI-ODD-Datei (Viglianti 2019) vor (aus der aber weiterhin RNG-Derivate erstellt werden). Es wird mit Hilfe des ODD-Chaining vom ediarum.BASE.schema abgeleitet, das wiederum vom DTABf ebgeleitet wird. Dadurch ist es möglich, auf jeder Ebene (ediarum, edition humboldt digital) die jeweiligen Änderungen zum nächst-"höheren" Schema zu pflegen und nachzuvollzuziehen. Das Schema (sowohl TEI-ODD-Datei als auch RNG-Datei) sind auf GitHub veröffentlicht.

Software & Technologien

Die Publikation edition humboldt digital wird von der Erfassung bis hin zur Publikation in ediarum erstellt. Die digitale Arbeitsumgebung ediarum ist eine von der DH-Initiative TELOTA seit 2012 entwickelte Lösung, die es den Wissenschaftler:innen erlaubt, Transkriptionen von Manuskripten, Kommentare und Registereinträge in TEI-konformem XML zu bearbeiten, mit einem Text- und Sachapparat zu versehen und anschließend im Web und als PDF zu veröffentlichen (Dumont/Fechner 2014). Dabei besteht ediarum aus mehreren Softwaremodulen, die zur Erarbeitung einer digitalen Edition entsprechend angepasst wurden. Zur Eingabe und Bearbeitung der Daten wird bei der edition humboldt digital das Modul ediarum.BASE.edit benutzt, das – wie es bei ediarum üblich ist – durch eine projektspezifisches Modul ediarum.AVHR.edit ergänzt wird. Über das Modul ediarum.REGISTER.edit werden die Registereinträge angelegt und gepflegt. Ausnahme ist die Bibliographie, die in der Literaturverwaltungssoftware Zotero gepflegt wird, dafür bietet ediarum.DB eine entsprechende Schnittstelle zur Synchronisierung.

Die Speicherung der Daten erfolgt zuerst in einem Git (Fechner/Klappenbach/Lampert 2025) und in einer zweiten Stufe (automatisiert) in einer Instanz der freien XML-Datenbank existdb, hier wird auch das Modul ediarum.DB zur Verwaltung der Daten genutzt. Existdb dient – zusammen mit dem Webserver Jetty – als Basis der digitalen Edition, die mit XQuery, XSLT und XPath realisiert wurde und mittlerweile in einer eXistdb-App gemäß den EXPath packaging specifications vorgehalten wird, was Deployment und Entwicklung vereinfacht. Für die Suchfunktionen wird die seit eXistdb 5.0 verfügbare, auf Lucene basierende Facettierung genutzt. Darüber hinaus verfügt die Edition über mehrere eigens programmierte Caches, die die Performance insbesondere bei aufwendigen Abfragen erhöhen. Zur Anzeige der Faksimiles, Zeichnungen und Abbildungen wird die am MPI für Wissenschaftsgeschichte entwickelte Software digilib eingesetzt.

Gestaltung & Webdesign

Die Gestaltung der edition humboldt digital entstammt Entwürfen, die der Autor ursprünglich 2014 für das Vorhaben „Schleiermacher in Berlin 1808-1834“ entwickelte. Aufgrund der grundsätzlichen Ähnlichkeit des Editionstypus und der zu präsentierenden Quellengattungen, konnten die Entwürfe nachgenutzt und für die ehd weiterentwickelt werden.

Die Gestaltung lehnt sich an Prinzipien des „Flat Designs“ an, d.h. Schlichtheit, Minimalismus und ein starker Fokus auf Typographie. Gerade letzteres ist ein zentraler Punkt, geht es doch bei dieser digitalen Edition vor allem um eines: Text. Daher wurde sich auch für eine Antiqua (PT Serif) als Hauptschrift entschieden, die über einen echten kursiven Schnitt verfügt. Begleitet wird sie von einer Groteske (PT Sans) aus derselben Schriftsippe, die vor allem in Subnavigationen, kleiner gesetzt Hinweistexten und Metangaben zum Einsatz kommt. Diesen klassischen typographischen Konventionen, soweit sie sich sinnvoll aufs digitale Medium Web übertragen ließen, wurde auch bei der weiteren Gestaltung Rechnung getragen. So wurde beispielsweise auf eine flexible, sich an die Breite des Viewports orientierende Textbreite verzichtet - zugunsten einer festen, die in etwa mit der typographisch empfohlenen Zeilenlänge korrespondiert.

Der Gestaltungsansatz verzichtet auch bewusst auf einen Seitenheader: Um den Texten möglichst viel Platz einzuräumen, wurde nur eine niedrige, aber durch die schwarze Farbe gut sichtbare Navigationsleiste oben platziert. Den Seitenkopf nimmt anstelle von (2014 durchaus üblichen) Website-Titel und Trägerlogos der Dokumenttitel oder Titel der einzelnen Seite ein. Gleichzeitig bietet dieser Raum auch weiteren Metaangaben und Sub-Navigationen Platz (Chronologisches Blättern zw. den Briefen; Unterbereichsnavigation; Buchstaben im Register etc.).

Zwei Herausforderungen hat die Gestaltung zu meistern: Zum einen die Fülle an unterschiedlichen Texttypen (edierte Briefe, Tagebcher, Dokumente; Forschungsbeiträge und Register) und Informationen, die untergebracht werden wollen. Hier verfolgt die Gestaltung ehd das Prinzip, nicht alles sofort zu zeigen, sondern bestimmte Informationen erst auf Nutzerinteraktion einzublenden. Stets soll genügend Weißraum bleiben, um das Auge auch mal ruhen zu lassen bzw. die unterschiedlichen Informationen sinnvoll gruppieren und priorisieren zu können. Eine zweite Herausforderung war (und ist) die Gestaltung an die sich ändernenden Anforderungen und stetig wachsende Material- und Informationsfülle anzupassen. Bei einem so lange laufenden Akademienvorhaben (2015–2032) war am Anfang längst noch nicht jeder Informationstyp und Funktion absehbar. So wurde auch die Gestaltung immer wieder angepasst - von der Einführung einer Subnavigation, über das Redesigns der Startseite und die Einführung der seitenbasierten Text- und Faksimiledarstellung bis hin zu den immer tiefer und komplexer ausgezeichneten edierten Texten. Das ist mal mehr, und sicherlich auch mal weniger gut gelungen.

Bei der Umsetzung des Designs in HTML wurde das 960 Grid System eingesetzt und stark auf CSS gesetzt. Javascript wird lediglich für spezielle – notfalls ersetzbare – Funktionen der Oberfläche eingesetzt; die Generierung der HTML-Seiten erfolgt somit weitgehend serverseitig, um eine Archivierung im Web Archive oder im Webarchiv der BBAW zu erleichtern.

Verwendete externe Daten & Webservices

Die vernetzte edition humboldt digital. Gleichzeitig publiziert im Poster "The networked edition humboldt digital". DH2023 in Graz. Abstract: https://zenodo.org/record/8107834

.

Für die digitale Edition wurden an mehreren Stellen Daten aus Drittprojekten nachgenutzt bzw. externe Webservices verwendet.

Cascaded Analysis Broker des Deutschen Textarchiv (DTA::CAB)

Die normale Suche kann um eine Funktion erweitert werden, die auch historische Schreibweisen und andere Wortformen findet. Zu diesem Zweck werden die edierten Texte mit Hilfe des Webservices DTA::CAB linguistisch analysiert und annotiert. Dabei werden u.a. auch alle Wörter lemmatisiert, so dass auf Basis dieses Lemmas gesucht werden kann. DTA::CAB wurde im Rahmen des Deutschen Textarchivs von Bryan Jurish entwickelt.

Für weitere Informationen siehe die Dokumentation oder Jurish 2012.

Humboldts Schriften im Deutschen Textarchiv

Im Deutschen Textarchiv sind über 180 Schriften Alexander von Humboldts TEI-XML-kodiert im Volltext verfügbar. In der Chronologie wurde eine Funktion implementiert, die die Titeldaten dieser Schriften mit anzeigt bzw. durchsucht. Dafür wird die vom Deutschen Textarchiv bereitgestellte D* OpenSearch API (dazu:OpenSearch Description) verwendet. So können die Volltexte von Humboldts Schriften nicht nur angezeigt, sondern auch durchsucht werden: Die Suchfunktion erlaubt es, die Anzahl der Treffer anzugeben und direkt auf die Trefferliste zu verlinken.

Digitalisate-Bibliographie auf avhumboldt.de

Im Rahmen des Portals avhumboldt.de wird unter der Leitung von Tobias Kraft seit 2009 eine Digitalisate-Bibliographie der selbständig erschienenen Schriften Alexander von Humboldts bereitgestellt. Die Daten dieser Bibliographie wurden in XML konvertiert und in die Datenbank der edition humboldt digital integriert, um in der Chronologie angezeigt werden zu können.

correspSearch

Der Webservice correspSearch aggregiert maschinenlesbare Briefverzeichnisse von gedruckten oder digitalen Briefeditionen und macht sie zentral recherchierbar (Dumont et al 2023; Dumont 2018). Darüber hinaus bietet er eine Schnittstelle an, die es ermöglicht, diese Daten auch automatisiert abzufragen und in eigenen Programmen nachzunutzen. Da Humboldts Korrespondenz (Schwarz 2018) schon in den 1960er Jahren als zu umfangreich angesehen wurde, um sie in einer Gesamtausgabe zu edieren, wird sie seitdem in einzelnen Briefwechselausgaben oder gar Aufsätzen (v.a. in der Zeitschrift Humboldt im Netz) verstreut veröffentlicht (Schröder 2008). In correspSearch sind erstmals fast alle über 6000 publizierten Briefe an und von Alexander von Humboldt zusammengeführt und für die Forschung recherchierbar gemacht.

In der edition humboldt digital werden diese Daten über die API von correspSearch an zwei Stellen abgefragt: zum einen in der Chronologie (bei entsprechender Aktivierung dieser Option); dadurch werden die über 1600 Einträge zu Humboldts Leben mit seiner publizierten Korrespondenz zusammengebracht. Zum anderen wird die correspSearch-API in der Einzelansicht eines Briefes unter „Briefnetz erkunden“ angefragt. Dort werden Briefe von und an Alexander Humboldt aus anderen Editionen abgefragt, um sichtbar zu machen, mit welchen anderen Korrespondenzpartner:innen Humboldt im jeweiligen Zeitraum noch Kontakt hatte. Darüber hinaus wird auch angezeigt, welche Briefe der jeweilige Korrespondenzpartner:innen im entsprechenden Zeitraum empfangen und versendet hat – die Abfrage erfolgt dabei anhand der im Register hinterlegten GND- oder VIAF-URI. Auf diese Weise wird der „erweiterte Korrespondenzkontext“ des Briefnetzes sichtbar gemacht (Dumont 2023). Diese Funktion wurde ursprünglich in der edition humboldt digital auf Basis von XQuery prototypisch entwickelt und danach im DFG-Projekt correspSearch als frei nachnutzbares Javascript-Widget csLink neu umgesetzt (Müller-Laackman / Dumont 2022). Dieses kommt auch mittlerweile in der ehd zum Einsatz.

Praktiken der Monarchie: Hofkalendarium

Ebenfalls in die Chronologie integriert sind Ereignisse am preußischen Hof, an denen Alexander von Humboldt teilgenommen hat und die im Hofkalendarium, das Teil der Publikation „Praktiken der Monarchie“ ist, verzeichnet sind. Zu diesem Zweck werden die TEI-XML-Daten des Hofkalendariums in die edition humboldt digital übernommen und die Personenerwähnungen anhand der GND-URIs auf das ehd-Register gemappt (sofern vorhanden, andernfalls verlinken sie auf die Registereinträge der Praktiken der Monarchie).

GeoNames & OpenStreetMap

Die im Register verzeichneten Orte und Institutionsstandorte sind in der Regel mit einer URI der freien geographischen Datenbank GeoNames versehen. So können die Orte projektübergreifend identifiziert werden, was die Nachnutzung der Daten erheblich vereinfacht. Anhand der GeoNames-URI werden auch die geographischen Koordinaten bezogen, auf deren Basis mit Hilfe des freien Kartendienstes OpenStreetMap eine entsprechende Karte bei den Orts- und Institutionseinträgen angezeigt werden kann. Das ist insbesondere bei kleineren Orten der verschiedenen Reisen Alexander von Humboldts hilfreich.

Mit der Version 11 der edition humboldt digital wurden die geodatenbasierten Funktionen im Ortsregister erweitert: Eine interaktive Weltkarte gibt nun einen Überblick über alle Orte, die im Ortsregister verzeichnet sind. Außerdem werden zu einem einzelnen Ort in seinem Registereintrag benachbarte Orte, die ebenfalls im Register aufgeführt werden, in einem Umkreis von ca. 30 km angezeigt - sowohl in der Karte als auch als Liste mit Entfernungsangaben (Beispiel: Zmeëvka).

Gemeinsame Normdatei & BEACON

Anhand der in einem Eintrag des Personenregisters notierten URI aus der Gemeinsamen Normdatei (GND) können weitere Daten über den GND-Webservice „Entity Facts“ bezogen werden. So werden mit Hilfe der „Entity Facts“ zum einen die Porträts direkt von Wikimedia Commons eingeblendet, zum anderen werden Informationen zu (familiären, freundschaftlichen etc.) Beziehungen zwischen Personen bezogen. Diese werden anhand der GND-URIs auch in der ehd automatisiert ausgewertet und dann entsprechend den Benutzer:innen angezeigt (siehe z.B. den Eintrag zu Samuel Thomas Soemmerring).

Die GND-ID erlaubt es darüber hinaus, weitere Editionen, Lexika und Projekte zu verlinken, die im Themenbereich der edition humboldt digital relevant sind. Hierfür werden die BEACON-Schnittstellen dieser Projekte genutzt. So ist es etwa möglich, thematische Überschneidungen mit anderen Projekten des Zentrums Preußen-Berlin an der BBAW über die Verbindungen in den Registerdaten zu identifizieren und der Forschung bereitzustellen (Beispiel Wilhelm von Humboldt oder Friedrich Schleiermacher). Aber auch externe Angebote, wie z.B. Hidden Kosmos oder Die deutsche Biographie werden so automatisiert verlinkt.

Globale Indizes für wissenschaftliche Namen

Im Pflanzenregister (siehe oben) werden verschiedene Webservices und APIs benutzt, um wissenschaftliche Pflanzennamen aus Texten der edition humboldt digital automatisiert mit passenden Einträgen aus taxonomischen Datenbanken zu verknüpfen. Mithilfe des Webservices Global Names Resolver verlinkt das Pflanzenregister wissenschaftliche Namen mit Einträgen in der Encylopedia of Life, Tropicos - Missouri Botanical Garden, The International Plant Names Index (IPNI). Darüber hinaus werden der Catalogue of Life, die Biodiversity Heritage Library und die Global Biodiversity Information Facility anhand ihrer eigenen Schnittstellen abgefragt und ebenfalls verknüpft. Weitere Datenbanken können, sofern sie über entsprechende technische Schnittstellen verfügen, in Zukunft ergänzt werden.

Die Abfrage der verschiedenen Datenbanken und automatisierte Verlinkung erfolgt dabei auf Basis des wissenschaftlichen Pflanzennamens, der im edierten Text entsprechend kodiert und ggf. normalisiert wird.

Datenbereitstellung & APIs

Lizenzierung

Die edition humboldt digital nutzt nicht nur externe Daten und Webservices nach, sondern stellt ihre Daten auch wiederum unter der freien Creative Commons-Lizenz CC BY-SA 4.0 über eine Schnittstelle und als eigenständige Datenpublikation zur Verfügung.

TEI-XML-Schnittstelle

Alle edierten Texte, Forschungsbeiträge und Chronologie- und Registereinrräge der edition humboldt digital können über die TEI-XML-Schnittstelle http://edition-humboldt.de/api/v1.2/tei-xml.xql (man beachte die Version 1.2) abgerufen werden.

Beim Aufruf ohne die Parameter wird eine Liste aller Daten mit Titel und Permalink der jeweiligen aktuellen Version angeboten. Beim Abruf mit Parameter type wird eine Liste der jeweiligen Dokumenttypen erzeugt (siehe nachstehende Tabelle). Beim Abruf mit Parameter id wird das jeweilige Dokument ausgegeben.

Parameter type

Werte	Beschreibung
[nicht gesetzt]	alle Datensätze im Personenregister; standardmäßig gesetzt, sofern nicht anders angegeben
correspondents	alle Korrespondenzpartner
personsMentioned	alle erwähnten Personen

Datenpublikation

Alle edierten Texte, Forschungsbeiträge sowie das Personen-, Orts-, Institutionen- und Siglenregister werden auch als Gesamt-TEI-XML-Datensatz der edition humboldt digital veröffentlicht. Dazu werden die Texte und Einträge nicht einfach aus der eXistdb exportiert, sondern mit Hilfe eines XQuery-Skriptes über die TEI-XML-API 2.0 der ehd abgerufen, damit das Datenbild mit dem der über die API zugänglichen Daten übereinstimmt. Dadurch die dort stattfindenden Anreicherungen (z.B. GNDs; URIs statt IDs), die Harmonisierungen ans DTABf sowie die Aufteilung der Registerlisten in einzelne TEI-XML-Dateien genutzt. Dabei wird auch die Verzeichnisstruktur so geändert, dass die Daten nach Typ (d.h. Briefe, Tagebücher, Forschungsbeiträge, Registereinträge etc.) gegliedert vorliegen.

Zur ersten rein technischen Versionierung werden die so abgerufenen TEI-XML-Dateien in ein Git-Repositorium gespielt, das auch öffentlich einsehbar auf GitHub zur Verfügung steht. Nach einer Überprüfung und Ergänzung mit dem TEI-XML-Schema der ehd (als RNG) wird der Datensatz von dort nach Zenodo exportiert, um dort langzeitarchiviert zur freien Verfügung zu stehen: https://doi.org/10.5281/zenodo.13752841 (kanonische URL, verlinkt stets zur aktuellsten publizierten Version).

Weitere APIs

OAI-PMH

Die Metadaten der edierten Texte sowie der Forschungsbeiträge werden über die Schnittstelle https://edition-humboldt.de/api/v1.1/oai-pmh.xql?verb=Identify gemäß dem Protocoll for Metadata Harvesting der Open Archive Initiative bereitgestellt. Dadurch werden diese Texte auch automatisch in der Bielefeld Academic Search Enginge (BASE) nachgewiesen. Als Metadatenformat für OAI-PMH wird derzeit nur Dublin Core unterstützt.

CMIF-Schnittstelle

Über diese Schnittstelle können die Korrspondenzmetadaten aller in dieser Edition vorhandenen Briefe im Correspondence Metadata Interchange Format (CMIF) abgerufen werden. Dadurch werden die in dieser Edition edierten Briefe in correspSearch nachgewiesen.

Die Schnittstelle unterstützt auch schon einige Erweiterungen von CMIF v2. So werden die erwähnten Personen sowie die URL zum jeweiligen TEI-XML-Volltext ausgegeben. Letzteres ermöglicht es, dass auch in correspSearch diese Briefe im Volltext durchsucht und gefunden werden können (Beispiel: “fieber*”).

URL: http://edition-humboldt.de/api/v1.2/cmif.xql

BEACON-Dateien

Die im ehd-Datenbestand vorhandenen und mit der GND-URI ausgezeichneten Personen können via http://edition-humboldt.de/api/v1.2/beacon.xql als Liste im BEACON-Format abgerufen und darüber in externen digitalen Angeboten automatisch verlinkt werden. Es ist dabei möglich, die Liste auf Personen zu beschränken, die im Brieftext erwähnt werden oder die Korrespondenzpartner sind (siehe nachfolgende Tabelle).

Parameter

type

Werte	Beschreibung
[nicht gesetzt]	alle Datensätze im Personenregister; standardmäßig gesetzt, sofern nicht anders angegeben
correspondents	alle Korrespondenzpartner
personMentioned	alle erwähnten Personen

authority

Alle Personen mit einer Norm-ID einer bestimmten Norm-Datei (eingeschränkt ggf. durch type)

Wert	Beschreibung
gnd	Gemeinsame Normdatei der Deutschen Nationalbiblitothek; standardmäßig gesetzt, sofern nicht anders angegeben
viaf	Virtual International Authority File

Context Objects in span (COinS) & Zotero-API

Die Einträge der Bibliographie sind ebenfalls über APIs zugänglich. Zum einen werden sie jeweils als maschinenlesbare ContextObjects in Spans in die HTML-Seite der edition humboldt digital eingebettet. Dadurch können sie direkt per Mausklick in gängige Literaturverwaltungssysteme übernommen werden. Zum anderen ist die komplette Biographie als öffentlich einsehbare Zotero-Gruppe auch über die Zotero-API unter https://api.zotero.org/groups/667230/items zugänglich.

Versionierung, Permalinks und Zitierhinweise

Die in edition humboldt digital bereitgestellten Texte und Daten werden versioniert vorgehalten, d.h. jede veröffentlichte Version (i.d.R. eine pro Jahr) der Inhalte wird zum Abruf vorgehalten. Versioniert wird dabei stets der gesamte, veröffentlichte Datenbestand. Dadurch bilden auch die Registereinträge die Verknüpfungen der jeweiligen Version ab (vgl. z.B. den Eintrag zu Georg Forster in Version 1 gegenüber Version 9). Einen Überblick über die Veränderungen zwischen den Versionen der edition humboldt digital gibt die mit Version 8 eingeführte Versionsgeschichte. Dabei werden auch die Anzahl der edierten Seiten, angelegten Chronologie- und Registereinträge sowie kodierten Entitätenverknüpfungen ausgewertet.

Alle Texte sind sowohl mit einem Zitierhinweis, als auch mit Permalinks versehen, die auf die jeweilige Version referenzieren (z.B.: http://edition-humboldt.de/v1/H0002656; zur Zitier- und Referenzierbarkeit bei digitalen Editionen vgl. Bleier 2021). Bei Bedarf kann dabei bei edierten Texten auch auf das jeweilige Folium referenziert werden, indem einfach die Folio-Angabe im Pfad ergänzt wird z.B. https://edition-humboldt.de/v9/H0002656/2v. Forschungsbeiträge, die aufgrund ihres „digital born“-Charakters nicht über Seitenzahlen verfügen, können dagegen absatzweise zitiert werden. Dazu wird die Absatznummer (die stets links oben nebem jeden Absatz angezeigt wird) als sog. Fragment-Identifier mit einer # angehängt, z.B. https://edition-humboldt.de/v9/H0016432#3. Neben den Texten und Registereinträgen sind auch bestimmte Unterbereiche (Themenschwerpunkte und verschiedene Briefwechsel), die sich – wie ein Band – eigentlich aus mehreren Texten zusammensetzen, mit eigenen Zitierhinweisen inkl. Permalinks versehen (z.B. https://edition-humboldt.de/X0000003).

Darüber hinaus sind die einzelnen Texte und Datensätze auch mit einer kanonischen URL versehen, die stets auf die aktuellste Version weiterleitet. Dabei entfällt einfach der Versionshinweis im Pfad, z.B. http://edition-humboldt.de/H0002656.

Durch die kanonischen und gleichförmigen URLs („H“ und eine siebenstellige Ziffer) ist es auch möglich geworden, dass die gedruckten Bände der edition humboldt print bei edierten Texten auf das digitale Pendant zurückverlinken.

Die Oberfläche an sich, d.h. die XQL-, XSLT- und JS-Skripte sowie CSS- und sonstige Dateien, wird derzeit nicht öffentlich versioniert. Sie wird aber für Entwicklungszwecke in einem Git versioniert und vorgehalten. Für die Zukunft ist darüber hinaus angedacht, jede Version der digitalen Edition (als Oberfläche) zusätzlich im Web-Archiv der BBAW abzulegen und dort vorzuhalten. Dabei wird die edition humboldt digital derzeit schon so technisch vorbereitet, dass sie sich bestmöglichst archivieren lässt.

Davon unabhängig werden zusätzlich die Daten dauerhaft auf Zenodo publiziert und archviert (siehe Abschnitt „Datenpublikation“).