Aus dem Protokoll des 76. Kolloquiums über die Anwendung der
Elektronischen Datenverarbeitung in den Geisteswissenschaften
an der Universität Tübingen vom 3. Juli 1999

 

Tobias Ott (Tübingen)

Überlegungen zur Vorbereitung der elektronischen Publikation einer Edition am Beispiel der Leibniz-Ausgabe

Als Vertreter der Wirtschaft fällt mir bei diesem Kolloquium eine besondere Rolle zu; nämlich nicht nur das technisch, sondern auch das wirtschaftlich Machbare bei der Umsetzung einer gedruckten Edition in eine elektronische Form zu beleuchten. Es soll dabei nicht darum gehen, hier die Marktsituation für elektronische Publikationen darzustellen; vielmehr möchte ich das Vorurteil revidieren, dass qualitativ hochwertige Produktionen notwendigerweise an den zu hohen Kosten scheitern.

Wir werden sehen, dass Editionsprojekte wie das vorliegende sinnvoll nur über strukturierte Daten in eine elektronische Form zu überführen sind. Seit 25 Jahren haben wir in der Firma pagina Erfahrung mit der Konzeption und technischen Herstellung von Editionen gesammelt, wobei wir von Anfang an - lange vor den Anfängen von SGML - mit strukturierten Daten gearbeitet haben. Seit einigen Jahren produzieren wir wissenschaftliche Werke auch in elektronischer Form. Dabei steht die vollautomatische Umsetzung der Daten des gedruckten Werkes im Vordergrund unserer Anstrengungen.

Lassen Sie mich in diesem Zusammenhang auf zwei unserer Meinung nach zentrale Probleme eingehen, die unsere bzw. Ihre Arbeit von der Masse der elektronischen Publikationen unterscheidet:

  1. In kaum einer Disziplin wird soviel Zeit und Sorgfalt in die Aufbereitung eines Datenbestandes gelegt wie im wissenschaftlichen Editionswesen, da hier Fehlerfreiheit viel mehr Grundbedingung ist als dort, wo nur Inhalte transportiert werden müssen.
  2. Nirgendwo sonst gibt es eine so deutliche Diskrepanz zwischen zeitüberdauernden Forschungsergebnissen und kurzlebigem Medium wie bei dem Unterfangen, eine Edition auf elektronischem Medium zu publizieren. Betrachten wir den Markt der elektronischen Publikationen genauer, so stellen wir fest: Beim überwiegenden Teil der auf dem Markt befindlichen CD-ROMs veraltet der Inhalt (z.B. bei einem Telefonverzeichnis) schneller als das Medium (also die Scheibe selbst). Es gibt damit keine Notwendigkeit, diese Inhalte für lange Zeit programm- und systemunabhängig vorzuhalten. Mit jeder Aktualisierung des Datenbestandes kann auch eine Anpassung an eine neue Suchmaschine oder ein neues Betriebssystem vorgenommen werden. Anders bei Editionen, insbesondere bei reich überlieferten Texten. Hier wird die Editionsarbeit in der Regel nur einmal im Jahrhundert geleistet. Entsprechend lange muß das Ergebnis dieser Arbeit zuverlässig verfügbar sein.

    Die Faustregel des cross media publishing gilt in diesem Bereich umso mehr: "Denke zuerst elektronisch". Hat man nämlich alle Aspekte einer elektronischen Publikation durchdacht (und den Datenbestand entsprechend angelegt), lässt sich daraus mit geringem Aufwand die gedruckte Ausgabe ableiten. Dieser Ansatz wirkt ungewöhnlich, solange die gedruckte Ausgabe noch das primäre Ziel herausgeberischen (und verlegerischen) Handelns ist. Für zeitgmäße Produktionsabläufe (auch der gedruckten Edition) ist er aber unverzichtbar.

    Es hat sich gezeigt, dass man sich mit den bewährten Abläufen, die der Erstellung nur einer gedruckten Edition dienten, im Markt der elektronischen Kurzzeitprodukte nicht behaupten kann. Der geringste Teil der heute am Markt befindlichen Software wird in zehn Jahren noch verfügbar sein; viele Daten von heute werden nicht einmal mehr lesbar sein. Mehr noch: Es ist sogar wahrscheinlich, dass sich während der Zeit der Erarbeitung einer elektronischen Publikation von Hand die eingesetzte Software durch Erscheinen einer neuen, leistungsfähigeren Version so signifikant ändert, dass ein Großteil der Arbeiten bereits zum Zeitpunkt der Fertigstellung der Publikation hinfällig geworden, das Produkt veraltet ist und erneuter Überarbeitung bedarf.

    Im Unterschied zum Druckprodukt, dessen Möglichkeiten der Editor kennt und um dessen technische Fertigung er sich nicht zu kümmern braucht, ist die technologische Entwicklung bei elektronischen Publikationsformen keineswegs prinzipiell abgeschlossen oder auch nur absehbar. Um die Abfragemöglichkeiten der Texte sinnvoll zu gestalten und dabei auf neue Möglichkeiten durch neue Programmversionen reagieren zu können, muß der Bearbeiter einer elektronischen Publikation mit diesen Möglichkeiten vertraut sein. Es erscheint kaum möglich, die Aufbereitung der Daten für eine elektronische Edition in die Hände eines fachfremden Programmierers zu legen und sich nur um die Bildschirmtypographie zu kümmern, nicht jedoch um die Funktionalität, sprich: um den Aufbereitungsgrad der Daten hinsichtlich möglicher Abfragen.

    Fazit: Der hohe Aufwand bei der Erstellung einer Edition einerseits und die Kurzlebigkeit der elektronischen Medien andererseits lassen die Handarbeit nicht zu, die bei der Erstellung elektronischer Publikationen anderer Inhalte durchaus üblich ist - und die dort durch geringere Anforderungen an die Aufbereitung des Datenbestandes sowie die kurzen Lebenszyklen solcher Produkte auch als die angemessene Arbeitsweise erscheint.

    Wie aber können diese Schwierigkeiten gelöst oder umgangen werden?

    "Denke elektronisch" - das Ziel schon bei der Planung einer neuen Edition sollte es sein, die Arbeit, die bei der Erstellung der gedruckten Ausgabe notwendigerweise eingesetzt wird, auch für die elektronische Publikation nutzbar zu machen. Idealerweise sollte also die elektronische Publikation ohne neuerliche Handeingriffe, quasi als Abfallprodukt entstehen.

    Konkret bedeutet dies, während der inhaltlichen Arbeit an der Edition so wenig wie möglich in die Formatierung zu investieren (denn diese Formatierung bezieht sich nur auf genau eine Ausgabeform), sondern statt dessen Zeit auf die sorgfältige Strukturierung und inhaltliche Auszeichnung des Datenbestandes zu verwenden. Wenn die Daten nach Abschluß der editorischen Arbeiten so aufbereitet in einer anwendungsneutralen Form vorliegen, so kann daraus nicht nur automatisch und mit geringem Aufwand jede gewünschte Formatierung erzeugt werden; gleichzeitig erlaubt dies, die Daten ohne großen (zeitlichen und finanziellen) Aufwand in gegenwärtige und zukünftige Abfragesysteme einzuspielen. Nur so wird eine elektronische Version überhaupt bezahlbar. Nur so kann auch der Kurzlebigkeit dieser Produkte begegnet werden.

    Die modellhafte Erstellung einer elektronischen Ausgabe der Leibniz-Edition soll hier als Beispiel dienen. Herr Prof. Schepers, der Leiter der Leibniz-Forschungsstelle an der Universität Münster, nutzt bereits seit vielen Jahren den Computer nicht nur als Eingabemedium, sondern vielmehr zur Automatisierung von Arbeitsabläufen, vor allem der Registerarbeiten und der Referenzierung der kritischen Apparate. In der Arbeitsstelle wird daher seit über 20 Jahren mit strukturierten Daten gearbeitet, das eingesetzte Werkzeug ist TUSTEP. Dass dabei nie an eine Zweitverwertung der Daten als elektronische Publikation gedacht worden ist, mag als Beleg dafür gelten, dass diese tatsächlich als Abfallprodukt entstehen kann. Das steht nur scheinbar im Widerspruch zu der oben genannten Forderung, "zuerst elektronisch zu denken", denn die de facto geleistete Datenstrukturierung für die automatische Verknüpfung von Text und Apparat sowie von Text und Register entspricht weitestgehend diesem Anspruch.

    Das für die Darstellung der Texte und die Suchroutinen eingesetzte Programm ist FolioViews in der Version 4.1. Wir haben uns für diese Software entschieden, da sie mehrere Anforderungen erfüllt, die bei wissenschaftlichen Werken Voraussetzung sind:

    • Die Möglichkeit auch sehr komplexer Suchanfragen mit gleichzeitig kurzen Antwortzeiten,
    • die Handhabung großer Datenmengen und
    • die Möglichkeit der Übernahme von strukturierten Daten quasi ohne Handeingriffe, wobei die in der Strukturierung enthaltene Information für den Benutzer sichtbar oder auffindbar gemacht werden kann.
    Das heißt nicht, dass die Umsetzung der strukturierten Daten ohne Arbeit vonstatten geht, dass also fertige Importfilter für Satzdaten zur Verfügung stünden; es heißt vielmehr, dass ausschließlich Zeit darauf verwandt wurde, Programme zu schreiben, die die strukturierten Satzdaten automatisch in die gewünschten Folio-Codes umwandeln, anstatt diese Umwandlung von Hand vornehmen zu müssen.

    Der Programmieraufwand lag bei bisher etwa 50 Stunden, bis die Daten entsprechend aufbereitet waren. Das mag angesichts des geringen Umfangs der Demonstration viel erscheinen, doch ist zu bedenken, dass nun Programme vorliegen, die beliebige Textmengen umsetzen können - sofern diese in vergleichbarer Weise strukturiert sind. Der Zeitaufwand steigt hier also nicht linear mit dem Umfang der Texte, wie dies bei der Übernahme von Hand der Fall wäre.

    Es geht dabei nicht um eine 1:1-Umsetzung des gedruckten Werkes, wie sie z.B. mit dem Programm Adobe Acrobat sehr leicht zu realisieren gewesen wäre. Das Medium Computer verlangt einerseits eine eigene Darstellung (durch Bildschirmformat und -auflösung, anderes Leseverhalten etc.) und ermöglicht andererseits auch Darstellungsformen, die im gedruckten Buch nie möglich wären (Farbigkeit und Großzügigkeit der Darstellung scheitern hier nicht mehr an der Kostenfrage), ganz abgesehen von den technischen Möglichkeiten der Umsetzung (Hyperlinks, automatische Suchroutinen, Mitführen versteckter Informationen etc.).

    Die Hauptarbeit der Herausgeber, das Erstellen der Apparate und die Registerarbeiten, war durch Einbringen dieser Informationen in den Text (und zwar in einer für den Computer verarbeitbaren Form) für die elektronische Zweitverwertung nicht verloren. Vielmehr konnten sämtliche Daten und deren Strukturen durch entsprechende TUSTEP-Programme automatisch in FolioViews-Syntax umgesetzt werden: Die Apparate (die nur aufgrund typographischer und technischer Bedingungen am Fuß einer Druckseite zu stehen kommen) wurden aus dem laufenden Text entfernt und werden über Mausklick auf das jeweilige Lemma in einem eigenen Fenster dargestellt. Dabei wird bereits durch unterschiedliche Darstellung (z.B. unterschiedliche Farben) des Lemma kenntlich gemacht, ob es sich um eine Textvariante (Lesart zu ...), eine Anmerkung (Kommentar zu ...) oder eine Fußnote handelt. Gleichzeitig ließ sich die Übersichtlichkeit der Darstellung der einzelnen Lesarten gegenüber der im gedruckten Werk deutlich verbessern.

    Durch die in den Text eingebrachten Registereinträge war es möglich, nicht nur vom Register auf eine bestimmte Seite zu springen, wie dies auch bei 1:1-Übernahme des gedruckten Werkes möglich wäre, sondern vielmehr einen wortgenauen Hyperlink vom Register auf den Text - und vom Text in die Register einzufügen. Durch präzise Kennzeichnung - im Beispiel durch unterschiedlich farbige Sternchen - erfährt der Benutzer, welche Einträge in welchem Register vermerkt sind und hat durch einfachen Mausklick die Möglichkeit, an die entsprechende Stelle im Register zu springen und von hier aus weiter zu allen anderen referenzierten Stellen. Gleichzeitig ist ein Einstieg über die Register in den Text möglich, da die Register selbst auch als Volltext durchsucht werden können.

    Die Besonderheit der aufwendig lemmatisierten und angereicherten Register ließ es weiterhin sinnvoll erscheinen, die hinterlegten Registereinträge als versteckten Text in der elektronischen Publikation mitzuführen, sodass der Benutzer per Knopfdruck diese im laufenden Text zuschalten und konsultieren kann.

    Sämtliche beschriebenen Funktionen lassen sich ohne erneuten Handeingriff in den Text programmgesteuert umsetzen. Es bliebe zu überlegen, wie weit auch die zusätzlichen Informationen (etwa Angaben über Format, Zustand und Archivnummer des Originaldokumentes), die im Kopf eines jeden erfassten Datensatzes enthalten sind, dem Benutzer zugänglich gemacht werden sollen. Hier wäre z.B. das Einfügen einer eigenen Schaltfläche denkbar, die den Zusatztext in einem eigenen Fenster öffnet.

    Aus Sicht des Benutzers erscheint es über die genannten Funktionen hinaus wünschenswert, den Leistungsumfang noch zu erweitern, so z.B. durch Einbinden von Faksimiles der Originalhandschriften, die zu jedem Dokument getrennt aufgerufen werden können. Technisch wäre sogar ein wortgenauer Einstieg per Mausklick vom Faksimile in den Text denkbar. Doch verlassen wir hier den Bereich der automatischen Umsetzung von bestehenden Daten; diese Arbeiten sind ausschließlich durch Eingriffe per Hand zu leisten. Ob und wieweit solche Arbeiten zusätzlich investiert werden, wird von Fall zu Fall entschieden werden müssen.

    Hier sollte lediglich aufgezeigt werden, dass beim Arbeiten mit strukturierten Daten eine elektronische Publikation mit viel geringem Aufwand und höherer Funktionalität erstellt werden kann, als dies von Hand leistbar wäre. Die grundlegende Sorge vieler Wissenschaftler und Hersteller, dass hochwertig aufbereitete elektronische Editionen notwendigerweise an der Kostenfrage scheitern, ist damit unbegründet.


    aus: Protokoll des 76. Kolloquiums über die Anwendung der EDV in den Geisteswissenschaften am 3. Juli 1999