Aus dem Protokoll des 81. Kolloquiums über die Anwendung der
Elektronischen Datenverarbeitung in den Geisteswissenschaften
an der Universität Tübingen vom 10. Februar 2001

 

Benjamin Constant im WWW: ein kritische Edition online

Nachtrag 21.4.2006:

Das Lektorat des Max Niemeyer Verlags teilte uns am 19.4.2006 mit: "weder die Herausgeber noch der Verlag planen in absehbarer Zeit eine online-Edition". Die diesbezüglichen Ankündigungen dieses Beitrags haben damit keinen Bestand mehr.

I. Wolfgang Herbst: Grußwort des Verlegers

Dem Max Niemeyer Verlag, der die Benjamin Constant-Ausgabe verlegerisch betreut, steht es als geisteswissenschaftlichem Verlag gut an, innovative Entwicklungen in der Wissenschaft zu unterstützen, wo dies möglich ist. Grundsätzlich unterstützen wir den Wunsch nach allgemeiner Zugänglichkeit von Datenbeständen. Wir müssen jedoch auf die Finanzierbarkeit aller Leistungen achten. Momentan und auf absehbare Zeit sind keine Mittelrückflüsse aus dem Bereich des Electronic Publishing in nennenswerter Form zu erwarten. So ist alles, was wir heute in diese Richtung tun, eine Zukunftsinvestition in klassischer, verlegerischer Tradition. Aber in der Erwartung daß sich - in nicht zu ferner Zukunft - Optionen für die notwendigen Refinanzierungen der Investitionen bieten.

Bis jetzt ist für uns die einzige Möglichkeit, die notwendigen Mittel bereitzustellen, der Verkauf von Printprodukten. (Für alles andere möchte noch niemand zahlen.) Deshalb ist die jetzt in diesem Pilotprojekt realisierte Lösung - die Kombination von Web-basierter Durchsuchbarkeit der Editionstexte und Print - aus unserer Sicht richtungsweisend. Alle Partner - Wissenschaft, Universität und Verlag - bringen ihren Teil ein. Sie fördern sich gegenseitig, ohne einander zu behindern. Dieses Modell bietet die Möglichkeit der dynamischen Fortschreibung in der elektronischen Form.

Dazu kommt die Sicherheit der Dokumentation durch das Print-Medium gegenüber allen IT-Fährnissen. Darüber hinaus ermöglicht diese Partnerschaft auch die Finanzierbarkeit. Die Projektergebnisse werden in unserem Haus Basis für Web-Zugänge anderer Editionen sein.

II. Kurt Kloocke: Benjamin Constant im WWW

Benjamin Constant (1767-1830), zu seiner Zeit ein nicht nur in Frankreich bekannter Schriftsteller, Religionswissenschaftler und vor allem führender Kopf des Liberalismus, ist nach seinem Tod, sicherlich infolge der sich rasch verändernden politischen Situation (Louis Philippe; 2. Kaiserreich unter Napoleon III., Republik und Nationalismus des 19. Jahrhunderts), der Neuorientierung der Religionswissenschaften und des literarischen Geschmacks verhältnismässig rasch zwar nicht in Vergessenheit geraten, aber doch in den Hintergrund gerückt. Das ist um so erstaunlicher, als Constant etwa seit dem Direktorium mit wachsendem Erfolg grundlegende Werke zur politischen Theorie des Liberalismus publiziert hat, die ihn neben Tocqueville zu dem wahrscheinlich einflußreichsten Autor in dieser Sache gemacht haben. Der luziden Theorie entspricht eine ebenso engagierte politische Praxis als Abgeordneter des progressiven Flügels in der französischen Kammer und als erfolgreicher Journalist.

Neben der Politik schrieb Constant 40 Jahre an einem religionstheoretischen Werk, das - ähnlich profund wie die Forschungen Creuzers - von der Fachwelt auch aufmerksam rezipiert wurde, bevor der Historismus die von Constant verfolgten Fragestellungen zunächst zurückdrängte.

Auch als Schriftsteller hat Constant sich hervorgetan. Man kennt vor allen seinen zur Schullektüre avancierten psychologischen Roman Adolphe, seine faszinierenden Tagebücher, daneben seine umfangreiche Korrespondenz, die zu den inzwischen renommierten Monumenten der französischen Literatur zählt.

Trotz der unbestreitbaren Bedeutung des Autors ist die Constant-Forschung, nach einigen früheren und übrigens sehr respektablen Versuchen, erst nach dem Ende des letzten Krieges vorangetrieben worden. Dies schlägt sich nieder in der wachsenden Zahl von Publikationen zu Constant, in Kongressen und Kolloquien, einer Zeitschrift, und in dem 1980 im Anschluß an einen Kongreß in Lausanne gefaßten Plan, eine kritische Gesamtausgabe des Werkes zu veranstalten.

Die Zielsetzung der Editoren war von Anfang an, das Werk Constants umfassend und nach modernen Gesichtspunkten der Editionswissenschaft für einen wissenschaftlich interessierten Nutzerkreis zu erschließen.

Deshalb haben wir uns für eine exhaustive und philologisch zuverlässige Präsentation der gesamten Überlieferung nach den Handschriften und maßgeblichen, vom Autor selbst besorgten Drucken entschieden. Die Texte sollen in einem historisch zuverlässigen, diplomatischen Druck zur Verfügung stehen, der an allen Stellen einen problemlosen Rückgriff auf die Quellen ermöglicht. Diese sind durch einen klassischen philologischen Variantenapparat mit größtmöglicher Treue erschlossen.

Das Werk soll in chronologischer Anordnung geboten werden, um die Genese des elaborierten Gedankengebäudes nachvollziehbar zu machen. Dennoch gibt es innerhalb der einzelnen Bände eine ablesbare systematische Anordnung der Texte. Die relgionstheoretischen Schriften sind, um den systematischen Zusammenhang darstellen zu können, als selbständiger Block, der in sich aber chronologisch angeordnet ist, zusammengefaßt.

Zu jedem Text gehört eine sachbezogene, jedoch nicht interpretierende Einleitung und - in der Druckfassung - ein Anmerkungsapparat, der die für den modernen Benutzer nötigen Sacherläuterungen enthält, so daß der Text unmittelbar verstehbar ist und damit für eine vertiefende Forschungsarbeit zur Verfügung steht, ohne daß größere Recherchen zur Klärung von Namen, Realien, Zitaten, Querverweisen und ähnlichen das Verständnis erschwerenden Besonderheiten notwendig werden.

In jedem Band gibt es eine Abteilung, die dem Benutzer eine optimale Nutzung der Texte erleichtern soll. Darin findet man eine jeweils dem abgedeckten Zeitraum angepaßte Chronologie, eine ausführliche Beschreibung der zugrundegelegten Textzeugnisse, eine kurzgefaßte Erläuterung der Prinzipien der Textherstellung, die der Edition zugrundeliegen, eine den Band situierende allgemeine Einleitung etc. Zu jedem Band gehört ein Verzeichnis der von Constant zitierten Werke, möglichst mit Verweis auf die benutzte Edition, und eine Bibliographie, die die Arbeit der Editoren dokumentiert. Jeder Band ist durch einen Namensindex erschlossen.

Der philologische Aufwand erklärt sich aus dem Wunsch, das Werk und das Denken des Autors Constant zu erschließen und damit für den intendierten Adressatenkreis nutzbar zu machen. Dazu gehören Politologen, Juristen, insbesondere Staatsrechtler, Historiker, Literaturwissenschaftler, Religionswissenschaftler, nicht zuletzt Sprachhistoriker, die ein großes Textkorpus aus der Zeit um 1800 in einer philologisch zuverlässigen Transkription zur Verfügung haben. Entscheidend war die Einsicht, daß das Werk eines Autors, dessen ideengeschichtlicher Rang erst langsam ins Bewußtsein dringt, nur mit einer wissenschaftlich anspruchsvollen, und wie die Rezensionen zeigen, auch Maßstäbe setzenden Ausgabe in die Forschung eingebracht werden kann. Die Herausgeber sind davon überzeugt, daß eine Neuorientierung der Forschung nötig und auch möglich ist. Die ersten Erfolge der Arbeit sind bereits ablesbar, nicht nur an den publizierten Bänden, sondern auch an dem zunehmenden Interesse der Fachwissenschaftler, die sich zur Mitarbeit bereit finden.

Abschließend sei noch darauf hingewiesen, daß das Editionsprojekt in engster Abstimmung mit den Tustep-Fachleuten das wissenschaftliche Profil erhalten hat, das wir inzwischen als Standard ansehen. Die raffinierte und zugleich ästhetisch gelungene Druckgestaltung war nur mithilfe des leistungsfähigen Arbeitsinstruments zu realisieren, ohne das ich es kaum gewagt hätte, das Projekt überhaupt anzugehen.

III. Marc Wilhelm Küster: Kritische Editionen im Internet

Die Edition der OEuvres complètes de Benjamin Constant (OCBC) ist in vielem eine typische historisch-kritische Edition, mit Apparaten und allem, was dazugehört. Neben dem Text selbst, der auch Autorenfußnoten Constants mit einschließt, bietet sie einen Textapparat und einen Sachapparat, der seinerseits mit Fußnotenzeichen im Text Constants verankert ist. Erklärungen können sich dabei selbstverständlich nicht nur auf den Haupttext, sondern auch auf die Autorenfußnoten beziehen.

Wissenschaftliche Anforderungen an eine Online-Edition

Für eine Edition im Internet gelten ähnliche Grundsätze wie für eine Edition im klassischen Printmedium. Liegt, wie im Fall der OCBC, eine etablierte Edition als "Referenzedition" vor, so ergeben sich allerdings besondere Anforderungen:

  • Zuverlässigkeit: Die Online-Version muss dieselbe Textgrundlage bieten wie die Referenzedition.
  • Zitierfähigkeit: Auch in der Online-Version müssen die Seiten- und Zeilennummern der Referenzedition erkennbar sein, um jederzeit auf die Printfassung rekurrieren zu können.
  • Durchsuchbarkeit: Die Online-Version muss die Vorteile des neuen Mediums ausnutzen, u.a. durch das Angebot einer Volltextsuche.
  • Einbindung von Registern: Klassische Erschließungsmittel der Referenzedition wie Register, in denen ein nicht zu unterschätzender Teil der wissenschaftlichen Arbeit steckt, müssen auch in der Online-Version nutzbar sein.
  • Vorabpublikation: Noch nicht gedruckte, aber bereits bearbeitete Passagen der Referenzedition können der Wissenschaftsgemeinde schon im voraus in der Online-Version zugänglich gemacht werden.

Kurz gesagt: Die Online-Version einer etablierten Edition muss einen echten Mehrwert gegenüber der Druckfassung bieten, ohne deren Stärken zu opfern. Vor allem darf sie nicht ihren wissenschaftlichen Anspruch auf dem Altar der Technik opfern.

Umgekehrt liegen die Verhältnisse in den Fällen, wo die Online-Version die maßgebliche Ausgabe ist - man spricht hier von einer "born digital resource" - und die Druckfassung bestenfalls noch den Status eines Spin-Offs behält, falls sie überhaupt noch geplant ist. Beispiele dafür sind Willard McCarty's Onomasticon zu Ovids Metamorphosen ( http://www.kcl.ac.uk/humanities/cch/wlm/analyticalonomasticon/), das uns Harold Short beim letzten Kolloquium vorgestellt hat, oder das Altägyptische Wörterbuch ( http://www.bbaw.de/vh/aegypt/index.html). In solchen Fällen wird sich eine eventuelle Druckfassung am Referenzsystem der Online-Ausgabe zu orientieren haben.

Mittelfristig ist an den Einsatz kollaborativer Arbeitsformen (z.B. von Redaktionssystemen) zu denken, wie sie von experimentellen Vorhaben wie der Suda Online ( http://www.stoa.org/sol) bereits intensiv genutzt werden. In diesen Fällen (mit einem am besten für relativ formalisierte Strukturen geeigneten Ansatz) können auch über den ganzen Erdball verstreute Mitarbeiter gemeinsam den Datenbestand erweitern.

Wirtschaftliche Realitäten

Angenommen, eine Online-Edition genügte allen oben genannten Anforderungen, so würde sich bald die Frage nach der Lebensberechtigung der Druckfassung stellen; jedenfalls wären beim Verlag für die Printversion signifikante Umsatzeinbußen zu erwarten. Solange es keine befriedigenden Sicherung für den Betrieb der Server und deren Unterhalt durch Abrechnung bei der Nutzung von Online-Editionen gibt und solange die Printversion weiterhin den bisherigen Stellenwert als Referenzedition behalten soll, darf die Online-Edition also gar kein vollwertiger Ersatz werden, da sonst die legitimen finanziellen Interessen von Herausgeber und Verlag gefährdet wären.

Anderseits kann eine teilweise frei verfügbare Online-Edition sowohl der Wissenschaft als auch dem Verlag Vorteile bieten:

  • der Wissenschaft, indem sie einen schnelleren und zielgerichteteren Zugriff auf das Gesamtkorpus erlaubt, als es eine Druckfassung je könnte.
  • dem Verlag, indem sie die Rezipierbarkeit der vorliegenden Edition erhöht und somit eine breitere Zielgruppe schafft, indem sie die akkumulierte technische Expertise für weitere Editionen fruchtbar macht und indem sie für den Verlag Renommee gewinnt durch die (hoffentlich) positive Rezeption in der Fachwelt.

Grundzüge der Implementierung

Unsere Lösung bemüht sich, sowohl den wissenschaftlichen Ansprüchen der Romanistik als auch den wirtschaftlichen des Niemeyer-Verlages Rechnung zu tragen. Der zugrundeliegende Text, in der Entwicklungsversion ein Teil des zweiten Bandes von Constants De la religion (= OCBC, Tome XVIII), ist vollständig und flexibel durchsuchbar, wie in einer Demo gezeigt wird. Weitere Teile der schon edierten Werke werden momentan für die Suchmaschine aufbereitet und peu à peu bereitgestellt.

Um jedes Suchergebnis (jeden "Treffer") werden aber als maximaler Kontext nur 10 Zeilen um das betreffende Wort angezeigt; Scrollen im Volltext ist unterbunden. Da der Nutzer jederzeit die Referenz auf die Druckversion hat, kann bei Bedarf der größere Kontext einer Fundstelle im Buch nachgeschlagen werden. Die Webfassung bietet verschiedene Sichtweisen auf das zugrundeliegende Datenmaterial. Diese Darbietungsformen werden ebenfalls Teil der Demo sein.

Sollten sich die Rahmenbedingungen ändern, können die eingebauten künstlichen Beschränkungen leicht wieder deaktiviert werden.

Zusätzlich zur Volltextsuche werden auch (Personen-)Register zugänglich gemacht, die für den Druck bereits EDV-unterstützt erstellt wurden, so dass man auch Stellen finden kann, an denen etwa "Cäsar" referenziert wird, ohne unter diesem Namen explizit genannt zu werden.

TUSTEP als Grundlage

Die Textgrundlage der Online-Fassung wird automatisch aus der Datenbasis der Druckversion erzeugt. Dass dies relativ problemlos geht, ist eine der großen Stärken von TUSTEP:

In diesem Prozess bleiben die in der Quelldatei enthaltenen Strukturinformationen erhalten. Im konkreten Fall werden diese nicht in XML kodiert, sondern in einer dem Projekt eigenen Auszeichnungssprache, sind aber prinzipiell nach XML überführbar, wenn auch mit einem gewissen Aufwand. Die Weiterführung des Projekts würde wesentlich erleichtert, wenn man in Zukunft direkt von XML-Daten ausgehen könnte. Entsprechende Pilotprojekte haben wir u.a. in Kooperation mit der Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW) mit gutem Erfolg umgesetzt.

Von einer reinen XML-Datenbasis könnte man erwarten, dass der noch vorhandene Konvertierungsaufwand noch stärker reduziert werden könnte, denn die Daten sind bis jetzt nicht zuletzt an den typographischen Bedürfnissen der Druckfassung orientiert, die für die Aufbereitung im Web ausgewertet und umgesetzt werden müssen.

IV. Corinne Chauvin: The Web Site ( www.constant-online.de)

Attention: This web site is no loger available

The Web Site consists in a query page, to enter the search words together with the search options, a page with an index of the names quoted by Constant, and a page with a few indications concerning the use of the search engine.

Search Options

In order to have a useful tool for linguistic research, we implemented the following search options:

  • Option to search a string only when it appears at the beginning of a word; this allows for instance to collect all the forms of a given noun; for instance, giving "sacre" as searched string, the user will obtain the matches sacre and sacres but not sacré nor consacre.
  • Option to search a string only when it appears at the end of a word; this allows for instance to collect all the forms of a given morphological type; for instance, giving "oit" as searched string, the user will obtain the matches of verbs which end with the older French suffix "-oit".
  • Option to search a string only when it corresponds exactly to a word.
  • Option to take in account or not the diacritics; this possibility can be combined with the other options.
  • Option to search for several words at the same time - this possibility can be combined with the other options. For instance, it is possible to search for all the forms of irregular adjectives like "beau".

Query Page

The web-version is deliberately as simple as possible - no animated pictures, no frames, no Java/ECMAScript.

The user is asked:

  • To type the word he wants to search (1);
  • To choose the type of view he wants (2): display of the first match, of the ten first matches or of the total number of matches - default option is first match;
  • To choose the place where the string should appear (3): at the beginning or at the end of a word, corresponding exactly to a word, or all possible cases - default option is all cases;
  • To take into account or not the diacritics (4) - default option is with diacritics;
  • To enter the page and line numbers where the search has to begin (5) - default option is first page first line.

Figure 1: The query page of the site

Search Results and Text Views

The web-version offers several views on the base data. Like for the search options, we wanted to design it for convenient use for a research work on the OCBC. Thus, an option counts the number of occurrences of a string in the whole text, and two further options lead to the first occurrence, or to the ten first occurrences.

Figure 2 showing the display of the first match with ten context lines.

We indicate exactly the page and line number where the word has been found and display ten lines around the hit, which is displayed in red, with different background colours for the text, footnotes and variants. The first part (up to the first short separating line) is Constant's text. The second part (from the little down to the middle separating line) are Constant's footnotes. The third part (from the middle down to the long separating line) are the variants. The fourth part (from the long separating line) is the beginning of the page 92. Two buttons allow users to go to the next or the previous match. Finally, they can start a new search.

Index
In addition to the full text search, the index of names is available. It was itself generated with computer-assistance and makes it possible to locate also places where a person is referenced only indirectly or under another name.

The index page is a static one, unlike the other pages, which are generated from our program in response to a particular query. The page numbers that appear in each line are links which start the search engine with the corresponding name (index entry) and page number as parameters. For instance, the line with "César" has 12 references, which means that the name is referenced at least twelve times in the text. But it can appear in the text as "César", "Caesar", or abbreviated as "Caes." All theses synonyms are nevertheless gathered together under the entry "César" (see below for explanations on the technical realisation).

Principles of the Implementation

As the text must be identical to that of the printed edition, we started out with the files which correspond to the latest stage before going to press and into which the editors added manually their final corrections. These files contain a lot of typographic commands that we had to delete.

The TUSTEP files are indexed using page and line numbers, which allows us to give exact references to the paper edition. We conserve this file organization. So, an item of a file corresponds to a line of the paper edition and we can access directly to a given line in a given page.

The first step of the file preparation was to extract from the files the pages which actually contain Constant's own content, and to separate them from the presentations of the editors, the table of contents or the index, as we want to limit the search to Constant's original text.

In the file that we obtain, we had to include a few tags which indicate which part of the edition it is, a part of the text itself, a footnote, or a variant.

The last step of the preparation was then to clean the files and remove all the tags and commands used for the lay-out. We just deleted some of these tags which were not useful for our purpose, and transformed other ones which we need for the display of the results, like font indications (bold, emphasize, superscript), header tags, etc. We didn't use HTML tags to avoid possible confusion with French words, e.g. with the HTML tag .

We also suppress the editors' indications which appear within the variants in a different typographic style, and the editors' footnote calls (editors' footnote calls are numbers, Constant's ones are letters).

Preparation of the index

In addition to this we construct an index page, using the index tags contained in the text itself. A first attempt to construct this index on the basis of the index at the end of the printed book revealed two problems: first, some names were not quoted in Constant's text, but in the editors footnotes, and we had index items which were not appearing in Constant's text; then, some names do appear in Constant's text, but with another spelling as in the index, like in the footnotes, where Constant had abbreviated the names (for instance "CAES." for "César" or "Plat." for "Platon"). Thus we had to build the index page directly from the edition text and its index tags. In order to avoid several items which correspond to the same name (for instance "Plat." and "Platon"), we include an equivalence table in our program, which allows to build the HTML links with the exact spelling of Constant, but to group these links together under the same item.

Search Engine

At the present time, the server runs on an ordinary PC with the Apache web server. The user query is sent using CGI format. It starts a TUSTEP session which executes the program to search the text and to generate the HTML result page. This page is sent using the UTF-8 character set encoding (UTF-8: UCS Transformation Format for 8 Bits, a version of ISO/IEC 10646 encoding aka Unicode in chunks of 8 bit).

All programs (search engine, HTML page generation, file preparation, index generation, etc.) are written in TUSTEP.

Further Work

As Niemeyer decided to put the whole OCBC on the Web, a page with a list of the works will be added, which will allow to select the volume for the full-text search, search either within a whole volume of the OCBC, or within one work of Constant, in the case it is less than a volume.

In order to facilitate the understanding of the displayed text in case of theatre or fragments of text which include many editors' indications, we think of creating two files, one for the search, which will contain only Constant's text, and one for the display, which will contain Constant's text and stage indications, or editors' indications such as fragment titles or manuscript number, so that the display shows more indication for the user, but that only Constant's text is searchable.


aus: Protokoll des 81. Kolloquiums über die Anwendung der EDV in den Geisteswissenschaften am 10. Februar 2001