
Protokoll des 33. Kolloquiums über die Anwendung der
Elektronischen Datenverarbeitung in den Geisteswissenschaften
an der Universität Tübingen vom 9. Februar 1985
Allgemeine Information
Im Zentrum für Datenverarbeitung (ZDV) läuft seit Anfang dieses Jahres der Nachfolgerechner des TR440, eine BASF 7/88 unter dem IBM-Betriebssystem MVS. TUSTEP wird auf dem neuen Rechner nicht vor Mitte 1985 zur Verfügung stehen.Paul Sappler (Deutsches Seminar)
Initien-, Namen-, Stichwort-Register zum Repertorium des Meistergesangs
"Das Repertorium der Sangsprüche und Meisterlieder des 12. bis 18. Jahrhunderts", so der volle Titel der bevorstehenden Publikation, hat die Aufgabe, eine besonders lange Gattungstradition zu erschließen. Sie umfaßt die Sangspruch- und Lieddichtung der mittelalterlichen "Meister" seit dem späten 12. Jahrhundert - höfischer Berufsdichter, wie Walther von der Vogelweide und Michel Beheim, und zahlreicher anderer, oft anonymer Autoren in unterschiedlichen sozialen Situationen - und die Lieder des städtischen, vorwiegend von Handwerkern getragenen und vor allem durch Hans Sachs geprägten Meistergesangs des 15. bis 18. Jahrhunderts. Die Einheitlichkeit der Gattungstradition ergibt sich nicht zuletzt aus der Verwendung eines spezifischen Strophentyps, der gesungenen Spruchstrophe, und aus der Übung, "Töne", das sind Strophenformen samt zugehöriger Melodie, immer wieder zu verwenden.Erhalten ist nicht wenig: etwa 17500 Texte, nur zum kleineren Teil gedruckt, ein Material, das nicht unberücksichtigt bleiben sollte für Literatur- und Zeitgeschichte, vergleichende Erzählforschung, die Geschichte der Musik und Musiktheorie, die der handschriftlichen und gedruckten Überlieferung, die der Frömmigkeit und der Bildung (Literarisierung des Stadtbürgertums, Rezeption scholastischer Theologie und Philosophie, humanistischer Bildung und reformatorischer Glaubenslehre).
An dem Projekt wird mit Förderung der Deutschen Forschungsgemeinschaft seit 1974 in zwei Arbeitsstellen in Nürnberg und Tübingen gearbeitet. Es werden zunächst Kataloge hergestellt, im Zentrum ein Liedkatalog, das ist eine beschreibende Aufnahme der Lieder und Liedüberlieferungen nach einem festen Schema, das aber doch die Mitarbeiter in ihren Ausdrucksmöglichkeiten nicht zu stark einschränkt; die wichtigsten Einzelrubriken der Liedaufnahme sind (im älteren und im jüngeren Teil leicht unterschiedlich):
- Autor bzw. Tonerfinder
- Art der Autorbezeugung
- Ton
- Strophenzahl
- Entstehungsdatum
- Überlieferung
- Schreiber
- Über- und Beischriften
- Initium
- kurze Inhaltsangabe
- verarbeitete Bibelstellen und Quellen
- Motivparallelen
- vorkommende Orts- und Personennamen
- Ausgaben
- Literatur.
Die Druckvorbereitung überhaupt und die Registerherstellung geschehen mit Hilfe des Programmpakets TUSTEP, dessen Standardprogramme ergänzt sind durch Fortran-Programme meist aus der Frühzeit des Projekts, die aus Aufrufen von TUSTEP-Unterprogrammen bestehen. Es ist positiv anzumerken, daß die spezifischen Verfahren, Programme und Folgen von Programmaufrufen einerseits immer wieder leicht verändert und verbessert werden konnten, andererseits aber in ihren wesentlichen Zügen zwei Maschinenwechsel überstanden haben.
Es seien hier einige wenige Besonderheiten und Probleme der Registerherstellung skizziert:
1. Den einzelnen Liedüberlieferungen sind Kennungen zugeordnet, nach denen sie sortiert sind und die in den Registern als Referenzen (Stellenangaben) dienen. In ihnen ist festgehalten:
- älterer oder jüngerer Teil des literarischen Gegenstandes
- Autor bzw. Tonerfinder
- Nummer des Tons
- Nummer des Liedzyklus (eventuell mit unterscheidendem Buchstaben)
- Liednummer (eventuell mit unterscheidendem Buchstaben für verschiedene Überlieferungen eines Liedes).
1Bop/2/503c (2 ist die Nummer des Tons im Boppe-Teil);
2S/2829 (2829 ist die Liednummer im Sachs-Teil);
2S/689a/7 (689a bezeichnet einen Liedzyklus).
Weil nun also, wie deutlich wird, die Kennungsteile nicht immer alle erscheinen und Zahl und Reihung von Buchstaben- und Zahlenteilen unfest ist, weil ferner zur typographischen Differenzierung später Kleindruck und Hochstellung genutzt werden, sind die Kennungen so schwer sortierbar wie viele Bibliothekssignaturen der Vor-EDV-Zeit (schwierig auch die Von-Bis-Zusammenfassung aufeinander folgender Stellenangaben dieser Art im Register). Trotzdem hat es sich gelohnt, die Schwierigkeiten zu lösen, sind doch diese Referenzen viel sprechender als eine einfache Numerierung und dazu nicht länger als jeweils sinnvoll.
2. Ein Initienregister, das nach den normalmittelhochdeutschen Reimen angeordnet ist, existiert, wird aber aus Platzmangel wohl nicht veröffentlicht werden. Ausgangspunkt für seine Herstellung sind die ersten Liedverse samt Reimpartnern, die überlieferungsgetreu aufgenommen und mit Steuerzeichen für die Erzeugung des normalmittelhochdeutschen Wortlauts versehen sind. Daraus werden mittels Programm solche Sortiereinheiten gebildet:
- Reimklang - Reimtyp - Reimwort - Reimpartner
- Text (bis hierher alles normalisiert)
- Text wie überliefert
- Stellenangabe (eventuell mit Strophennummer).
a - az - waz - haz -
Armuot ich wil niht wizzen waz : haz -
Armut jch wil nicht wissen was : haß -
1Frau/10/106a.3
Bemerkenswert ist, wie einfach die Regeln für das Ermitteln des Reimtyps (dann unschwierig auch des Reimklangs) in TUSTEP formuliert werden können. In den allermeisten Fällen genügt eine Abfrage auf die Kombination eines Vokals (auch Langvokals oder Diphthongs) mit fakultativen Konsonanten und einem ebenfalls fakultativen Endungsteil, der mit (unbetontem) e beginnt: alle drei Dinge sind in kurzen Tabellen festgehalten; selten muß im Programm das Vorliegen bestimmter kompletter Reimwörter geprüft werden, noch seltener ist vorherige Markierung in den Daten nötig.
3. Die Namenrubriken enthalten in der Regel standardisierte Namen; es bestand aber das Bedürfnis, einigen von ihnen als ganzen oder auch einem ihrer Teile die überlieferte Form beizugeben. Diese Formen sollten in den Registern nicht nur in Gestalt eines Verweises auftauchen, sondern auch vor allem beim Verweisziel, dem eigentlichen Namenartikel, erscheinen, ohne daß hier allerdings der Name mit einer Variante in einem neuen Haupteintrag nach dem Namen ohne diese oder nach demselben Namen mit einer anderen Variante stehen sollte. Insbesondere Namenvarianten im Innern der Sortiereinheit stören aber beim Zusammenfassen des Zusammengehörigen im Register. Die Lösung besteht darin, die Varianten vor dem Sortieren ans Ende der Sortiereinheiten zu stellen und erst nach dem Zusammenfassen wieder nach vorn an ihren Platz zu transportieren.
4. Das Register der Inhaltsstichwörter enthält neben einfachen Begriffen auch Kombinationen von solchen, und zwar in bloßer Reihung wie in syntaktischer Verbindung. Damit diese Kombinationen auch in anderer Reihenfolge der Begriffe ohne besonderen Aufwand ins Register gelangen, sind die Einträge mit Steuerzeichen versehen, aufgrund derer sie vervielfacht und jeweils umgeformt werden.
Manche der angedeuteten Lösungen sind erst nach einigem Probieren gefunden worden. Es ist hervorzuheben, daß ein gutes Werkzeug wie das Tübinger System von Textverarbeitungs-Programmen (TUSTEP) zum Weitersuchen und Verbessern des Verfahrens anregt.
Literatur
Brunner, Horst: Das Repertorium der Sangsprüche und Meisterlieder. Über ein Forschungsprojekt.- In: LiLi 9 (1979) H. 34, S. 130-141.
Wachinger, Burghart: Ein Tönekatalog zu Spruchdichtung und Meistergesang.- In: Maschinelle Verarbeitung altdeutscher Texte. Beiträge zum dritten Symposion. Tübingen 1980, S. 156-166.
Siehe auch das
Protokoll des 11. Kolloquium am 20.11.1976
Als mittelfristiger Ausweg bot sich mit Hilfe des
Tübinger Textverarbeitungsprogramms die Erstellung eines
Rohkatalogs an, von welchem Band I (MS-Nr. 1-1000)
vorliegt, Band II (MS-Nr. 1001-2250) im Laufe des
Jahres erscheinen wird.
Der Rohkatalog zerfällt in zwei Teile, den Katalog- und
den Registerteil.
Aus der Sicht der Datenverarbeitung bietet der Katalogteil
keine besonderen Probleme. Die Eingabe der sieben
Untereinheiten (MS-Nummer; Autor; Titel; Thema; Datum
der Kopie- bzw. Originalabfassung; Ort der Aufnahme;
Umfang, Zustand) umfassenden Handschrifteneinheiten
erfolgt mit OCR-A, für Band II mit OCR-B. Die
ASCII-Codierung ermöglicht die Wiedergabe aller
notwendigen Sonderzeichen für die Transkription des
arabischen Textes. Ein Formatiere- und Satzprogramm
bringt die Beschreibungseinheiten in die adäquate äußere Form.
Etwas schwieriger gestaltet sich die Erstellung des
Registerteils: Ein umfangreiches Programm erzeugt aus
den eingegebenen Handschriftenbeschreibungen vier
getrennte Register (Register der Autoren, der zitierten
Autoren, der Stammes- und Gruppennamen; Register der
Titel, der zitierten Titel; Register der Themen und
Unterthemen; Register der Aufnahmeorte, der Bibliotheks- und
Besitzernamen). Die einzelnen Registereinträge werden
jeweils direkt aus den entsprechenden Untereinheiten der
Handschriftenbeschreibungen durch Kopieren mit dem
TUSTEP-Baustein KOPIERE gewonnen.
Die Darstellung der Personennamen orientiert sich an der
Dreiteilung (laqab, ism, nisba) der arabischen
Namensform. Jedem Eigennamen werden - soweit in der Quelle
angegeben - zu seiner Eingabeform Verweise beigegeben. So
treten bei den Personennamen Verweise auf bis zu drei
laqab-Formen, seine ism-Form und bis zu fünf nisba-Formen
hinzu (1). Die Umstellung der Namensteile, ebenso der
Ausgleich phonetischer (z.B. Vokalassimilationen) und
grammatikalischer (z.B. status constructus) Änderungen
erfolgen innerhalb des Programmablaufs. Ein einfaches
System von Steuerzeichen legt diese Namens- und
Verweisformen bei der Eingabe fest.
Auch im Titel zitierte Autoren (Kommentare, Subkommentare)
werden so behandelt. Zur Unterscheidung zwischen
Originalen und Zitiertem ist ein anderer Schrifttyp verwendet.
Numerische Verhältnisangaben beim Themen- und Ortsregister
geben zusätzlich Aufschluß über die quantitative
Verbreitung der einzelnen Themen bzw. die
Bibliotheksgröße in Bezug auf das Gesamtmaterial des Rohkatalogs.
Die Sortierung der Registereinträge geschieht entlang
dem arabischen Alphabet. Im Verlauf dieser Katalogarbeiten
sind Überlegungen in Gang gekommen, eine Druckausgabe in
arabischer Schrift im Tübinger Zentrum für
Datenverarbeitung einzurichten.
Die Basis ist hierzu mit der Schaffung eines Alphabets
gelegt, welches durch eine lineare Transliteration des
arabischen Textes unter Zuhilfenahme des lateinischen
Alphabets und eines zusätzlichen Sonderzeichens (2) die
Textumwandlung ökonomisch und laiengerecht bewältigt.
(1) vgl. hierzu das elaborierte System von Fedwa
Malti-Douglas und Genevi�ve Fourcade: The Treatment by
Computer of Medieval Arabic Biographical Data.- (= S�rie Onomasticon Arabicum 6)
Biographies - Colloques - Travaux Pr�paratoires, Institut de
Recherche et d'histoire des Textes, Editions du CNRS,
Paris 1976, S. 39 ff.
(2) vgl. die umständlichere Lösung mit 5 Sonderzeichen von
Pierre A. Mackay: TEX for Arabic Script.- In: 6th
International Conference on Computers and the Humanities
1983, S. 391-400
Ulrich Rebstock (Orientalisches Seminar)
Katalogisierung arabischer Handschriften aus Mauretanien
Der hier besprochene Versuch, Kurzbeschreibungen
arabischer Handschriften aus Mauretanien in Katalogform zu
bringen, ist eine Notlösung. Seit 1978 finanziert die
Deutsche Forschungsgemeinschaft (DFG) unter dem obigen
Titel ein Forschungsprojekt am Orientalischen Seminar der
Universität Tübingen in Zusammenarbeit mit dem
"Institut Mauritanien de Recherche Scientifique" (IMRS) in
Nouakchott / Mauretanien. In siebenjähriger Sammelarbeit
wurden 2.500 arabische Manuskripte (ca. 300.000 Folio) auf
Mikrofilm gesichert. Den zweiten Schritt zu vollziehen,
nämlich die Auswertung, Zusammenstellung und
Veröffentlichung des überwiegend noch unbekannten
Textmaterials in Katalogform, verhindert vorläufig
noch der libanesische Bürgerkrieg: Die mit dem Druck der
ersten vier Bände des deutscharabischen
Handschriften-Kataloges beauftragte Beiruter Druckerei
wurde mehrfach ausgebombt .
Anmerkungen
(Die Kurzfassungen der Referate wurden von den Referenten zur Verf�gung gestellt.)
Zur
Übersicht über die bisherigen Kolloquien
tustep@zdv.uni-tuebingen.de - Stand: 30. Oktober 2002