
Protokoll des 36. Kolloquiums über die Anwendung der
Elektronischen Datenverarbeitung in den Geisteswissenschaften
an der Universität Tübingen vom 15. Februar 1986
Allgemeine Information
Die Ausstattung des Forschungsschwerpunktes "Wissenschaftliche Textdatenverarbeitung" am ZDV Tübingen wurde vervollständigt. Folgende Personal Computer stehen zur Verfügung: 3 Sperry IT (auch als Terminal verwendbar), 1 Commodore PC 20, 1 Olivetti M 24, 1 Apple Macintosh; dazu folgende Software: Wordstar, WORD, Scientex, T3 und EDISS (mit umschaltbarer Tastatur für verschiedene Zeichensätze).Heinrich Hunger (Akademisches Auslandsamt)
Einsatzmöglichkeiten von TUSTEP zur flexiblen Gestaltung von Verwaltungsaufgaben
TUSTEP wurde entwickelt, um die Möglichkeiten der Elektronischen Datenverarbeitung den Geisteswissenschaften zu erschließen. Dieses Instrumentarium für die Lösung von Verwaltungsaufgaben verwenden zu wollen, scheint ein Mißgriff.An einigen Beispielen soll gezeigt werden, wozu im Akademischen Auslandsamt der Universität Tübingen Datenverarbeitung eingesetzt wird. Das Auslandsamt verwaltet einen Bestand von ca. 16000 Akten ehemaliger ausländischer Studierender unserer Universität. Dieser Bestand wächst derzeit jährlich um etwa 450 Akten. Ursprünglich wurde er alphabetisch geordnet. Bei der Vielfalt möglicher Lesarten ausländischer Namen und der jeweils eigenwilligen Interpretation dessen, was "alphabetisch" ist, durch die Beteiligten geriet das Ganze zum schwerzugänglichen Gesamtkunstwerk.
Das Finden einer lang gesuchten Akte gehörte bald zu den großen persönlichen Erfolgen im Leben der Kollegen.
Zur Bewältigung dieses Problems entschieden wir uns, den Aktenbestand schlicht durchzunumerieren. Jeder Nummer wurden ein oder, wenn nötig, mehrere Namen oder Lesarten desselben zugeordnet. Für jedes Paar "Zahl/Namen" wurde eine Lochkarte gestanzt. Der Rechner erstellte dann eine alphabetische Namensliste.
Das sofortige Finden einer Akte gehörte bald zu den Selbstverständlichkeiten im Leben der Kollegen. Wir verwenden dieses Verfahren der fortlaufend numerierten Ablage und deren Erschließung über alphabetische Listen inzwischen auch in anderen Bereichen mit Erfolg.
Zahlen als Ordnung stiftende Größen und Computer als Mittel ihrer beliebigen Manipulation! Dies führt geradewegs zum EDV-Konzept "erfassen, verschlüsseln, verarbeiten", und dieses prägt den EDV-Einsatz in den Verwaltungen bis heute.
Als aktuelles Beispiel sei das Studenten-Operations-System II (SOS II) der HIS GmbH angeführt, das auch in Tübingen verwendet wird.
Folgende Zeichenfolge im Datensatz eines Studierenden, der zwölf Karten � 80 Spalten umfaßt,
108G11351270 1234502822 020051826 020052 ...steht für folgenden Sachverhalt:
108 | heißt: es handelt sich um die Kartenart '8' |
G | steht für 'Hochschulwechsler' |
1135 | ist eine von der erfassenden Stelle frei zu vergebende Nummer, unter der dieser Erfassungsbeleg im Stapel wieder aufzufinden ist |
1270 | ist die Nummer der Universität Tübingen im 'Hochschulschlüssel' |
12345 | ist die Matrikelnummer des Studierenden nebst Prüfziffer '5' |
02 | ist der nach 'Schlüssel Nr. 035' verschlüsselte angestrebte Abschluß 'Magisterprüfung' |
822 | das nach 'Schlüssel Nr. 030' verschlüsselte 1. Studienfach 'Neuere deutsche Literatur'. |
Da hierzu keine Vertiefungsrichtung definiert ist, folgen drei Leerstellen.
02 | steht nun für '2. Studiengangsemester' und die nachfolgende |
0 | für den Umstand, daß während dieses Studienabschnittes noch keine Beurlaubung erfolgt ist. |
05 | steht für das 5. Fachsemester und der |
1 | entnehmen wir, daß es sich bei dem 1. Studienfach um das Hauptfach handelt usw. usw. |
Zweifellos eine Erfassung des Umstandes, daß ' 1234' in Tübingen Germanistik studiert, die an Eindeutigkeit nichts zu wünschen übrig läßt. Die Eindeutigkeit wird dadurch erreicht, daß man eine Ziffernfolge untrennbar mit einer bestimmten Position im Datensatz verbindet. Sie wird zur Zahl.
Verschiebt man im obigen Beispiel die Prüfziffer '5' um eine Position nach rechts, wird aus 'Magisterprüfung' ein 'sonstiger Abschluß in der BRD'; '282' ist nicht als Schlüsselzahl eines Studienfaches definiert und '2 ' keine Zahl.
Um einen solchen Datensatz veränderten Anforderungen anzupassen, die sich meistens in erweiterten (sprich "geplatzten") Schlüsseln niederschlagen, muß er neu erstellt werden. Die Anpassung der Programme ist eine mühselige Arbeit, zumal beim Arbeiten mit Schlüsseln auf umfangreiche Plausibilitätskontrollen nicht verzichtet werden kann.
Wir hatten im Auslandsamt mit einem EDV-gestützten Zulassungsverfahren entsprechendes Lehrgeld zu zahlen. Als 1973 eine Lochkarte pro Fall nicht mehr ausreichte, nahmen wir drei. Damit waren wir zukunftssicher, denn nur eine halbe mehr hätte ausgereicht, bei dreien aber konnte man von bisher zweistelligen zu dreistelligen Schlüsselzahlen übergehen.
Als wir 1977 bei fünf Karten und vierstelligen Schlüsselzahlen mit einer zusätzlichen Prüfziffer angelangt waren, beschlichen uns erste Zweifel an dem Konzept "erfassen, verschlüsseln, verarbeiten". Dabei waren wir auf die aus heutiger Sicht groteske Idee verfallen, alle verwendeten Begriffe in einen Schlüssel zu verpacken und die Karten in gleichlange Felder einzuteilen, um so unsere Freiheit wiederzuerlangen, sprich von der unheiligen Allianz von Bedeutung und Position loszukommen.
Für die Sachakten-Registratur des Amtes waren wir inzwischen zu einem Konzept mit sog. 'sprechenden Schlüsseln' gelangt. Die Ziffernfolge war neunstellig! Die ersten drei standen für Geographisches, die nächsten drei für eine Institution, und die drei letzten wurden aus einer dreidimensionalen Matrix abgeleitet, die sich ergab, wenn man für die betreffenden Personen neun Gruppen und für die Art der Verwaltungstätigkeit neun Kategorien definierte und diesen einen der sechs Problembereiche voranstellte. In der Sachakte Nummer
486 325 123sollte also künftig alles zu finden sein, was die zahlenmäßige Erfassung (= 3) der Tübinger (= 2) Studierenden (= 1) an der TUFTS University (= 325) in den U.S.A. (= 486) betraf.
Diese Schlüssel haben nie 'gesprochen'. Es blieb uns die Einsicht nicht erspart, daß der ordnenden Kraft von Zahlensystemen aller Art Grenzen gesetzt sind und folglich auch dem Einsatz dieser Art der Datenverarbeitung zur flexiblen Gestaltung unserer Verwaltung.
Im September 1981 lernten wir TUSTEP kennen. Dies führte zur Wiederentdeckung der Sprache als einem Mittel, Sachverhalte zu beschreiben.
Aus den drei Integer-Zahlen, die im Format I2 in die Variablen IDAT1, IDAT2 und IDAT3 eingelesen werden mußten, wurde wieder ein schlichtes Datum, mit dem man zu allem Überfluß doch noch rechnen konnte! Aus '486' wurde wieder amerikanisch, und im Gegensatz zu '468' war bei amerikansich immer noch klar, was gemeint war. Die der Sprache immanenten "Plausibilitätskontrollen" waren überzeugend.
Texte, die anfallen, wenn in einer Verwaltung Sachverhalte beschrieben werden, zeichnen sich durch eine gewisse Monotonie aus; sie sind eher mehr als weniger strukturiert und mit allerlei Abkürzungen durchsetzt.
Solche Texte werden durch TUSTEP ohne
Verschlüsselungs-Akrobatik für die Datenverarbeitung
zugänglich. Der Baustein KOPIERE erwies sich dabei
als eine 'problemorientierte Programmiersprache', die
FORTRAN eindeutig überlegen ist. KOPIERE erlaubt
Problemlösungen, die an der "relativen" Struktur
eines Textes orientiert sind; die absolute Position eines
für die Lösung des Problems relevanten Textteiles ist unerheblich.
Auszugehen ist von uneinheitlicher Textüberlieferung. Wir
verfügen einerseits über zwei sehr große
Handschriftenfonds (Paris, Biblioth�que Nationale;
Lausanne, Biblioth�que Cantonale et Universitaire),
andererseits über eine nicht unbeträchtliche Menge
zerstreuten Materials (einzelne Briefe, aber auch
vollständige Handschriften) in vielen Bibliotheken
Europas und in Privatbesitz. Die Handschriften reichen vom
zerrissenen Notizzettel ohne feste Zuordnung bis zur
kalligraphischen Abschrift eines Textes. Ferner gibt es
eine umfangreiche Überlieferung von nur gedruckt erhaltenen Texten.
Intendiert ist eine kritische Gesamtausgabe, die von drei
Apparaten begleitet werden soll:
Die Bearbeitung der Textbände wird in Tübingen erfolgen.
Allerdings ist eine dezentrale Texterfassung vorgesehen.
Aus dieser Arbeitsteilung ergeben sich praktische
Probleme, die aber, wie erste Versuche zeigten, lösbar sind.
Wir besitzen insgesamt fünf Drucke, die zwischen 1819 und
1829 liegen und vom Vorabdruck in einer Zeitung bis zur
Ausgabe letzter Hand reichen.
Constant hat diesen Text laufend verbessert, erweitert,
verändert. Es gibt allerdings auch wahrscheinlich eine
Titelauflage oder einen Nachdruck vom erhalten gebliebenen Satz.
Die handschriftlichen Materialien reichen von ersten
Notizen bis zu ausgearbeiteten Fassungen (Vorstufen) des
Werkes, die mit der Endfassung zwar streckenweise
identischen Text haben, streckenweise aber erheblich davon abweichen.
Das Ziel ist es, das gesamte Material zunächst auf
Datenträger zu nehmen und in einer späteren Phase in
geeigneter Form und möglichst vollständig in einem Band zu
publizieren.
Daraus ergab sich folgender Arbeitsplan:
Die Texterfassung wurde von drei verschiedenen Personen
durchgeführt. Sie ist nach etwa 1500 Arbeitsstunden
abgeschlossen, einschließlich der Korrektur der
eingegebenen Texte anhand der Listen nach erster
Kollation mit den Vorlagen.
In einer zweiten Phase wurden durch systematischen
Vergleich der parallel überlieferten Texte mithilfe des
TUSTEP-Programms VERGLEICHE die zwischen den Dateien
bestehenden Unterschiede festgehalten. Daraus ergab sich
einerseits die Möglichkeit, die im Laufe der Arbeit
mehrmals veränderten Kodierungen zuverlässig in allen
Dateien zu vereinheitlichen. Andererseits wurden die
festgestellten Differenzen benutzt, die Daten mit den
jeweiligen Textzeugnissen gezielt zu konfrontieren, um
solchermaßen übersehene Schreibfehler zu entfernen.
Ein weiterer Korrekturgang durch einen "fremden"
Revisor ist vorgesehen.
Durch den automatischen Textvergleich hat sich der
Verdacht bestätigt, daß einer der Drucke entweder eine
Titelauflage oder ein Neudruck von den erhaltenen
Druckstöcken sein dürfte. Es liegt keine Varianz
vor. Diese Frage ist durch Autopsie der Exemplare zu entscheiden.
Die Varianz der Drucke ist auf der derzeitigen Grundlage
des Arbeitsstandes (also noch vor der endgültigen
Revision) vollständig ermitttelt (Programm VERGLEICHE)
und in einer Datei zusammengefaßt. Die weitere Bearbeitung
steht bevor.
Die Dateien mit den korrigierten Daten können nach
Erfassung der Varianz vorläufig auf Bänder abgespeichert
werden. Der Text, der als Grundlage für den kritischen
Text dienen soll, ist die zukünftige Arbeitsdatei.
Die handschriftliche Überlieferung ist vollständig
erfaßt und wird nach der ebenfalls abgeschlossenen
ersten Kollationierung mit den Handschriften korrigiert.
Eine zweite Kollation durch einen Revisor wird
unmittelbar darauf folgen.
Die Bearbeitung dieser Materialien ist wegen des
fragmentarischen Zustands vieler Teile der Überlieferung
besonders schwierig.
Eines der heikelsten Probleme ist die korrekte
Zuordnung der Fragmente zu ihrem Kontext. Diese
Schwierigkeit dürfte mithilfe von KWIC-Indices weitgehend
zu lösen sein. Erste Versuche sind ermutigend.
Die Vorarbeiten für die Register sind teilweise jetzt
schon Bestand der Daten. Erfaßt sind alle Eigennamen und
alle Titel der zeitgenössischen Literatur. Die Erstellung
des Sachindexes hingegen ist in einem eigenen
Arbeitsgang nach Abschluß des kritischen Textes
einschließlich der kritischen Apparate vorgesehen.
Die Publikation des Bandes soll erst erfolgen, wenn
wenigstens ein weiterer Textband zum Vergleich vorliegt,
um eventuell unbemerkt gebliebene strategische Irrtümer
revidieren zu können.
Kurt Kloocke (Romanisches Seminar)
Vorbereitung einer kritischen Gesamtausgabe:
OEuvres compl�tes de Benjamin Constant
1.) Ausgangslage
Es gibt derzeit noch keine kritische Gesamtausgabe der
Werke von Benjamin Constant (1767-1830). Der Umfang des
erhaltenen Materials einschließlich der Korrespondenz
wird auf etwa 65 Bände durchschnittlichen Umfangs (ca. 400
Seiten) geschätzt. Die Planungsarbeiten des Projekts, an
dem etwa 25 Mitarbeiter beteiligt sind, sind seit 1980 im
Gange; erste konkrete Ergebnisse sind in etwa zwei Jahren zu erwarten.
Die Ausgabe soll vor jedem Text einführende Vorworte
haben, jedoch keinerlei interpretierenden Beitext.
Geplant sind ferner erschließende Register für jeden Band
und die Ausgabe insgesamt.
2.) Praktische Organisation der Arbeit
Die Aufgaben wurden geteilt, und zwar so, daß die
Edition der Korrespondenz in Cambridge mit den dortigen
Programmen erstellt werden soll. Zu einem späteren
Zeitpunkt sollen die fertig bearbeiteten Daten aus
Cambridge nach Tübingen übertragen werden.
3.) Probelauf
Bei einem Unternehmen dieses Umfangs ist ein Probelauf
anhand einer beschränkten, aber aussagefähigen
Textmenge angezeigt. Ausgewählt wurde ein Text, der die
gesamte Überlieferung (Handschriften, Drucke) möglichst
vollständig repräsentiert. Das war bei den M�moires sur
les Cent-Jours gegeben.
(Die Kurzfassungen der Referate wurden von den Referenten zur Verf�gung gestellt.)
Zur
Übersicht über die bisherigen Kolloquien
tustep@zdv.uni-tuebingen.de - Stand: 9. Mai 2003