
Protokoll des 41. Kolloquiums über die Anwendung der
Elektronischen Datenverarbeitung in den Geisteswissenschaften
an der Universität Tübingen vom 28. November 1987
Allgemeine Informationen
- Die UNIVAC 1100/80 ist ab Jahresende 1987 außer Betrieb. Bis auf weiteres steht für TUSTEP-Benutzer in Tübingen nur noch die BASF 7/88 allgemein zur Verfügung. Der Laserdrucker QMS Lasergraphix 2400 ist jetzt an der BASF angeschlossen. Die UNIVAC-Terminals UTS 400 sollen durch VT 320 von DEC bzw. durch PC's von Atari ersetzt werden.
- Im Zusammenhang mit der Stillegung der UNIVAC haben die Teilnehmer - vorwiegend Geisteswissenschaftler - einstimmig ein Votum an den Präsidenten der Universität Tübingen, Herrn Dr. Adolf Theis, beschlossen. Darin bringen sie ihre große Sorge zum Ausdruck, daß ihre künftigen Arbeitsmöglichkeiten im EDV-Bereich möglicherweise gravierende Beeinträchtigungen erfahren werden, insbesondere durch Wegfall von Druckkapazität, durch voraussichtlich nicht mehr rechtzeitige Installation der HP-Laserdrucker an der BASF und durch vorhersehbare Verzögerungen bei der Bereitstellung von Ersatzterminals für die wegfallenden UTS 400. Die Teilnehmer beauftragten Herrn Dr. Ott, in einem Brief an den Präsidenten die Bitte zu richten, evtl. erforderliche Mittel bereitzustellen und dafür Sorge zu tragen, daß die Anschlußarbeiten der Terminals und Drucker vordringlich in Angriff genommen werden.
- Hinweis auf Termine
- 7.-12. März 1988 in Saarbrücken: Jahrestagung 1988 der Gesellschaft für Linguistische Datenverarbeitung (GLDV) mit dem Thema "Computerlinguistik und ihre theoretischen Grundlagen"
- 5.-9. Juni 1988 in Jerusalem: XVth International ALLC (Association for Literary and Linguistic Computing) Conference; in unmittelbarem Anschluß daran:
- 9.-13. Juni 1988 in Jerusalem: Second International Conference of the Association Internationale Bible et Informatique (AIBI)
- 22.-27. August 1988 in Budapest: The XIIth International Conference on Computational Linguistics (COLING 88)
Alexander Kleinlogel (Universität Bochum)
Datenverarbeitung in der (Klassischen) Philologie:
Anwendungen, Probleme und Perspektiven des PC-Einsatzes
Der Vortrag verstand sich in zweierlei Hinsicht als
Erfahrungsbericht: zum einen über Erfahrungen mit
Arbeitsplatzlösungen auf der Ebene des PC und mit speziell für
die Bedürfnisse der Klassischen Philologie entwickelter
Software, zum anderen über Erfahrungen im speziellen
Bereich der wissenschaftlichen Edition, ergänzt um
Ausblicke, die sich namentlich durch die Verfügbarkeit von
Massenspeichern bei der Arbeit mit dem PC abzeichnen
(CD-ROMs des Thesaurus Linguae Graecae von Irvine).
Die an den Anfang gestellten grundsätzlichen
Überlegungen (I) sollten weder eine wissenschaftstheoretische
Standortbestimmung vornehmen noch den PC-Einsatz
apologetisch rechtfertigen, sondern zu einem mehr oder
minder systematischen Überblick (II) führen, um
Beurteilungsgrundlagen und konkrete Kriterien für
Entscheidungen über Geräte und Software zu gewinnen;
der Bericht über konkrete Erfahrungen (III) schloß
mit einigen Perspektiven (IV).
I.
Es ist offensichtlich, daß beim Computereinsatz in der
Klassischen Philologie derzeit die textbezogenen und
textwissenschaftlichen Aspekte und Interessen dominieren.
Zwar besitzen die auf dem Gebiete der Sprachwissenschaft
und Linguistik, bedauerlicherweise ohne nennenswerte
Beteiligung seitens unserer Disziplin, erzielten
Fortschritte (namentlich in der automatischen Sprach- und
Syntaxanalyse) auch für die Klassische Philologie nicht zu
unterschätzende Bedeutung, werden jedoch derzeit erst noch
in geringem Umfange genützt. Im Bereich der
interpretierenden Literaturwissenschaft bleibt dagegen
beherrschend, was man eine "holistische" Sehweise genannt
hat, und nicht zuletzt aus diesem Grunde sind die Ansätze
zu einer Algorithmisierung des methodischen Zugriffs noch
nicht sehr weit gediehen. Für die Literaturwissenschaft
beschränkt sich daher der Nutzen, vorläufig
wenigstens, auf Hilfestellung bei der Textarbeit und bei Literaturrecherchen.
Im vorliegenden Zusammenhang ergibt sich somit eine Konzentration auf "Text" und "Textwissenschaft", wobei das Nebeneinander bereits eine Differenzierung andeutet, die begrifflich trivial, für die Art des Computereinsatzes (und auch für die Ansprüche an die Software) dagegen keinesfalls belanglos ist: "Text" bezieht sich dabei in erster Linie auf das Medium (Kommunikationsmittel) und bezeichnet alle Arten von Dokumentation und von Textbeständen, wohingegen es der "Textwissenschaft" um Text als Objekt und um alle Formen des wissenschaftlichen Umgangs mit Text, um Textanalyse und (nicht zuletzt) um Textedition geht.
Bezogen auf die Möglichkeiten des Computereinsatzes ergeben sich daraus wesentliche Unterschiede. Im Falle von "Text" zielt der Einsatz auf die Oberfläche des Textes, auf seine Erstellung und Manipulation: Der Computer fungiert als Schreibmaschine mit enorm gesteigerter Leistungs- und Speicherfähigkeit "problem- und lösungsunterstützend". Der textwissenschaftliche Einsatz ist forschungsbezogen und richtet sich auf die inneren Strukturen des Textes; ferner gestattet er, über vertiefte Analysen hinaus, die Abfolge der einzelnen methodischen Schritte zu koordinieren und, soweit dies mit den verfügbaren Programmen sinnvoll verwirklicht werden kann, auch zu automatisieren; es können weiterhin Fragestellungen, die bisher aus arbeits- und mnemotechnischen Gründen nicht zu leisten waren (wie die systematische Abfrage und Analyse extrem großer Textkorpora), in Angriff genommen und Kombinationen in Erwägung gezogen werden, welche eine Vielfalt automatisierbarer linguistischer Methoden (Analysen im Bereich der Morphologie, der Syntax, des Lexikons usw.) in die Textarbeit als "sprachliches Kontextwissen des Computers" miteinbeziehen: Der PC fungiert damit als Forschungsinstrument "problem- und lösungsmodellierend".
II.
Versucht man nun, die Einsatzmöglichkeiten auf dem
PC-Niveau etwas konkreter zu charakterisieren, so geht es
zunächst in einem elementaren Sinne um "Textverarbeitung",
wie sie für die Bürokommunikation usw. entwickelt worden
ist, allerdings mit der für die philologische Arbeit
entscheidenden Erweiterung um fremdsprachliche
Zeichensätze wie etwa den des Griechischen mit allen
diakritischen Zeichen.
1. Die Textverarbeitung gliedert sich dabei in drei Teilbereiche:
- Texterstellung
- Textanalyse (oberflächenbezogen)
- Textarchivierung.
Zu a.: Für die Texterstellung muß die Software alle Schreibfunktionen zweisprachig bereitstellen (Positionierung der Schreibstelle, Einfügungen, Löschungen, automatische Sicherung, Fuß- und Endnotenverwaltung, multiple Textverarbeitung in "Fenstern", Druckerausgabe usw.).
Für b. haben als wichtigste Komponenten einer elementaren Oberflächenanalyse zu gelten: Suchroutinen, Ersetzungsroutinen, Feststellung von Rekurrenzen, automatische Erstellung von Wortlisten und Indizes, Rechtschreibungsprüfung, stilistische Hilfen.
Zu c. gehören auf dieser Ebene: Verwaltung und Zugriff auf umfassende Datenbestände, Einsatz von Massenspeichern.
2. Für die bei der wissenschaftlichen Textarbeit, besonders bei der kritischen Edition, anfallenden Aufgaben bringt die unter 1. skizzierte Schreibtechnik schon erhebliche Erleichterungen, nützt aber noch längst nicht alle Möglichkeiten, die für eine "gehobene" Verwendung des Computers charakteristisch sind. Dies betrifft insbesondere die Verknüpfung und Koordination von Einzelschritten der Textverarbeitung, gepaart mit einer Systematisierung und Automatisierung der methodischen Schritte, wofür als Beispiele anzuführen sind: die Verwaltung kritischer Apparate und ihre Koordination mit dem Text, die Systematisierung wiederkehrender methodischer Schrittfolgen (wie konkomitanter Eintrag in Wortlisten, Standardisierung der druckgraphischen Gestaltung, automatische Kollation u.ä.).
Die meisten Softwareangebote sind den Erfordernissen der reinen Textverarbeitung (gemäß 1.) durchaus gewachsen. Für die unter 2. skizzierten Aufgaben stehen noch kaum Fertigprodukte zur Verfügung, die den fachspezifischen Anforderungen in jeder Hinsicht entsprechen. Soweit es Lösungen gibt, sind sie meist "partikulärer" Natur und können nicht ohne weiteres von der (philologischen) Allgemeinheit genutzt werden. Der Philologe kommt so ohne eigene Programmierkenntnisse (oder die seiner Mitarbeiter) nicht aus. Andererseits genügt es für viele der notwendig werdenden "partikulären" Lösungen, wenn das benutzte Textverarbeitungsprogramm selbst eine gewisse Programmierbarkeit aufweist und die Einrichtung automatisch ablaufender Sequenzen von Einzelschritten erlaubt, wenn es also über "Makros" verfügt. So sehr der Zwang zur Programmierung, auch in bescheidenem Umfange, auf den Computer-Neophyten abschreckend wirken mag, so deutlich zeigt die Erfahrung, daß mit wachsender Vertrautheit gerade auch das Interesse an der Makrofähigkeit wächst und diese sich am Ende als unentbehrliche Hilfe erweist.
In der Vergangenheit warf die Bildschirmdarstellung eines zweiten Zeichensatzes wegen der technisch bedingten Beschränkung auf den "erweiterten" ASCII-Bereich (ASCII 128-255) das Problem auf, in ihm alle Sonderzeichen und alle Kombinationen mit diakritischen Zeichen unterzubringen. Mit den allmählich zum Standard gewordenen Zusatzkarten (Herkules Plus, EGA, VGA) fallen derartige Schwierigkeiten weg, und die Tendenz geht durchaus in die Richtung, philologisch orientierte Software mit umfassenderen Zeichensätzen auszurüsten (je nach Zusatzkarte 512 bis 1024 Zeichen).
Eine zweite grundsätzliche Frage betrifft das Verhältnis von Bildschirmdarstellung und Druckerausgabe. Es gibt Einstufenprogramme, bei denen das Gedruckte exakt die Textgestaltung auf dem Bildschirm reproduziert, der Bildschirm also alle Textauszeichnungen, die Anlage des Seitenformats, die Fußnoten usw. in der endgültigen Gestalt aufweisen muß (mit einem Anagramm von "what you see is what you get" als WYSIWYG-Systeme bezeichnet). Derartige Systeme sind im Grunde nur dann akzeptabel, wenn sie bei jedem Texteingriff das gesamte Dokument schnell zu aktualisieren und (auf dem Bildschirm) neu zu formatieren imstande sind, was einen erheblichen Rechenaufwand und die entsprechende Rechnerleistung voraussetzt; die Texterstellung ist häufig an eine umständliche Menüführung gebunden.
Den WYSIWYG-Programmen stehen Zwei-Stufen-Programme gegenüber, bei denen das Edieren (Schreiben des Textes) und das Formatieren (Druckerausgabe, die allerdings auch als preview auf den Bildschirm gebracht werden kann) in getrennten Schritten erfolgt. Der Vorteil solcher Systeme liegt darin, daß sie ziemlich unbekümmerte und darum auch sehr schnelle Texterstellung erlauben; der Nachteil ist, daß Steuerzeichen und Steuerkommandos auf dem Bildschirm sichtbar bleiben und je nach Bedarf immer wieder einmal in den Text eingefügt werden müssen. Ein befriedigendes Arbeiten ist darum ganz davon abhängig, ob sich erstens diese Steuerung standardisieren und durch "Makros" automatisieren läßt (so daß ggf. immer nur ein Kommando eingeschoben werden muß), und zweitens, ob man sich laufend über das Aussehen des Druckbildes in previews vergewissern kann. Viele Fachleute bevorzugen wegen der größeren Flexibilität Zwei-Stufen-Programme.
III.
Im Konkreten war über mehr als zweijährige
Erfahrungen mit dem Einsatz von PWP/Deutsch-Griechisch
(früher AcademicFont) zu berichten; weitere Software, die
zumeist erst im Laufe von 1987 verfügbar geworden ist,
soll später getestet werden. PWP ist als
Zwei-Stufen-Programm ausgelegt und erfüllt alle im vorigen
Abschnitt aufgestellten Forderungen. Es erweist sich als
besonders flexibel durch: umfassende Makrofähigkeit beim
Edieren wie beim Formatieren (selbst extrem komplizierte
Programmabläufe können mit einer einzelnen
Tastenkombination oder einem einzigen Steuermakro
aufgerufen werden), variable Tastenbelegung (auch während
des Schreibens), frei vereinbare Variabeln (Kürzel), die
in verschiedener Weise belegt werden können mit
- Text,
- Sonderzeichen (nur druckbar, in vollem Umfang der Ladekapazität des Druckers),
- Druckersteuerung (z.B. statt umständlicher in-line-Kommandos),
- Formatierkommandos (auch Makros).
Die seitens des Systems gebotenen Möglichkeiten wirken sich namentlich im Rahmen wissenschaftlicher Editionsvorhaben vorteilhaft aus. Der Herausgeber einer kritischen Ausgabe ist in besonderem Maße darauf angewiesen, ein möglichst fehlerfreies Druckmanuskript zu erstellen und wird in der Regel, auch um der Textentscheidung im letzten Augenblick willen, diesen Arbeitsgang selbst übernehmen. Die Vorteile des PC-Einsatzes im Hinblick auf Fehlerminimierung, Fehlerbeseitigung, Parallelbearbeitung von Text und Apparaten usw. liegen auf der Hand. Der Herausgeber hat zugleich aber auch ein vitales Interesse daran, daß das auf solche Weise optimal erstellte Manuskript im Zuge der Drucklegung nicht erneut durch Setzerfehler entstellt wird. Als Ausweg bietet sich dafür die direkte Übernahme des PC-erstellten Textes in den Drucksatz an, und zwar auf zweierlei Weise:
- im "Schreibmaschinenmodus": Der gespeicherte Text wird (ohne steuernde Angaben zur buchtechnischen Gestaltung) auf Disketten oder andere Medien übertragen und im Verlag drucktechnisch aufbereitet, wobei allerdings die (Um-)Codierung des Griechischen Schwierigkeiten macht, sofern Software und Drucksatz dafür verschiedene Codes verwenden;
- im direkten Photosatz: Das Manuskript wird mit allen Angaben zur Steuerung des Layout ausgestattet und im Verlag direkt in den Photocomposer eingegeben; Grundvoraussetzung hierfür ist über die Übereinstimmung des Codes hinaus auch die Anpassung an die z.T. sehr spezifischen Steuerkommandos der Photosatzanlage.
Das vorgestellte System verfügt (noch) nicht über weitergehende Fähigkeiten wie über eine automatische Koordination von Text und Apparat oder über Einbindung von "sprachlichem Kontextwissen" des Computers. Integrierte Lösungen dieser Art waren bei dem zuletzt vorgestellten Verfahren noch nicht erforderlich und gehören eigentlich schon zu den abschließend noch zu erwähnenden Perspektiven.
IV.
Der vernünftige Einsatz von Computern im Bereich
unserer Wissenschaft macht auf Dauer eine Ergänzung
fachlicher Kompetenz durch theoretische und praktische
Qualifikationen im Bereich der Informatik unentbehrlich.
Damit stellt sich die Frage nach entsprechenden
Ausbildungskonzepten, die jedoch im Rahmen unseres Faches
allein nicht zu erarbeiten sind. Die meisten Hochschulen
haben jedoch in der Zwischenzeit damit begonnen, auch
Geisteswissenschaftlern einen Zugang zur Informatik und zu
(zusätzlicher) Qualifikation zu öffnen.
Welchen Weg die weitere Entwicklung nehmen und welche
Rückwirkungen diese auf die philologische Arbeit haben
wird, ist im einzelnen schwer zu prognostizieren. Es
dürfte aber außer Frage stehen, daß sowohl die
sprachwissenschaftlichen Komponenten (das mehrfach
angesprochene "Kontextwissen") als auch der
arbeitsbegleitende Rückgriff auf umfassende Textcorpora in
Massenspeichern dabei eine entscheidende Rolle spielen
werden. So können inzwischen dank umfangreicher
Entwicklungsarbeiten in Harvard, Brown University und
Santa Barbara Compact Discs mit einer Auswahl von 178
Autoren des Thesaurus Linguae Graecae (dasselbe Corpus
wie für den Ibycus-Rechner von Packard) auch in
einer IBM-kompatiblen Umgebung benützt werden, und man darf
vermuten, daß gerade von solchen Einsatzmöglichkeiten
starke Impulse speziell für die Klassische Philologie
ausgehen werden.
Wilhelm Ott
Wissenschaftliche Textdatenverarbeitung.
Der Forschungsschwerpunkt 08 "Wissenschaftliche
Textdatenverarbeitung" (FSP), den das Land
Baden-Württemberg von 1985 bis 1989 mit zusätzlichen
Personal- und Sachmitteln fördert
(vgl.
34. Kolloquium vom 6. Juli 1985), hat die Hälfte dieser Förderungszeit
überschritten. Dies ist Anlaß für einen
Zwischenbericht und für Überlegungen über die
Fortführung der Arbeit nach 1989.
Zweieinhalb Jahre Forschungsschwerpunkt 08
Neben der Verbesserung der für die Geisteswissenschaften notwendigen Hardware-Ausstattung in Tübingen gehörten zu den wichtigsten Zielen, für die die Förderung seinerzeit beantragt worden war, die Weiterentwicklung, Konsolidierung und Dokumentation von TUSTEP, seine Verfügbarkeit auf weiteren Rechnern - auch auf solchen, die in Tübingen nicht als Rechenzentrumsanlagen betrieben werden - und die Einbeziehung der Personal Computer in die wissenschaftliche Textdatenverarbeitung.
Diese Förderung von TUSTEP ist auf dem Hintergrund seiner Bedeutung als Instrument für den Einsatz der EDV in den Geisteswissenschaften zu sehen, die deutlicher wird, wenn man sich einige wichtige Eigenschaften vergegenwärtigt, die es von anderen dort eingesetzten Programmen unterscheiden:
- der Leistungsumfang von TUSTEP ist nicht am Bedarf der Büro-Textverarbeitung und der Dokumenterstellung, sondern am Bedarf der geisteswissenschaftlichen Forschung ausgerichtet;
- es umfaßt - als System von aufeinander abgestimmten, frei kombinierbaren Programmen - alle Phasen des wissenschaftlichen Umgangs mit Texten (auch solchen in nicht-lateinischen Alphabeten), von der Erfassung und Korrektur über das Absuchen von Texten, ihre Veränderung nach frei definierbaren Regeln, den Vergleich verschiedener Textfassungen, die Erhebung quantitativer Angaben aus den Texten, das Sortieren, die Index- und Registerarbeit bis hin zum professionellen Satz für die Publikation einschließlich der Umbrucharbeiten bei kritischen Editionen; damit werden gleichzeitig Schnittstellenprobleme (etwa zu fremden Satzsystemen) vermieden;
- es ist für Großrechner konzipiert und auf die Verarbeitung großer Datenmengen und auf hohe Verarbeitungsgeschwindigkeit ausgelegt; davon wird auch die PC-Version profitieren: die dort installierten TUSTEP-Programme haben den gleichen Leistungsumfang wie die Großrechnerversion;
- alle Funktionen, auch die leistungsfähigen Such- und Austauschfunktionen des Editors, stehen auch in einer batch-orientierten Arbeitsweise zur Verfügung; dies ist nicht nur bei großen Datenmengen sinnvoll, sondern sichert die Wiederholbarkeit von Aufgaben und die Reproduzierbarkeit der Ergebnisse;
- durch den modularen Aufbau und die Flexibilität und freie Kombinierbarkeit seiner Bausteine hat es den Charakter eines Programmierwerkzeugs;
- durch die Verfügbarkeit eines Unterprogrammpakets unterstützt es die Erweiterung durch Benutzerprogramme, die zu den übrigen Bausteinen kompatibel sind; entsprechende Schnittstellen für die Benutzung beliebiger fremder Programme (z.B. SPSS für statistische Auswertung) sind vorhanden;
- es hat auf den verschiedenen Rechnern, vom PC bis zum Großrechner, eine identische, vom Betriebssystem unabhängige Kommandosprache, die - bis auf logon und logoff und den Aufruf von TUSTEP selbst - alle benötigten Dienste, einschließlich Datentransport, umfaßt und um benutzereigene Kommandos erweitert werden kann. Dies macht Anwendungen portabel.
Dateneingabe, Druckerausgabe
Nach außen am sichtbarsten sind die Verbesserungen, die der FSP im Ein- und Ausgabebereich gebracht hat. Optische Datenerfassung
Anstelle des bis dahin benutzten,
1985 stillgelegten OCR-A-Lesers in Ulm steht jetzt ein
AEG-Blattleser für Schreibmaschinen-Belege und ein
KDEM-Omnifont-Leser für die Erfassung von gedruckten
Texten zur Verfügung, der auch von Institutionen
außerhalb der Universität Tübingen mitbenutzt wird.
Datenübernahme vom PC
Aus FSP-Mitteln wurde 1985 ein
Diskettenkonverter beschafft, der die gängigsten 8-, 5
1/4-, 3 1/2- und 3-Zoll-Diskettenformate verarbeiten kann.
Von PCs, die direkt am Terminalnetz der Universität
angeschlossen sind, ist mit KERMIT ein direkter
Dateitransfer zum und vom Großrechner möglich. Mit
dem im FSP entwickelten Programm KONVERT können Textdateien der
verbreitetsten PC-Textverarbeitungsprogramme (PC-WRITE,
WORD, WORDPERFECT, WORDSTAR) vor der Übertragung mit
möglichst wenig Informationsverlust nach TUSTEP-Konventionen
umgewandelt werden (die Programme T3 und ScienTEX
werden nicht unterstützt); andere Dateien können mit
dem Programm UM7 so aufbereitet werden, daß mit
TUSTEP-Mitteln auf jeden Code der Ausgangsdatei
zugegriffen werden kann.
Datenausgabe
Der Matrixdrucker und die Typenraddrucker
wurden durch Laserdrucker abgelöst. Auf dem Lasergrafix
2400 können mit ähnlicher Geschwindigkeit wie auf dem
Zeilendrucker, aber mit annähernd
Schreibmaschinenqualität, Texte mit (z.Zt.) lateinischen,
griechischen, hebräischen und syrischen Buchstaben
einschließlich der Akzente bzw. (fürs
Hebräische) Vokalzeichen gedruckt werden;
weitere Schriften sind in Vorbereitung.
Satzsimulation
Eine entscheidende Verbesserung der
Arbeitsmöglichkeiten in Tübingen hat der Einsatz des
Lasergrafix 2400 zur Simulation der Setzmaschine gebracht.
Das auf diesen Drucker zugeschnittene Programm SASIM
ermöglicht eine Simulation der Satzausgabe auf dem
Laserdrucker, die - wie davor die Simulation auf dem
Plotter - bezüglich Seitenaufteilung mit dem späteren
Satz identisch ist, die darüber hinaus aber schnell genug
ist, um ganze Bücher auszugeben, und die hinsichtlich
Zeichenvorrat und Druckqualität für Korrekturzwecke
ausreicht. Es wird eine Schrift mit Times-Charakter
benutzt, die (in normalem, kursivem und halbfettem Schnitt
und in verschiedenen Schriftgrößen zwischen 6 und 12
Punkt) alle für westeuropäische Sprachen notwendigen
Akzente und Sonderzeichen enthält; dazu passend steht eine
griechische und eine hebräische Schrift zur Verfügung.
Die Qualität der Ausgabe entspricht derjenigen von DTP (desk top publishing)-Systemen; obwohl für den Zweck der Vorab-Korrektur professioneller Satzausgabe konzipiert, werden die TUSTEP-Programme SATZ und SASIM deshalb gelegentlich auch für "DTP"-Aufgaben eingesetzt; mit der Grafiksoftware DISSPLA erstellte Grafiken können in die Satzsimulation auf dem Laserdrucker integriert werden.
Dokumentation von TUSTEP
Zusätzlich zu den (zuvor ausschließlich) auf Dateien verfügbaren Einzelbeschreibungen der TUSTEP-Programme liegt als Nachschlagewerk ein TUSTEP-Benutzerhandbuch mit 474 Seiten vor. Eine Übersetzung des Handbuchs ins Englische ist in Vorbereitung.Als interne Dokumentation von TUSTEP und als Nachschlagewerk für Programmierer, die selbst TUSTEP-kompatible Programme schreiben wollen, dient eine auf den aktuellen Stand gebrachte Beschreibung der TUSTEP-Unterprogramme.
Ausbildung in TUSTEP
Dank der personellen Verstärkung durch den FSP konnte der schon traditionelle zweiwöchige TUSTEP-Hauptkurs im Herbst ergänzt werden durch einen zweimal jährlich angebotenen einwöchigen Einführungskurs.An der Universität Würzburg gehört TUSTEP inzwischen zum Lehrangebot des seit WS 1985/86 bestehenden Aufbaustudiengangs "Linguistische Text- und Informationsverarbeitung".
TUSTEP-Erweiterungen
TUSTEP selbst hat - über die erwähnten Erweiterungen im Ein- und Ausgabebereich hinaus - viele Erweiterungen und Verbesserungen erfahren, die nach außen kaum auffallen, aber wesentlich sind für die Sicherheit und Bequemlichkeit seiner Bedienung und für seinen Einsatz auf einer immer größeren Zahl von Rechnern. Für den Benutzer sichtbar sind vor allem: das neu geschaffene Kommando RETTE zur Wiederherstellung defekter Dateien; die Erweiterung des Kommandos UMWANDLE zur Verschlüsselung von Daten (Datenschutz!) und zur Unterstützung des Transports von Daten über Leitungsnetze und zwischen Rechnern verschiedener Architektur; die Spezifikation CODE in den Kommandos zur Magnetband-Benutzung zur wahlweisen Benutzung von ASCII- oder EBCDIC-Bändern sowie im Kommando DEFINIERE, mit der dem unterschiedlichen Zeichenvorrat der verschiedenen Terminal-Typen Rechnung getragen wird.Über das Teilprojekt "rechnergestützte Lexikographie", in dem unter Leitung von Paul Sappler Verfahren zur Unterstützung philologischer Wörterbucharbeit (u.a. zur Lemmatisierung, Homographentrennung, Verarbeitung von Mehrwortgefügen, Berücksichtigung von Textvarianten und Vorlagenbezügen) entwickelt werden, die nach Möglichkeit in TUSTEP integriert werden sollen, soll später eigens berichtet werden.
Implementierung von TUSTEP unter weiteren Betriebssystemen
Die weitaus meiste Programmierarbeit ist in die Implementierung von TUSTEP unter weiteren Betriebssystemen geflossen. Seit 1985 ist TUSTEP auf folgenden Betriebssystemen neu verfügbar geworden:MVS (IBM und kompatible),Dies ist nicht nur Voraussetzung für die Kontinuität der Arbeit mit TUSTEP in Tübingen selbst (ab Jahresende 1987 ist der Betrieb der SPERRY UNIVAC, auf der - nach dem TR 440 - TUSTEP bis zum Beginn des Berichtszeitraums allein verfügbar war, eingestellt), sondern auch für die Weitergabe des Systems an andere Hochschulen. Letzteres ist auch für Tübingen selbst wichtig, da immer häufiger in Tübingen begonnene Projekte - z.B. im Rahmen von Berufungen oder Gastprofessuren - an anderen Orten weitergeführt werden oder umgekehrt, oder Kooperationen mit Instituten anderer Hochschulen zustandekommen.
VM/CMS (IBM und kompatible; noch ohne SATZ),
VMS (DEC VAX; noch ohne SATZ).
Die folgende Übersicht gibt die TUSTEP-Installationen außerhalb Tübingens Anfang 1988 wieder (unter dem jeweiligen Betriebssystem in der zeitlichen Reihenfolge der ersten Installation):
Betriebssystem OS/1100 (EXEC 8): | Marburg, Trier, Göttingen |
Betriebssystem MVS: | Würzburg, Heidelberg, Berlin, Leiden, Pisa |
Betriebssystem VM/CMS: | Marburg, München, Konstanz, Bonn, Münster, Jerusalem, Stellenbosch, Rom, Freiburg, Pisa, Köln |
Betriebssystem VMS: | Ulm, Bayreuth, Dublin, Oxford. |
Auswärtige Projekte zu Gast in Tübingen
Die Einrichtungen des FSP 08 selbst stehen auch auswärtigen Hochschulen und Forschungseinrichtungen zur Verfügung. 27 auswärtige Projekte, die im Berichtszeitraum in Tübingen die Einrichtungen des FSP nutzten, hier mit TUSTEP arbeiteten und sich - überwiegend für die Vorbereitung kritischer Editionen und für Registerarbeiten - sonstige Unterstützung und Beratung für ihre Arbeit holten, wurden namentlich genannt.Pläne bis 1989
Neben der Detailarbeit zur Verbesserung und Erweiterung von TUSTEP sollen folgende Punkte bis zum Ende der Förderungszeit erledigt werden:- Implementierung der unter VM/CMS und VMS noch fehlenden Teile
- Implementierung von TUSTEP unter den Betriebssystemen BS2000 (SIEMENS) und UNIX (zunächst CONVEX)
- Implementierung der wichtigsten Teile unter MS-DOS auf dem PC; noch im Winter 87/88 sollen zumindest der Editor und die organisatorischen Programme (Dateiverwaltung, Umwandeln, Drucken) verfügbar sein.
- Englische Übersetzung des Benutzerhandbuchs
- Erstellen einer zum Selbststudium geeigneten Einführung in TUSTEP
- Einbauen weiterer Leistungen in TUSTEP (einschließlich der im Rahmen des Teilprojekts "rechnergestützte Lexikographie" entwickelten Verfahren)
- Darstellung nicht-lateinischer Zeichensätze auf dem PC (als selbständigem Gerät und als Terminal am Großrechner)
- Erweiterung des Zeichenvorrats der Drucker; Einbauen einer Schnittstelle zu POSTSCRIPT, dem neuen de-facto-Standard für Druckersteuerung.
Und nach 1989?
Die Zusatzförderung durch das Schwerpunktprogramm des Landes wird voraussichtlich nicht über Ende 1989 hinaus gewährt. Dementsprechend wurden vom ZDV für den Doppelhaushalt 1989/90 Personalstellen und Sachmittel in der entsprechenden Höhe beantragt. Ob diese Anträge von der Universität an das Land weitergegeben wurden, und, wenn ja, ob die Weiterführung der mit den Schwerpunktmitteln begonnenen Arbeiten ähnliches Gewicht bekommen wie andere Vorhaben der Universität (z.B. Ausbau der Informatik, Ostasienkolleg) ist uns nicht bekannt. Vor allem der Wegfall der drei (einschließlich Teilprojekt rechnergestützte Lexikographie: vier) Personalstellen, die jetzt aus den Sondermitteln finanziert werden, würde ernste Probleme aufwerfen, selbst wenn nur der Bestand an Programmen und Beratung gewahrt werden soll; denn mit dem gleichen Personal wie vor der Zusatzförderung müßten statt zuvor 2 Versionen für unterschiedliche Betriebssysteme deren mindestens 7 (MVS, VM/CMS, VMS, BS2000, UNIX, MS-DOS, mittelfristig OS/2) gepflegt und neuen Generationen angepaßt werden; die größere Zahl auswärtiger Installationen macht auch für die Verteilung der Updates und die Verfolgung von installationsabhängigen Problemen mehr Arbeit als vor 1985. Auch der Betrieb der mit Mitteln des FSP beschafften Anlagen (vor allem KDEM Omnifontleser, OCR-Leser, Diskettenkonverter) bindet eine Arbeitskraft.Deshalb wurde an die Teilnehmer appelliert, entsprechende Interessen an geeigneten Stellen in der Universität und bei der Landesregierung zu artikulieren.
(Die Kurzfassungen der Referate wurden von den Referenten zur Verf�gung gestellt.)
Zur Übersicht über die bisherigen Kolloquien
tustep@zdv.uni-tuebingen.de - Stand: 22. Juli 2003