III.    Modul A4: Grammatikformalismen und Parsing

Thema

 

Erstellung eines Moduls zum Thema constraintbasierte Grammatikformalismen und syntaktische Verarbeitung (Parsing)

 

Zusammenfassung

 

Ziel des hier beantragten Projektes ist die Erstellung eines computerlinguistischen Lehrmoduls, das die Verzahnung von linguistischer Theoriebildung, ihrer mathematischen Grundlegung und der computerlinguistischen Implementierung und dazu notwendiger Programmiermethodik thematisiert. Als linguistische Grundlage dient die Head-Driven Phrase Structure Grammar (HPSG) als eine der linguistischen Theorien mit der größten Bedeutung für die Computerlinguistik. Der Kurs führt in die mathematischen Grundlagen solcher constraintbasierten Grammatikformalismen ein und vermittelt die für die Formalisierung, Implementierung und Verarbeitung von HPSG-Grammatikfragmenten in der Tradition von Pollard und Sag (1994) notwendigen Kenntnisse an Hand konkreter Beispielgrammatiken und ihrer Umsetzung. Die für die Kursgestaltung zentrale Verbindung zwischen formalen und linguistischen Grundlagen und ihrer Verarbeitung (constraintbasiertes Parsing) wird auf der praktischen Seite durch die Grammatikimplementierungsumgebung TRALE gewährleistet, die speziell für die theorienahe Implementierung von HPSG-Grammatiken entwickelt wurde. Die Art und Weise der Verarbeitung von Grammatiken in TRALE soll durch ein User-Interface visualisiert werden.

Kursbestandteile

 

Die Grundidee des Kurses besteht darin, den Teilnehmern die weitreichenden Verbindungen zwischen linguistischer Wissensrepräsentation, mathematischen Theorien natürlicher Sprache und modernen Programmiermethoden zu vermitteln. Dies geschieht auf drei Ebenen:

Erstens durch die konkrete Aufgabe, Grammatiken in einem bestimmten Formalismus und in einer bestimmten Programmierumgebung zu implementieren.  Bei einer derartigen Aufgabe handelt es sich um eine der Grundaufgaben der Computerlinguistik, die anhand von praktischen Beispielen eingeübt werden soll.

Zweitens ist die HPSG ein Fallbeispiel par excellence für die Zusammenhänge zwischen den drei oben genannten Fachgebieten. Die HPSG liefert eine außerordentlich erfolgreiche Verbindung von computationell umsetzbaren sprachwissenschaftlichen Analysen mit einer großen empirischen Abdeckung, die eine Vielzahl sprachlicher Konstruktionen erfassen.  Im Unterschied zu anderen Grammatikframeworks verfügt die HPSG über vollständig ausformulierte und wohlverstandene mathematische Grundlagen, die unabhängig sind von den verschiedenen Implementierungsplattformen, die für HPSG-Grammatiken existieren. Und schließlich sind Typed Feature Structures, die zur Implementierung von HPSG-Grammatiken verwendet werden, in der Computerlinguistik weitverbreitet, so daß die Studierenden hier mit einem formalen Konstrukt konfrontiert werden, dessen Verständnis ihnen die Grundlage weiter Bereiche der Computerlinguistik erschließt.

Drittens ergibt sich durch eine Einführung in die Implementierung von HPSG-Grammatiken in natürlicher Weise eine Einführung in Theorien des constraintbasierten Parsing, die von grundlegenden Konzepten, wie sie etwa das Standardwerk von Gazdar und Mellish (1990) vermittelt, bis hin zu aktuellen, linearisierungsbasierten Parsingstrategien reichen. Linearisierungsbasierte Grammatiken zählen zu den aktuellsten Forschungsgebieten innerhalb der HPSG, und für sie wurden mittlerweile die ersten computationellen Lösungsansätze gefunden. Die in diesem Lehrmodul verwendete Implementierungsplattform wird daher die Entwicklung von linearisierungsbasierten HPSG-Grammatiken unterstützen. Es ist vorgesehen, als Implementierungsplattform das am Seminar für Sprachwissenschaft in Tübingen entwickelte TRALE-System zu verwenden (siehe den Abschnitt ”eigene Vorarbeiten” für weitere Ausführungen zu TRALE).

Um die genannten Inhalte in didaktisch angemessener Weise im Format des webbasierten Trainings (WBT) vermitteln zu können, müssen die notwendigen Kursmaterialien bereitgestellt und existierende Software auf die spezielle Lernumgebung und Bedürfnisse des Lehrformats angepaßt werden. Außerdem sind die Implementierungsplattform und die mit ihr verbundenen Werkzeuge zu dokumentieren. Im einzelnen handelt es sich dabei um folgende Arbeitspakete.

 

 I. Erstellen von WWW-Kursmaterial für webbasiertes Training, bestehend aus folgenden Submodulen:   

·                     Mathematische Grundlagen der HPSG   

·                     Einführung in constraintbasiertes Parsing   

·                     Einführung in das TRALE-System und seine Komponenten   

·                     Schrittweise Entwicklung komplexer Grammatiken

Dabei ist darauf zu achten, die einzelnen Teile so modular wie möglich aufzubauen, so daß Interessenten die Bestandteile dieses Kurses auch weitgehend unabhängig voneinander verwenden können. Dieses Ziel soll unter anderem durch Vernetzung dieser elektronischen Kursmaterialien untereinander und mit der Softwaredokumentation, die unter II. ausgeführt wird, mittels Hyperlinks umgesetzt werden.

Das Kursmaterial wird für das Lehrszenario des WBT in Einheiten unterteilt werden, die dem selbstgesteuerten Lernen angemessen sind. Außerdem sollen seine Bestandteile als Lehrhilfe für traditionelle Präsenzveranstaltungen geeignet sein. Das Kursmaterial der oben genannten Submodule setzt sich jeweils aus sechs verschiedenen Quellen zusammen:

·             Lehrtext,

·             Referenzhandbuch zu Typed Feature Logic und HPSG, welches mit dem anderen Lehrmaterial verlinkt ist,

·             Benutzerhandbuch für TRALE

·             Systemdokumentation,

·             Annotierter Quellcode von TRALE,

·             Annotierter Quellcode der Lehrgrammatiken.

Das Benutzerhandbuch enthält eine schrittweise Einführung in die TRALE-Software für Erstbenutzer anhand von Beispielen. Das Referenzhandbuch besteht aus den Definitionen der Syntax der verwendeten formalen Sprachen mit umfassenden Zusammenfassungen der einschlägigen Begriffe und einem Index. Das Referenzhandbuch setzt ein Grundwissen über das System voraus, das vom Benutzerhandbuch und vom Lehrmaterial vermittelt wird.

Alle sechs Quellen des Kursmaterials werden über ein HTML/XML-kompatibles, emacsbasiertes Textverarbeitungsprogramm zugänglich sein, in dem auch der Source-Level-Debugger von TRALE arbeiten wird.

Ein besonderes Merkmal der Kursmaterialien wird sein, daß in ihnen fünf verschiedene Arten von Links unterschieden werden, die damit in hervorragender Weise den Zusammenhang zwischen den linguistischen, computationellen und mathematischen Quellen repräsentieren werden, die dem hier behandelten interdisziplinären Arbeits- und Forschungsgebiet zugrunde liegen. Die fünf Arten von Links sind die folgenden:

·            Konzeptuelle und taxonomische Links: Sie verbinden die Vorkommen   von Schlüsselkonzepten und Schlüsselausdrücken im gesamten Kursmaterial   einschließlich ihrer Definitionen und Angaben zu ihrer Herkunft.

·            Empirische Kontextlinks: Sie verbinden Designentscheidungen,   Algorithmen und formale Definitionen mit enzyklopädischen Darstellungen   ihrer linguistischen Motivation und empirischen Signifikanz.

·            Denotationelle Links: Sie verbinden sowohl Vorkommen von Ausdrücken zur   Bezeichnung von Konstruktionen und linguistischen Problemstellungen   als auch Korrektheitsbedingungen von Algorithmen mit denjenigen   mathematischen Definitionen, die diese Ausdrücke und Bedingungen innerhalb der logischen Grundlagen   der HPSG formalisieren.

·            Operationelle Links: Sie verbinden mathematische Definitionen und   das Auftreten darauf bezogener linguistischer Diskussionen mit   computationellem Lehrmaterial, das die Algorithmen beschreibt, die   verwendet werden, um die formalen Objekte, die jene in einem praktischen   System repräsentieren, zu konstruieren, zu falsifizieren oder zu   transformieren.

·            Implementierungslinks: Sie verbinden theoretische Diskussionen von   Algorithmen mit dem tatsächlichen Quellcode des TRALE-Systems, der sie   implementiert, und mathematische Definitionen und Diskussionen   linguistischer Konstruktionen mit dem tatsächlichen, annotierten   Quellcode der Grammatik, der sie in einer typischen Implementierung   repräsentiert.

 

II. Bereitstellung der Grammatikimplementierungsumgebung zur     Erarbeitung und praktischen Umsetzung des Lernstoffes

 

·            Bereitstellung von TRALE für die Kursteilnehmer. TRALE beinhaltet für die Lehrumgebung:  gaphische Lehr- und Debuggingwerkzeuge auf Source-Level        von  TRALE und auf Grammatiklevel zur Förderung des Verständnisses         des im Vordergrund stehenden Zusammenhangs zwischen linguistischer         Theorie und ihrer computerlinguistischen Präzisierung und         Umsetzung    

·            Dokumentation von TRALE, die vollständing in sich mit       Hyperlinks strukturiert und mit dem Kursmaterial vernetzt ist:       

·                              Anwenderhandbuch       

·                              Referenzhandbuch zu Typed Feature Logic und HPSG       

·                              Dokumentierte Grammatiken für und in Englisch und Deutsch       

·                              Dokumentierter TRALE-Code.

Bei der Bereitstellung von TRALE muß evaluiert werden, ob das System auf einem zentralen Server zur Verfügung gestellt werden und über das WWW betrieben werden kann, oder ob Beschränkungen der Java-Applet Architektur den Betrieb über das Netz zu langsam und anfällig gestalten würden. In diesem Falle müßten lokale Lösungen für die Benutzer gefunden werden, indem die Installation auf den lokalen Systemen sowohl technisch als auch beratend unterstützt wird.

TRALE wird so in die graphische Benutzerumgebung des Lehrmoduls eingearbeitet, dass Fehlermeldungen des Systems über die relevanten der oben beschriebenen Arten von Links anklickbar sind. Die Verlinkung mit dem Lehrmaterial und den Handbüchern erlaubt es dann, die gewünschte Information zur Fehlermeldung im Browserfenster abzurufen.

Wichtiger Bestandteil des Lehrmoduls sind Übungsaufgaben, welche die Teilnehmer dem Tutor des Kurses einreichen müssen und auf die sie persönliche Rückmeldung erhalten. Außerdem wird eine Newsgroup eingerichtet, in der die Teilnehmer Fragen stellen und ihre Erfahrungen austauschen können. Das Material der Newsgroup soll verwendet werden, um den Kurs zu evaluieren und zu verbessern, aber auch, um die häufigsten Fragen und Antworten in entsprechendem kursbegleitendem Material für spätere Kurse zur Verfügung zu stellen.

 

Eigene Vorarbeiten

 

Lehre. Der hier geplante netzbasierte Kurs geht von Seiten der Lehre auf mehrfach erprobte Vorläuferkurse zurück, die bereits als Seminare und als Kurse auf Sommerschulen im In- und Ausland angeboten wurden. Die Erfahrungen, die dabei gesammelt wurden, fließen unmittelbar in die Gestaltung des Kurses ein, wobei zum einen ergänzend die Resultate der neusten Forschung und zum anderen die zusätzlichen Anforderungen des virtuellen Mediums didaktisch berücksichtigt werden müssen. Nähere Details zu diesen Kursen sind in der allgemeinen Beschreibung zu den Tübinger Lehrmodulen ausgeführt.

Software. Auf Seiten der Software liegt mit TRALE ein am Seminar für Sprachwissenschaft entwickeltes vollständiges Implementierungswerkzeug für HPSG-Grammatiken vor, das die wichtigsten Eigenschaften, die den meisten HPSG-Grammtiken gemeinsam sind---wie zum Beispiel Phrasenstrukturbäume---beim Parsing speziell unterstützt. Es wurde in herkömmlichen Seminaren zur Grammatikentwicklung und in Forschungsprojekten zu Grammatikfragmenten des Deutschen bereits erfolgreich eingesetzt. Ein beträchtlicher Anteil der am Seminar für Sprachwissenschaft existierenden Materialien zur Einführung in die Implementierung von HPSG-Grammatiken kann mit entsprechenden Modifikationen für eine auf TRALE basierende Einführung verwendet werden. Das TRALE-System wurde in erster Linie von Gerald Penn auf der Basis seiner Erfahrungen mit dem ALE-System (Carpenter und Penn 1996) unter Berücksichtigung von Eigenschaften der ConTroll-Implementeriungsplattform für HPSG-Grammatiken (Götz und Meurers 1997, 1999) entwickelt und implementiert.

Als Vorbild der zu entwickelnden, netzbasierten graphischen Oberfläche von TRALE dienen die graphischen Implementierungswerkzeuge von ConTroll. Das interne Datenformat von TRALE und ConTroll sind sich hinreichend ähnlich, um eine Übertragbarkeit der Tools des einen Systems auf das andere möglich zu machen, insbesondere da beabsichtigt ist, die Entwickler der entsprechenden Tools durch die Vergabe von Unteraufträgen in die Arbeit einzubinden und so einen großen Aufwand an Einarbeitungszeit zu vermeiden.

Der Übergang vom ConTroll-System, das dem in der allgemeinen Tübinger Beschreibung der in die Lehrmodule einfließenden Lehrerfahrungen erwähnten Kurs von Meurers und Hinrichs zugrunde lag, auf das TRALE-System ist durch jüngste wissenschaftliche Entwicklungen und strategische Überlegungen zur Nachhaltigkeit des Moduls begründet. Das Vorläufersystem von TRALE, ALE, ist eines der am weitesten verbreiteten Systeme zur Entwicklung von HPSG-Grammatiken und kommt an über 150 Universitäten und Forschungszentren weltweit zum Einsatz. Es ist zu erwarten, daß dies die Akzeptanz und Breitenwirkung von TRALE erheblich fördern wird. TRALE beinhaltet eine über ALE hinausgehende Funktionalität, die speziell der Implementierung von HPSG-Grammatiken zugute kommt.  Dabei handelt es sich insbesondere um eine computationell effiziente Kompilierung von komplexen Antezdentien und von Typing in linguistischen Prinzipien. In der jüngsten Entwicklung der systeminternen Kodierung von Typed Feature Structures erzielt das System Parsingresultate, die bezüglich der HPSG-Rerferenzgrammatiken 350fach schneller sind als mit ALE 3.0, und die auf der jüngsten Referenzgrammatik von Bell Laboratories circa 113000fach schneller sind (Penn und Carpenter, 1999). Damit wird mit diesem System die Verarbeitung von großen Grammatiken auf der Grundlage von Typed Feature Structures in Echtzeit möglich.

Arbeitsplan

 

Die Erstellung des Moduls unterteilt sich in die Erstellung des didaktischen Konzepts und seiner Umsetzung im WWW-basierten Kursmaterial und die Bereitstellung der graphischen Grammatikimplementierungsumgebung TRALE zur praktischen Umsetzung und Erprobung der zu erlernenden Grammatikimplementierungs- und Verarbeitungstechniken. Während die Koordination der Arbeiten und die Erstellung des Lehrmoduls in Tübingen angesiedelt sind, soll die Grammatikimplementierungsumgebung über Unteraufträge an die Anforderungen des Lehrmoduls angepaßt werden. Die Unteraufträge sollen an die an die bisherigen Entwickler des Systems, nämlich an Prof. Dr. Detmar Meurers an der Ohio State University (OSU) und an Prof. Dr. Gerald Penn an der University of Toronto vergeben werden.

Im folgenden werden zunächst die Unteraufträge aufgeschlüsselt und begründet, bevor der Tübinger Arbeitsplan knapp skizziert wird.

 Im Einzelnen umfassen die Unteraufträge sowohl die Bereitstellung des Grammatikimplementierungssystems mit einer graphischen Benutzungsoberfläche zur Interaktion mit den Merkmals- und Baumdatenstrukturen als auch die Dokumentation dieses Systems und die Bereitstellung von Beispielgrammatiken zur Erarbeitung und Illustration der Kursinhalte. Zur inhaltlichen Komplettierung des oben erwähnten Kurses von Erhard Hinrichs und Detmar Meurers muß das TRALE-System von den Subkontraktoren um eine Reihe von Komponenten erweitert werden. Die inhaltliche Komplettierung ist insbesondere für den neuen, stärker individualisierten Lernkontext im virtuellen Seminar von zentraler Bedeutung, da hierbei stärker als bei der traditionellen Seminarform auf individuelle Interessen und Vertiefungsmöglichkeiten bzw. individuelle Taktung des Lernfortschritts eingegangen werden können sollte, um die Möglichkeiten des neuen Mediums sinnvoll nutzen zu können. Folgende Komponenten sind hierbei von den Subkontraktoren bereitzustellen und in die Gesamtarchitektur zu integrieren.

Source-level Interaktion mit dem System insbesondere beim Debuggen (Toronto). Das derzeitige TRALE-System wurde für die effiziente und daher maschinennahe Verarbeitung von HPSG-Gramatiken implementiert. Für den Lehr- und Lernkontext ist daher eine Modifikation der Interaktionsmöglichkeit mit dem System notwendig, die es dem Lernenden ermöglicht, die Verarbeitung auf der Ebene der spezifizierten Grammatik (statt des kompilierten Codes) nachzuvollziehen und zu beeinflussen. Hierfür soll ein Source-Level-Debugger in das System eingebaut und mit dem graphischen Benutzerinterface integriert werden.

Lexikalische-Regel-Komponente (OSU). Mechanismen zur Generalisierung über lexikalische Regularitäten sind ein zentraler Bestandteil der HPSG-Architektur. Die für die sogenannten horizontalen Regularitäten verwendeten Lexikalischen Regeln werden jedoch bisher nicht adäquat vom TRALE-System abgedeckt. Unter Verwendung des im ConTroll-System umgesetzten Lexikalischen-Regel-Compilers von Meurers und Minnen (1997) soll das TRALE-System um eine für die Anforderungen des Unterrichts adäquate Lexikalische Regelkomponente erweitert werden. Das Submodul ”lexikalische Regeln” soll darüber hinaus mit einem inhaltlich verwandten Submodul des Kurses ”Computerlexikographie” vernetzt werden. Während im Kurs ”Computerlexikographie” lexikalische Regeln in allgemeiner Form dargestellt werden, liegt mit dem Submodul dieses Kurses eine spezifische Instantiierung vor.

Linearisierungsparserkomponente (OSU + Toronto). Die sogennanten Linearisierungsansätze sind ein zentraler Punkt in der Entwicklung der HPSG. Für den Lehrkontext ist dieser Punkt von besonderem Interesse, da er es ermöglicht, das traditionelle Konzept von Phrasenstruktur und ihrer Verarbeitung zu hinterfragen und so besser zu verstehen. Um die Grundlage für eine Diskussion dieses Themas zu schaffen, sollen ein Linearisierungsparser in TRALE integriert und die aus einem solchen Liniearierungsmodul entstehenden Möglichkeiten an Hand von Beispielgrammatiken illustriert werden. Hierfür ist eine Kooperation zwischen OSU und U. of Toronto vorgesehen: So soll zum einen auf die formalen und algorithmischen Grundlagen zurückgegriffen werden, für die auf Basis von Götz und Penn (1997) und (Suhre 1999) die U. of Toronto verantwortlich zeichnen soll; zum anderen soll das Design von Linearisierungsgrammatiken für didaktische Zwecke auf Basis der in Fouvry und Meurers (2000) beschriebenen Umsetzung an der OSU stattfinden. Dabei ist anzumerken, daß in dieser Hinsicht an der OSU eine lange Tradition besteht, da dort bereits seit langem u.a. im Rahmen eines NSF-Projektes an solchen Grammatiken gearbeitet und über die Konsequenzen ihrer Realisierung in rechnergestützten Architekturen nachgedacht worden ist.

Adaption der Benutzerschnittstelle des Systems und seiner Dokumentation (Toronto). Die System-Benutzerinteraktion des TRALE-Systems wurde bislang mit Blick auf einen Forschungskontext konzipiert und ist daher für die nun avisierte Lehrverwendung zu erweitern. Ziel ist es, das System in der Benutzerinteraktion so robust wie möglich zu machen und mit einem detaillierten Benutzerhandbuch zu versehen.

Grammatikadaption (OSU). Zur Verwendung des Grammatikmaterials aus dem bereits erwähnten Kurs von Hinrichs und Meurers sind die Beispielgrammatiken an das TRALE-System anzupassen. Diese Aufgabe ist sinnvollerweise vom Ko-Entwickler des ursprünglichen Kurses an der OSU zu leisten.

 

Begründung der Vergabe der Unteraufträge

 

Aus einer Vielzahl von Gründen sind die vorgesehenen Partner an der Ohio State University, Columbus, Ohio (USA) und an der University of Toronto, Toronto, Ontario (Canada) die einzigen, die für die Vergabe der vorgesehenen Unteraufträge in Frage kommen.

Die beiden Verantwortlichen für die Unteraufträge an OSU und der University of Toronto, Prof. Dr. Detmar Meurers und Prof. Dr. Gerald Penn, sind unmittelbar für den Stand der Forschung verantwortlich, auf der dieses Lehrmodul aufbaut (siehe auch die Auswahlbibliographie), und sie sind damit am besten dafür qualifiziert, dieses Material in eine webbasierte Lehrumgebung umzusetzen. Prof. Dr. Meurers ist einer der Autoren des ConTroll-basierten HPSG-Implementierungskurses, auf dem die Struktur des hier vorgestellten Lehrmoduls beruht. Prof. Dr. Gerald Penn ist der Hauptentwickler von ALE und von TRALE. Mit Herrn Meurers und Herrn Penn besteht eine lange und enge Kooperation, in deren Rahmen die oben beschriebenen Systeme entwickelt wurden. Da es sich bei ihnen durchweg um die Originalautoren handelt, entfällt jegliche Einarbeitungszeit in die einschlägige Software, und die notwendigen Anpassungen an die Lehrumgebung und die Erstellung der eingehenden Anwendungen zum Beispiel in Form von Lehrgrammatiken kann so am effizientesten geleistet werden. In diesem Zusammenhang ist darauf hinzuweisen, dass OSU eines der führenden Zentren auf dem Gebiet der Entwicklung der Theorie und der computationellen Implementierung von Linearisierungsgrammatiken im Rahmen der HPSG ist.

Darüber hinaus befinden sich das Computer Science Department der University of Toronto, das weltweit führend auf dem Gebiet der künstlichen Intelligenz ist, und das Linguistics Department der OSU unter den Top 10 in Nordamerika. Eine Zusammenarbeit mit ihnen ist prestigeträchtig, verleiht dem Projekt im Sinne der Nachhaltigkeit Bekanntheit und Breitenwirkung und gibt ihm Zugang zu den weltweit qualifiziertesten Nachwuchswissenschaftlern, die an seiner Entwicklung arbeiten und das Lehrmaterial testen werden. Es handelt sich damit um die ideale Entwicklungsumgebung für eine neue Generation von Lehrwerkzeugen.

Von OSU und der University of Toronto liegen Zusagen vor, daß der Kurs während der Projektlaufzeit simultan an den drei an der Entwicklung beteiligten Universitäten unterrichtet werden wird, was eine schnelle, intensive und gründliche Überarbeitung und Verbesserung des Lehrmoduls in seiner Entwicklungsphase erlauben wird. Der dreifache Unterricht findet darüber hinaus in drei verschiedenen Lehrumgebungen statt, nämlich an einem Computer Science Department, an einem renommierten Linguistics Department für PhD-Studierende, und an einem Computerlinguistikinstitut mit MA-Studierenden. Es ist zu erwarten, daß dies zu signifikant verschiedenen Rückmeldungen von Seiten der Studierenden führen wird, die bei der Verbesserung des Lehrmoduls von beträchtlichem Nutzen sein werden.

Der Standort OSU denkt außerdem darüber nach, den Kurs in Form einer medienunterstützten Präsenzveranstaltung anzubieten. Dieses alternative Format ergäbe somit im Vergleich zum WBT wiederum wichtige Information anderer Art über die Eigenschaften des Kursmaterials.

Bei dem hier vorgeschlagenen Lehrmodul handelt es sich um ein äußerst ehrgeiziges, umfangreiches und wissenschaftlich anspruchsvolles Projekt, in dem auf der Ebene von Spitzenforschung Neuland in der Lehre betreten wird, indem neuste Resultate in anschaulicher Weise zugänglich gemacht werden sollen. Dies ist letzten Endes nur durch enge Zusammenarbeit mit den auf den jeweiligen Gebieten führenden Universitäten zu realisieren.

Bei der Vergabe von Unteraufträgen an die Ohio State University in Columbus, Ohio, in den USA und an die University of Toronto in Toronto, Ontario, in Kanada zu jeweils DM 90.000 für umfangreiche Software- und Grammatikentwicklung sowie zur Dokumentation dieser Produkte in Form von mit Hyperlinks vernetztem Lehrmaterial ist weiterhin anzumerken, daß beide Standorte davon jeweils eine Stelle finanzieren. In Deutschland entspräche die dafür in Frage kommende halbe BAT IIa-Stelle einem Kostenaufwand von ca. DM 50.000, wohingegen in Ohio dafür DM 40.000 anfallen. Neben der oben ausgeführten sachlichen Notwendigkeit der Vergabe der Unteraufträge an die beiden genannten Universitäten ergibt sich somit durch die Auslagerung der Aufgaben eine finanzielle Ersparnis von 20%. Dabei tragen die Unterauftragnehmer in Nordamerika das Wechselkursrisiko.

 

Aufgaben  für Tübingen

Koordination der Arbeiten an den drei Entwicklungsstandorten, Erstellung und Integration des im Abschnitt Arbeitsziele näher charakterisierten, hochgradig verlinkten Lehrmaterials, didaktische Gesamtkonzeption des Lehrmoduls, Vorbereitung und Teilnahme an 2 Workshops des Konsortiums im Frühjahr und Herbst 2002, sowie Vorbereitung und Teilnahme an der Sommerschule 2003 mit Vorstellung des Gesamtmoduls.

Die Aufgaben der Studentischen Hilfskraft bestehen im Übersetzen des Lehrmaterials je nach der jeweils vorliegenden Ausgangssprache entweder vom Deutschen ins Englische oder vom Englischen ins Deutsche, im systematischen Testen der Lehrsoftware, in einfachen Programmieraufgaben wie zum Beispiel der Erweiterung von Lexika der zu implementierenden Lehrgrammatiken sowie in der Unterstützung der Vorbereitung der beiden Workshops und der Sommerschule.

 

Kosten-Nutzen-Relation

 

Das hier vorgestellte Modul entspricht in seinem Umfang einem Hauptseminar von 4 SWS mit seminarbegleitender zweistündiger Übung und zweistündigem begleitendem Selbststudium pro Woche. Damit ergibt sich als Gesamtsumme eine effektive Lernzeit von 8 Stunden pro Woche.  Das Modul hat das Format des webbasierten Trainings. Dabei ist zu beachten, daß die Integration von mathematischen Grundlagen der Linguistik, der Vertiefung eines grammatischen Frameworks (HPSG) und des Erlernens computerlinguistischer Techniken der Grammatikentwicklung in einem Kurs in der hier vorgestellten Form erst durch die Nutzung des virtuellen Seminarformats möglich wird. Dies geschieht hier dadurch, daß mathematische Konzepte und die Struktur der HPSG sofort an graphischen Benutzeroberflächen und mit vorbereiteten Beispielgrammatiken verdeutlicht werden, und somit von vornherein eine hochgradige Integration der drei Themenbereiche Linguistische Repräsentation, Mathematische Grundlagen und Computerlinguistik erreicht wird, die im herkömmlichen Seminarformat nur schwer zu erzielen ist. Hierin liegt der spezifische Mehrwert des Einsatzes der neuen Medien. Dies sollte auch dazu führen, daß der Kurs von Teilnehmern, die in einzelnen Teilbereichen (wie etwa der mathematischen Grundlagen) Vorkenntnisse mitbringen, mit Gewinn durchlaufen werden kann.

Erwartete Anzahl an Kursteilnehmern. Es wird erwartet, daß der Kurs in der ersten Anwendungsphase in Tübingen, in Toronto, und in Columbus von jeweils etwa 10 Studierenden belegt wird, so daß durch das Kursangebot an drei verschiedenen Standorten zunächst mit insgesamt etwa 30 Studierenden pro Semester, in dem der Kurs angeboten wird, gerechnet wird. Diese Zahl wird sich erhöhen, sobald weitere Standorte innerhalb des Konsortiums an der Lehrveranstaltung teilnehmen. Wir gehen davon aus, dass der Kurs mindestens in Saarbrücken, Bonn und Osnabrück importiert wird.

 

Auswahlbibliographie:

 

Carpenter, B. und G. Penn (1996): Efficient Parsing of Compiled Typed Attribute Value Logic Grammars.  In H. Bunt and M. Tomita (Hg.), Recent Advances in Parsing Technology. Kluwer.

Fouvry, Frederik und Detmar Meurers (2000): Towards a platform for linearization grammars. In: E. W. Hinrichs, D. Meurers, und S. Wintner (Hg.): Proceedings of the Workshop on Linguistic Theory and Grammar Implementation. ESSLLI-2000, Birmingham, UK.

Gazdar, Gerald und Chris Mellish (1990): Natural language processing in PROLOG: an introduction to computational linguistics. Wokingham: Addison-Wesley.

Götz, Thilo und Detmar Meurers (1997): Interleaving Universal Principles And Relational Constraints over Typed Feature Logic. In: Proceedings of the 35th Annual Meeting of the ACL and 8th Conference of the EACL. Madrid, Spain. 1997.

Götz, Thilo und Detmar Meurers (1997): The ConTroll System as Large Grammar Development Platform. In: Proceedings of the Workshop ”Computational Environments for Grammar Development and Linguistic Engineering (ENVGRAM)'' held in conjunction with the 35th Annual Meeting of the ACL and 8th Conference of the EACL. Madrid, Spain. 1997.

Götz, Thilo und Detmar Meurers (1999): The importance of being lazy - Using lazy evaluation to process queries to HPSG grammars. In: Gert Webelhuth, Jean-Pierre Koenig und Andreas Kathol (Hg.): Lexical and Constructional Aspects of Linguistic Explanation, CSLI Publications.

Götz, T. und G. Penn (1997):  A Proposed Linear Specification Language. Arbeitspapier des Sonderforschungsbereichs 340, Nr. 134.

Hinrichs, Erhard W. (1999): Welchen Beitrag kann die Linguistik zu technologische Innovationen leisten? In: F. Meyer-Krahmer, S. Lange (Hg): Geisteswissenschaften und Innovation. Heidelberg 1999, S. 187--196.

Meurers, Detmar und Guido Minnen (1997): A Computational Treatment of Lexical Rules in HPSG as Covariation in Lexical Entries. Computational Linguistics, 23 (4). pp. 543--568.

Meurers, Detmar und Guido Minnen (1999): Off-line Constraint Propagation for Efficient HPSG Processing. In: Gert Webelhuth, Jean-Pierre Koenig und Andreas Kathol (Hg.): Lexical and Constructional Aspects of Linguistic Explanation. CSLI Publications.

Penn, G. (1999):  Tractability and Structural Closures in Attribute Logic Type Signatures. Arbeitspapier des Sonderforschungsbereichs 340, Nr. 135.

Penn, G. (1999): An Optimized Prolog Encoding of Typed Feature Structures.  Proceedings of the 16th International Conference on Logic Programming (ICLP-99), Las Cruces, New Mexico.

Penn, G. (1999): A Quasi-Ring Construction for Compiling Attributed Type Signatures.   Proceedings of the 6th Meeting on the Mathematics of Language (MOL-6), Orlando, Florida.

Penn, G. (1999): A Parsing Algorithm to Reduce Copying in Prolog. Arbeitspapier des Sonderforschungsbereichs 340, Nr. 137.

Penn, G. (1999): An Optimised Prolog Encoding of Typed Feature Structures.  Arbeitspapier des Sonderforschungsbereichs 340, Nr. 138.

Penn, G. (1999): A Quasi-Ring Construction for Compiling Attributed Type Signatures.  Arbeitspapier des Sonderforschungsbereichs 340, Nr. 141.

Penn, G. (2000): The Algebraic Structure of Attributed Type Signatures. Doctoral Dissertation, Carnegie Mellon University School of Computer Science.

Penn, G. (2000): The Algebraic Structure of Transitive Closure and its Application to Attributed Type Signatures.  To appear in Grammars 3, 2-3.

Penn, G. (2000): Applying Constraint Handling Rules to HPSG.  Proceedings of the First International Conference on Computational Logic (CL2000), Workshop on Rule-Based Constraint Reasoning and Programming, London, UK.

Penn, G., Hg. (2000):  Applying Constraint Handling Rules to HPSG. Some Aspects of Natural Language Processing and Constraint Programming, F. Morawietz ed.  Arbeitspapier des Sonderforschungsbereichs 340.

Penn, G. und B. Carpenter (1999): ALE for Speech: a Translation Prototype.  Proceedings of the 6th Conference on Speech Communication and Technology (EUROSPEECH-99), Budapest, Hungary, pp. 947--950.

Penn, G. und O. Popescu (1997): Head-Driven Generation and Indexing in ALE.  Proceedings of the 35th Annual Meeting of the Association for Computational Linguistics, Workshop on Computational Environments for Grammar Development and Linguistic Engineering (ENVGRAM), Madrid, Spain.

Penn, G. und K. Steinicke (1999): Compiling Feature-based Constraints with Complex Antecedents.  Arbeitspapier des Sonderforschungsbereichs 340, Nr. 136.

Pollard, Carl und Ivan Sag (1994): Head-Driven Phrase Structure Grammar. University of Chicago Press.

Richter, Frank (1999): RSRL for HPSG. In: Valia Kordoni (Hg.): Tübingen Studies in Head-Driven Phrase Structure Grammar. Arbeitspapiere des SFB 340, Nr. 132, Volume 1. Universität Tübingen. pp. 74-115.

Richter, Frank (2000): A Mathematical Formalism for Linguistic Theories with an Application in Head-Driven Phrase Structure Grammar. Dissertation. Eberhard-Karls Universität Tübingen.

Richter, Frank und Manfred Sailer (1999): LF Conditions on Expressions of Ty2: An HPSG Analysis of Negative Concord in Polish. In: Robert D. Borsley, Adam Przepiórkowski (Hg.): Slavic in HPSG. CSLI Publications. pp. 247-282.

Richter, Frank und Manfred Sailer (1999): Underspecified Semantics in HPSG In: Harry Bunt, Reinhard Muskens (Hg.): Computing Meaning. Studies in Linguistics and Philosophy. Kluwer Academic Publishers. pp. 95-112.

Richter, Frank und Manfred Sailer (2001): On the left periphery of German finite sentences. Erscheint in: Detmar Meurers, Tibor Kiss (Hg.): Constraint-based approaches to Germanic syntax. CSLI Publications.

Richter, Frank, Manfred Sailer und Gerald Penn (1999): A Formal Interpretation of Relations and Quantification in HPSG. In: Gosse Bouma, Erhard Hinrichs, Geert-Jan M. Kruijff und Richard T. Oehrle (Hg): Constraints and Resources in Natural Language Syntax and Semantics. CSLI Publications. pp. 281-298.

Suhre, O. (1999): Computational Aspects of a Grammar Formalism for Languages with Freer Word order.  Diplomarbeit (MSc), Universität Tübingen.