Lehrmodul A2: Computational Semantics

 

 

 

Typ der LV

Asynchrones Seminar

Umfang

entspricht ca. 4 SWS Vorlesung + 2 SWS Übung

Stellung im Studienplan der Heim-Universität

Wahlpflichtveranstaltung im Hauptstudium

Typische Teilnehmerzahl an der Heim-Univer­sität

25-40

Maximal zu verkraftende Teilnehmerzahl

25-40

Web-basierte Tools für die Kommunikation

Mailing list, newsgroup

Zielgruppen

Studierende der Computerlinguistik, Linguistik und Informatik mit Schwerpunkt Sprachverar­beitung; Themenauswahl für berufliche Fortbil­dung geeignet

 

 

Das Modul A2, "Computational Semantics", wird Themen umfassen, die die computerlinguistische Semantik zum Teil mehr aus theoretischer Perspektive, zum Teil mehr unter dem Aspekt der algorithmen und der softwaretechnischen Realisierung betrachten. Zusammen mit den Übun­gen wird ein Gesamtumfang von bis zu 6 SWS abgedeckt. Da die einzelnen Themen nur zum Teil aufeinander aufbauen (s. die Grafik) und intern möglichst modular konzipiert sind, ermöglicht dies, eine Auswahl zu treffen und das Gewicht z.B. mehr auf die logischen und Repräsentationsaspekte oder mehr auf die algorithmischen und Implementierungsaspekte zu legen.

 

Das Modul setzt an Vorkenntnissen Prädikatenlogik voraus; Grundkenntnisse in typtheoretischer Semantik und Grammatikformalismen sind wünschenswert, für die praktisch orientierte Variante auch Grundkenntnisse der Programmiersprache Prolog. Zielgruppe sind in erster Linie Studierende der Computerlinguistik im zweiten Studienabschnitt. Das Modul ist aber so ausgelegt, dass es auch für Studierende im ersten Studienabschnitt in Frage kommt (mit Prädikatenlogik-Kenntnissen!), ebenso für graduierte QuereinsteigerInnen aus der Informatik, und (in ausgewählten Teilen) für die berufliche Fortbildung. Im Einzelnen sind folgende Themen vorgesehen (siehe auch Grafik):

 

·        Prädikatenlogik erster Stufe

·        Inferenztechniken für Prädikatenlogik

·        Kompositionalität, Lambda-Kalkül

·        Syntax-Semantik-Schnittstelle

·        Skopus und Unterspezifikation

·        Diskursrepräsentationstheorie (DRT)

·        Dynamische Prädikatenlogik

·        Kompositionelle Varianten von DRT

·        Pronomenresolution

·        Präsuppositionen

·        Resolution von Präsuppositionen

·        Tempus- und Ereignissemantik

·        Lexikalische Semantik

 


Enge inhaltliche Bezüge bestehen vor allem zum Modul "Computerlinguistische Algorithmen" (Saarbrücken) und zum Modul "Computerlexikographie" (Tübingen, lexikalische Semantik), aber auch zur Verarbeitung gesprochener Sprache" (Bonn, im Zusammenhang mit Fokus und Informationsstruktur) sowie zum Modul "Dialogsysteme" (Saarbrücken, Dialogsemantik).

 

Bei der Gestaltung des virtuellen Angebots können wir auf bereits gut ausgearbeitete konventionelle Vorlesungen (zum Teil in Form ausgearbeiteter Skripten, mit zahlreichen Übungsaufgaben und Musterlösungen) zurückgreifen, insbesondere auf die jeweils vierstündigen Vorlesungen "Semantik" und "Computational Semantics".

 

So weit die Inhalte der Veranstaltung logischer Natur sind, ist als Interaktionsform die sorgfältige Präsentation von Formalismen, ihren Interpretations- und logischen Metakonzepten vorgesehen, ergänzt um formale Übungsaufgaben. TeilnehmerInnen erhalten Feedback durch Musterlösungen und offline korrigierte Übungsaufgaben. Zusammen mit der Einführung logisch fundierter Kernkonzepte soll aber immer auch die linguistische und algorithmische Ebene mit­betrachtet werden.

 

Übungsaufgaben der linguistischen Ebene (Anwendung formaler Werkzeuge auf die Modellierung sprachlicher Bedeutung) besitzen meist keine eindeutige Lösung. Ein echter Lerngewinn lässt sich nur durch die inhaltlichen Diskussion der Übungsresultate erzielen. Deshalb sehen wir hier die gemeinsame Arbeit in Kleingruppen vor, die durch die Internetdiskussion der TeilnehmerInnen untereinander und mit DozentIn/TutorInnen ergänzt wird (asynchrones Seminar).

 

Auf der algorithmischen Ebene sollen zusätzlich zur diskursiven Wissensvermittlung zwei Formen von Übungen eingesetzt werden: Zum einen werden kleine Programmieraufgaben für Prolog präsentiert. Wir wählen diese Programmiersprache, weil sie inhärent logiknah ist und für die vorliegenden Anwendungen sehr knappen Programmcode ermöglicht.

 

Außerdem wollen wir auf der Grundlage von bereits existierenden prototypischen Systemen tu­torielle Werkzeuge entwickeln, die es erlauben, Kompositions-, Interpretations- und Inferenzprozesse für Sprachbeispiele in verschiedenen Formalismen und Frame­works automatisch durchzuführen, schrittweise zu verfolgen und relativ frei zu kombinieren. Wir greifen hierbei auf Software zurück, die in Saarbrücken (mit-)entwickelt wurde, auf

 

·        das Mathweb-System (Franke & Kohlhase 1999), das die transparente Ansteuerung von logischen Inferenzsystemen über das Internet erlaubt;

·        das DORIS-System (Bos 1999), das Inferenztechniken zur Auflösung von Präsuppositionen einsetzt,

 

sowie vor allem auf

·        das CLEARS-System (Milward et al. 1996), das in Saarbrücken in Kooperation mit SRI In­ternational, Cambridge im Rahmen des EU-Verbundprojektes FraCaS entwickelt wurde und das einen explorativen Vergleich verschiedener Formalismen und semantischer Konzepte gestattet.

 

Gleichzeitig kann CLEARS auch als als Frontend zur Darstellung und Eingabe von komplexen Formeln und semantischen Strukturen dienen.

 

 

Blackburn, P. und J. Bos (to appear). Representation and Inference for Natural Lan­guage. Studys in Logic, Language, and Information. CSLI Press, Stanford.

 

Bos, J. (1999). Automated Reasoning for Natural Language Semantics. Proceedings of the First International Workshop on Inference in Computational Semantics, Amsterdam.

Franke, A. und M. Kohlhase (1999). System Description: MathWeb, an Agent-Based Commu­nication Layer for Distributed Automated Theorem Proving. Proceedings of the 16th Conference on Automated Deduction. Springer Verlag.

 

Milward, D., K. Konrad, H. Maier und M. Pinkal (1996). An education and research tool for computational linguistics. In Proceedings of the 16th International Conference on Computational Linguistics, COLING 96, Copenhagen.