MiLCA - Medienintensive Lehrmodule in der Computerlinguistik-Ausbildung

Ziele

Durch das Projekt MiLCA (URL: http://milca.sfs.nphil.uni-tuebingen.de/) soll ein Netzwerk virtueller Lehrveranstaltungen für das akademische Fach Computerlinguistik erstellt werden. Als Projektpartner sind die computerlinguistisch ausgerichteten Fachbereiche an der Friedrich-Wilhelms Universität Bonn, der Justus-Liebig Universität Gießen, der Universität Osnabrück, der Universität des Saarlandes in Saarbrücken und der Eberhard Karls Universität in Tübingen sowie, für die Evaluation und die didaktische Beratung, das Psychologische Institut der Eberhard Karls Universität Tübingen beteiligt. Assoziiert sind Fachbereiche bzw. Lehrende an den Universitäten Tilburg (NL) und Nancy (F) sowie an der Ohio State University (USA) und der Universität von Toronto (CAN).

Es handelt dabei um ein offenes Netzwerk, für das noch während der Laufzeit des Projektes und natürlich auch darüber hinaus weitere Partner aus Fächern mit computerlinguistischer Ausrichtung oder aus benachbarten Disziplinen gewonnen werden sollen.

Über eine Verwertungsgesellschaft sollen auch industrielle Partner mit einer sprachtechnologischen Ausrichtung als Lernpartner in dieses Netzwerk integriert werden.

Die Computerlinguistik als relativ junges akademisches Fach hat eine interdisziplinäre Ausrichtung. Sie ist in Deutschland an etlichen Universitäten mit meist sehr kleinen Kapazitäten vertreten und ist auf das jeweils vorhandene Umfeld (Nachbardisziplinen wie Informatik, Sprachwissenschaft, Kognitionswissenschaften) angewiesen ist. Dies führt teilweise zu einer recht einseitigen Schwerpunktbildung in der Lehre, die zudem für Studierende den Studienortwechsel erschwert.

Das Projekt MiLCA soll diesem Missstand abhelfen, indem durch die im Projekt erstellten neun Lehrveranstaltungen das Lehrangebot an allen beteiligten Standorten ergänzt und ausgewogener gestaltet wird.

Für die Studierenden ergibt sich damit unmittelbar der Vorteil, dass sie ein abgerundetes Lehrangebot bei den jeweils Besten ihres Faches besuchen und direkt mit KommilitonInnen an anderen Standorten in Kontakt treten und sich in Lerngemeinschaften organisieren können. Darüberhinaus wächst die Transparenz der Studiengänge, was den Wechsel des Studienortes erheblich erleichtern dürfte.

Dies deckt sich auch mit den Absichten der beteiligten Standorte, in B.A.- und M.A.-Studiengängen die Curricula zu reorganisieren und diese national und international transparenter zu machen. Zum Teil ist dies bereits realisiert (siehe Cognitive Science Bachelorprogramm an der Universität Osnabrück, Internationaler Studiengang Computerlinguistik an der Eberhard Karls Universität Tübingen.)

Aufgrund des Netzwerkcharakters des Projektes kommen eigentlich nur zwei Lernszenarien in Betracht:

  1. Webbasiertes Lernen (web-based training, WBT). Die Studierenden erarbeiten sich Wissen und praktische Fähigkeiten im Selbststudium und im Austausch mit Tutoren, die einen Kurs entweder vor Ort oder bei der anbietenden Institution betreuen. Diese Form bietet sich für das Erlernen von Programmiersprachen, Algorithmen und Grundlagenwissen an.
  2. Asynchrones oder synchrones Seminar. Im Vordergrund steht hier die Erarbeitung von vertiefendem Wissen oder die Kooperation in Projekten im Austausch mit KommilitonInnen an den verschiedenen beteiligten Standorten. Die Seminare werden von Dozenten der anbietenden Organisation, evtl. mit TutorInnen vor Ort, betreut.

Erstellung von Inhalten

Im Mittelpunkt der ersten Projektphase stand und steht die Erstellung von Lehrmaterialien, auf denen die ersten Kurse im Sommersemester 2002 und Wintersemester 2002/2003 basieren werden.

Zwei Aspekte erscheinen uns bei diesem Erstellungsprozess besonders wichtig:

  1. Die Dokumente, die als Ensemble das Lehrmaterial für einen Kurs bilden sollen, werden mit einer Textauszeichnungssprache erstellt, die die logische Struktur dieser Dokumente erkennbar darstellt. Wir werden also weder Word als proprietäres Format noch HTML als layout-basierte Auszeichnungssprache verwenden, sondern XML (Extensible Markup Language). Die Struktur der Dokumente ist dabei als für das ganze Projekt verbindliche Beschreibung (Document Type Declaration, DTD) unter der Federführung unseres in Texttechnologie versierten Partners in Gießen niedergelegt worden. Die entsprechenden Dokumente können Sie gerne bei uns anfordern. Dieses inhaltliche Markup richtet sich dabei voll und ganz nach den Bedürfnissen der beteiligten Partner.
  2. Alle Dokumente werden als Lernobjekte (Learning Objects) mit einem Satz von Metadaten beschrieben, der in Zukunft die Dokumente nach zahlreichen Kriterien erschließbar machen wird. Hier richten wir uns nach dem von der IEEE propagierten und inzwischen weit verbreiteten Standard LOM (Learning Objects Metadata). Auch diese Dokumentation kann bei uns angefordert werden.

Alle mit den Dokumentdeklarationen konformen Dokumente, die im Projekt erstellt werden, sind dadurch unabhängig von proprietäten Lernumgebungen und Plattformen, seien es Eigenentwicklungen oder kommerzielle Produkte.

Nichtsdestotrotz haben wir uns, wie Sie im nächsten Abschnitt sehen werden, für eine gemeinsame Lehr-/Lernplattform für die Durchführung von Seminaren und Kursen entschieden.

Lehr-/Lernumgebung

Nach Sichtung der Angebote und Gesprächen mit Entwicklern haben wir uns projektweit für die Verwendung der Lehr-/Lernplattform ILIAS, die an der Universität Köln entwickelt wird, entschieden.

Die Gründe für diese Wahl sind:

Zudem hat sich die Plattform im Lehrbetrieb an der Universität Köln und an der Hochschule der Bundeswehr in Hamburg bereits bewährt.

Eine einheitliche Lehr-/Lernplattform unterstützt unseren virtuellen Lehrbetrieb in den folgenden Aspekten:

Für die virtuelle synchrone Kommunikation, die in zwei Teilprojekten erprobt wird, verwenden wir ein "Shared Whiteboard" mit integriertem Chatwerkzeug (TULKA, eine Entwicklung der Universität Tübingen im Rahmen der "virtuellen Hochschule Baden-Württemberg"). Nähere Informationen geben wir Ihnen auf Wunsch gerne. Das Tool steht Ihnen ebenfalls als Open Source lizenzfrei zur Verfügung.

Evaluation und didaktische Beratung

Das Projekt wird begleitet durch eine formative Evaluation. Diese ist gekoppelt mit einer didaktischen Beratung der Kurs-erstellenden Partner. Die didaktische Beratung umfasst vor allem:

Evaluation ist die Bewertung oder der Prozess der Beurteilung des Wertes eines Produktes, Prozesses oder eines Programmes. Im Zentrum der Evaluation dieses Projektes stehen dementsprechend die Lehrmodule als Produkte sowie die Lehrveranstaltungen als Prozesse.

Die Evaluation steht in engem Zusammenhang mit der didaktischen Beratung. Aus den Ergebnissen der Evaluation ergeben sich Konsequenzen für die didaktische Gestaltung der Seminare und Kurse, die mit den Lehrenden diskutiert werden. Sie basiert auf:

die am Beginn des Seminars, während des Seminars und am Ende des Seminars erhoben werden. Wichtige Parameter sind die Akzeptanz der virtuellen Lernform (vor und nach dem Seminar) sowie der stoffbezogene Leistungszuwachs, der Auskünfte über die Effektivität der Maßnahme geben kann.

Beispiele

Das Kursangebot, das innerhalb des geförderten Verbundprojekts erstellt wird, umfasst die folgenden Lehrmodule, die jeweils den Umfang eines traditionellen Seminars haben (A = Grundlagen; B = Anwendungen):

Im Folgenden werden wir Beispiele aus den Modulen "Gesprochene Sprache", "Grammatikformalismen und Parsing" und "Information Retrieval" präsentieren.

Beispiel 1: Gesprochene Sprache

Ziel dieses Moduls ist es, die signaltheoretischen und phonetischen Grundlagen zu vermitteln, die für das Verständnis und die Anwendung der maschinellen Verarbeitung gesprochener Sprache notwendig sind. Ein wichtiger Aspekt ist es, die physikalischen Beschreibungen zugleich mit den akustischen Eigenschaften von Signalen wahrzunehmen. Für diesen Zweck ist eine multi-mediale und multimodale Lehrumgebung ideal.

Die verwendete Technik ermöglicht die Anzeige von Definitionen (und komplexen Graphiken) innerhalb eines zusätzlichen Fensters. Hier können sich die Studierenden die im gesamten Lehrinhalt referenzierten Definitionen/Graphiken anzeigen lassen, mittels einer Zoomfunktion in der Größe individuell einstellen und sie dadurch entweder als "Thumbnail" verfügbar halten oder im Detail betrachten.

Die Studierenden haben weiterhin die Möglichkeit, die Sprachsignale in der Graphik hörbar zu machen. Dadurch gibt es neben der schriftlichen Information auch visuelle und auditive Informationen, die wesentlich zum Verständnis der komplexen Sachverhalte beitragen.

Beispiel 2: Grammatikformalismen und Parsing

In dem Seminar "Grammatikformalismen und Parsing" wird in die Grammatikentwicklung auf der Grundlage eines constraint-basiereten Grammatikformalismus, der Head-driven Phrase Structure Grammar (HPSG), eingeführt. Neben der praktischen Entwicklung von Grammatikfragmenten, steht vor allem die Verzahnung linguistischer Theoriebildung, moderner Programmiermethodik, mathematischer Grundlagen und computerlinguistischer Implementierung linguistischer Theorien im Vordergrund.

In Abbildung x sehen Sie die Benutzeroberfläche von von Morph Moulder (MoMo), einem interaktiven Graphikprogramm zum Erlernen der Modelltheorie der Head-driven Phrase Structure Grammar (HPSG), das im Rahmen des Moduls A4 entwickelt und implementiert wurde und das im Kursabschnitt zu mathematischen Grundlagen eingesetzt wird. Benutzeroberfläche von MoMo

Durch eigenständiges Erstellen von Objektkonfigurationen, welche die sogenannten Feature Structures der HPSG veranschaulichen, können mit interaktiver Unterstütztung in MoMo mathematische Grundbegriffe und Konzepte des HPSG-Formalismus gelernt und intuitiv verstanden werden. Feature Structures sind Konfigurationen von Objekten, die ihrerseits die innere Struktur sprachlicher Ausdruecke darstellen.

Beispiel 3: Information Retrieval

Dieses Seminar behandelt die Grundlagen der Informationserschließung (IR) sowie der Verwendung von computerlinguistischen Methoden beim IR. Im Rahmen von MiLCA fand dieses Seminar als Blockkurs bereits im März 2002 statt. Das Seminar war offen für Studierende der Universitäten Tübingen und Tilburg. Das Seminar besteht aus:
  1. Einem vierzehntägigen Block mit synchronem virtuellen Unterricht. Die Studierenden trafen sich in einem Chatraum für Plenumsdiskussionen und in verschiedenen Chaträumen für Gruppenarbeit. Verwendet wurde hierzu das Programm TULKA, das zusätzlich über eine virtuelle Tafel verfügt (s. Abbildungen x und y);
  2. Einer Projektphase von 6 Wochen, in der die Studierenden in Kleingruppen Präsentationen vorbereiten und programmieren. In dieser Phase können die Studierenden sich wahlweise asynchron oder synchron austauschen;
  3. Einem zweitägigen Workshop (Präsenzphase) in Blaubeuren (einem Gästehaus der Universität Tübingen). Hier werden die Präsentationen und Programme vorgeführt.An dem Präsenzworkshop nehmen auch Teilnehmer des parallelen Blockseminars an der Ludwig Maximilians Universität München teil.
Whiteboard

Darstellung zweier Vektoren auf der virtuellen Tafel

Chatraum

Diskussion im Chatraum über die Grafik an der virtuellen Tafel

Ausblick

Um die Weiterexistenz der Projektergebnisse zu sichern und zu verbreiten, werden die Projektpartner eine Verwertungsgesellschaft gründen. Wir gehen davon aus, dass es nicht nur im akademischen Bereich, sondern auch in der Industrie einen Bedarf an sprachtechnologischen Kursen hoher Qualität gibt. Das Kerngeschäft der Vrwertungsgesellschaft wird deshalb darin bestehen, das Angebot bekannt zu machen, ggf. bei den Kunden zu installieren und die Lizenzkosten einzutreiben. Hierzu gehört die Registrierung der Module bei bereits bestehenden oder in Zukunft eigerichteten E-Learning-Repositories. Aus den Einnahmen wird die Pflege und Aktualisierung der Kursmaterialien gesichert. Auf der anderen Seite sollen weitere Inhalts-Ersteller als Partner gewonnen werden. Der gezielten Verbreiterung des Anwenderkreises dient ebenfalls eine Sommerschule, die noch zur Laufzeit des Projekts veranstaltet wird. Wir wollen hier nicht verschweigen, dass die Gründung einer solchen Verwertungsgesellschaft mit Partnern in mehreren Bundesländern auf erhebliche rechtliche Hürden gestoßen ist, die wir bisher noch nicht überwinden konnten. Wir wünschten uns hier von den Entscheidungsträgern in den Ländern etwas mehr Flexibilität.

Wenn Sie ebensolche Pläne haben wie wir, dann können Sie sich an uns wenden. Vielleicht können Sie von unseren Erfahrungen profitieren.