Vhb-Projekt zur automatischen Sprachverarbeitung
Wörter sind Blätter im Satz-Baum
"Auf welchem Gleis geht mein Zug morgen ab?" Die Frage
ist einfach genug, die Information leicht zugänglich. Trotzdem
gerät das angesprochene automatische System vielleicht in
Verwirrung, weil Züge nach seinen Vorgaben nur von, nicht
auf einem Gleis abfahren können oder weil das einprogrammierte
Lexikon kein Synonym für das Wort "Bahnsteig"
enthält und "Kreis" das am ähnlichsten lautende
Wort ist. Wie Sprachverarbeitungssysteme funktionieren, soll
den Studierenden in einer Lehrveranstaltung interaktiv vermittelt
werden. Am Lehrstuhl Informatik 8 der Universität Erlangen-Nürnberg
haben Kerstin Bücher, Horst Silberhorn und Martin Klarner
begonnen, Materialien einer Vorlesung zur Einführung in
die Sprachverarbeitung von Prof. Dr. Günther Görz zu
ergänzen und multimedial mit Bildern, Animationen und interaktiven
Übungsaufgaben aufzubereiten. Das Projekt wird von der Virtuellen
Hochschule Bayern unterstützt und soll im Herbst 2003 abgeschlossen
sein.
Wer daran arbeitet, Computer Sprache und
Sprachverstehen zu lehren, lernt auf neue Weise zu schätzen,
wie das Netz der Neuronen im menschlichen Gehirn flüssig
gesprochene Mitteilungen augenblicklich und scheinbar mühelos
erfasst. Die maschinelle Verarbeitung der Spracheingabe läuft
über verschiedene Stufen ab, die eine Vielzahl von Rechenschritten
erfordern. Vom Aufgreifen der kleinsten bedeutungstragenden Laute
über das Unterscheiden einzelner Wörter und die Rückfrage
im Wortschatz, über Abfrage und Vergleich grammatikalischer
Regeln bis hin zur Bedeutungsanalyse soll alles in Echtzeit geschehen,
also ohne auffällige Verzögerungen, die dem menschlichen
Gesprächspartner ärgerliche Wartezeiten zumuten.
Gesprochene oder geschriebene Sprache zu
"verstehen", heißt herauszufinden, was in der
Sprachsituation oder im Textzusammenhang mit einer bestimmten
Äußerung bzw. einem Satz tatsächlich gemeint
ist. Sprachverarbeitungssysteme müssen dazu die innere Struktur
der Zeichenkette analysieren, die bei gesprochener Sprache von
einem automatischen Erkenner geliefert wird. Dazu teilen sie
einen Satz in "Kanten" und "Knoten" und dringen
durch fortgesetzte, baumartig verzweigte Zergliederung bis zu
den einzelnen Wörtern und damit der Bedeutung der Aussage
vor. Der umgekehrte Weg ist ebenfalls möglich: aus den einzelnen
Wörtern Stück für Stück den Gesamtzusammenhang
aufzubauen. Alle diese Verarbeitungsschritte können Studierende
nicht nur kennenlernen, sondern selbst ausprobieren, wenn das
interaktiv nutzbare Lehrmaterial fertiggestellt ist. Sie können
beispielsweise neue Wörter ins Lexikon eintragen, Grammatikregeln
modifizieren und präzisieren oder versuchen, neue Regeln
für ein Dialogmodell zu entwerfen. Erfolg oder Misserfolg
geben sofort die Rückmeldung, inwieweit der Lehrstoff tatsächlich
beherrscht wird.
Die Einführung in die Grundlagen, Methoden
und Anwendungen der maschinellen Sprachverarbeitung kann im Hauptstudium
des Diplomstudiengangs Informatik sowie im Rahmen des Bachelor-Studiengangs
Computerlinguistik belegt werden. Berufschancen im Bereich maschinelle
Sprachverarbeitung sind ausgezeichnet, wie Kerstin Bücher
vom Lehrstuhl Informatik 8 betont, da bei der Entwicklung technischer
Geräte mehr und mehr Wert auf die natürlich-sprachliche
Interaktion zwischen Mensch und Maschine gelegt wird.
Weitere Informationen
Prof. Dr. Günther Görz
Kerstin Bücher M.A.
Lehrstuhl Informatik 8
Tel.: 09131/85 -28713
Kerstin.Buecher@informatik.uni-erlangen.de
Mediendienst FORSCHUNG Nr. 630 vom 29.05.2002