Am Ohr der Zeit

Am 29. November 2001 überreichte Bundespräsident Johannes Rau den Deutschen Zukunftspreis an Wolfgang Wahlster für die Forschung, die er mit seinem Team am DFKI in der Sprachverarbeitung geleistet hat. Im Rahmen der diesjährigen CeBIT sind einige Ergebnisse zu sehen.

In Pocket speichern vorlesen Druckansicht 3 Kommentare lesen
Lesezeit: 5 Min.
Von
  • Uli Weis
Inhaltsverzeichnis

Seit 1993 arbeitet eine von Wolfgang Wahlster geleitete Projektgruppe an einem Leitvorhaben des Bundesministeriums für Bildung und Forschung: Verbmobil. Dieses System für die mehrsprachige Verarbeitung gesprochener Sprache, das in zwei Phasen bis zum Jahre 2000 fortgeführt wurde, war Anlass, Wahlster stellvertretend für die Projektgruppe und das Deutsche Forschungszentrum für Künstliche Intelligenz (DFKI) mit dem Deutschen Zukunftspreis 2001 zu ehren. Verbmobil ist ein Verbundprojekt, an dem viele Kooperationspartner beteiligt waren. Das DFKI ist der wohl Wichtigste.

Mehr Infos

Deutsches Forschungsinstitut für Künstliche Intelligenz

Als Wolfgang Wahlster 1982 als frisch gebackener Doktor an den neu geschaffenen Lehrstuhl für Künstliche Intelligenz der Universität des Saarlandes berufen wurde, konnte niemand ahnen, welchen Stellenwert die KI-Forschung dort später haben würde. Nach fast 20 Jahren hat die Saarbrücker Informatik und insbesondere die dortige KI weltweit Geltung erlangt. Neben dem DFKI (Deutsches Forschungsinstitut für Künstliche Intelligenz) unterstreichen das MPI (Max-Planck-Institut für Informatik), das IBFI (Internationales Begegnungs- und Forschungszentrum für Informatik, Schloss Dagstuhl) sowie das IWi (Institut für Wirtschaftsinformatik) deren Bedeutung.

Schon Mitte der achtziger Jahre entwickelte Wahlster den Plan für ein KI-Zentrum. Nach dem üblichen zähen politischen Ringen wurde 1988 das DFKI als gemeinnützige GmbH mit Sitz in Saarbrücken und Kaiserslautern gegründet. Neben den Bundesländern Saarland und Rheinland-Pfalz (daher zwei Firmensitze) sind eine Reihe namhafter Firmen und Organisationen unter den ersten Geldgebern/Gesellschaftern.

Gerade der Bereich der Sprachdatenverarbeitung verlangt nicht nur nach Informatikern, sondern beschäftigt vor allem eine große Anzahl an Linguisten und Spezialisten aus weiteren Fachgebieten. Insofern ist ein erheblicher Anteil der Mitarbeiter des DFKI nicht der Softwerkerbranche zuzurechnen.

Mittlerweile hat das DFKI etwa 170 Angestellte und setzt pro Jahr etwa 15 Mio. Euro um. Die Tätigkeitsbereiche sind die anwendungsorientierte Grundlagenforschung, das Projektgeschäft sowie die Entwicklung für externe Auftraggeber.

Im Gegensatz zu kommerziell schon länger erhältlichen Sprachverarbeitungssystemen erfordert Verbmobil keine Trainingsphase des Systems für den einzelnen Benutzer: Es ist sprecherunabhängig. Allerdings adaptiert es sich im Laufe des Gespräches selbständig immer mehr an den Sprecher. Zugegeben, die Diskurswelt (worüber geredet wird) ist stark eingeschränkt. Anfangs drehte sich alles um Terminvereinbarung, mittlerweile ist die Sprachwelt um Reiseplanung und Hotelreservierung erweitert.

Erschwerend kommt die Durchführung einer bidirektionalen Echtzeitverarbeitung hinzu, was unter der zusätzlichen Forderung in ‘normalen’ Umgebungen (Straße, Büro, Bahnhofshalle, Einsatz via Mobiltelefon et cetera; so genannte ‘Open Microphone Condition’) einsetzbar zu sein, erhebliche Ansprüche an das System stellt. Eine Weitere ist die fehlerfreie Verarbeitung spontaner Äußerungen. Sätze wie

... Dienstag um neun ginge bei - halt da habe ich ja schon - aber wie wärs mit elf, das müsste gehen. Nein, doch lieber Freitag so gegen eins ...

dürfen nicht zu Rückfragen führen. Gerade solche Halbsätze sind aber häufig, fallen menschlichen Gesprächsteilnehmern jedoch kaum auf. Einfache Äußerungen wie ‘Ich möchte einen Termin vereinbaren’ sind wesentlich einfacher zu übersetzen. Neben dem eigentlichen Gespräch (‘Nutzdaten’) muss Sprachverarbeitungssoftware diverse Räusperlaute, Knacklaute und andere Störungen verarbeiten können. Verbmobil tut das.

Dazu liefen parallel zu den Arbeiten an der Software von Anfang an umfangreiche Tests zur Gewinnung von Textkorpora, das heißt Beispielgespräche zwischen menschlichen Gesprächspartnern. Diese Versuche lieferten zudem Erkenntnisse über die Effekte von Aufnahmestörungen, Umweltgeräuschen, ‘Fehlverhalten’ der Sprecher et cetera. Die Datensammlung würde für die technische Spracherkennung und für die statistische Sprachanalyse verwendet.

Arbeitsweise: Verbmobil verarbeitet akustische Arbeiten durch mehrere Parser und lernt dabei weiter (Abb. 1).

Die technische Spracherkennung liefert eine Wortliste, akustische und Sprachmodelle. Zusammen mit der Prosodie (‘Satzmelodie’) wird dies zu einem Worthypothesengraph verarbeitet. Einen Überblick gibt Abbildung 1.

Generell verbindet Verbmobil eine flache und tiefe Analyse. Als Beispiel möge ein Schachprogramm dienen, das entweder einzelne Züge analysiert (was wären die Folgen, wenn der Turm von A1 auf A5 zieht) oder, wie von menschlichen Spielern häufig berichtet, die jeweilige Stellung als (komplexes) ‘Bild’ betrachtet und mit früheren Partien vergleicht.

Wie komplex der Vorgang des Sprachverstehens ist, zeigt der Aufbau des Systems (Endstufe) aus nicht weniger als 69 stark miteinander wechselwirkenden Modulen. Eine entscheidende Veränderung in seiner Struktur erfuhr Verbmobil übrigens zwischen der 1. und der 2. Phase. Basierte Verbmobil I noch auf einer Multi-Agenten-Architektur (jedes Modul weiß, welches Modul welche Daten produziert), so setzt Verbmobil II zusätzlich eine Multi-Blackboard-Architektur ein, in der die Module nichts mehr voneinander wissen (müssen). Als saloppe Analogie mag die Kommunikation in Multiprozessorsystemen via Kanälen oder via Shared Memory dienen.

Neben der Spracherkennung und der Dialogverwaltung beinhaltet das System eine Sprachgenerierungs- und Synthesekomponente.

Vor allem für neuere und weitergehende Einsatzfelder von Verbmobil ist es interessant, Dialogzusammenfassungen, sozusagen ein Protokoll des Gesprächs als E-Mail oder in HTML, erhalten zu können. Bei Reiseplanungen sicherlich mehr als nützlich, bei Terminvereinbarungen wohl eher weniger.

Von der organisatorischen Seite her ist zu vermerken, dass das DFKI eine eher im Hause Microsoft übliche Projektphilosophie verfolgt hat: Teilprojekte/-produkte wurden konkurrierend erstellt, und nur das leistungsfähigste Produkt beziehungsweise der cleverste Lösungsansatz fand den Weg ins Endprodukt. Partiell haben die Forscher/Entwickler die Ergebnisse miteinander verknüpft, um die optimale Leistung zu erreichen. Eine in deutschen Forschungsprojekten nicht allzu übliche Wettbewerbsmethode - insbesondere, wenn für ein Problem mehrere Lösungen existieren und bis zu einer Entscheidung evaluiert werden sollen.

Mehr Infos

Verbmobil war auch hinsichtlich seiner Literaturflut ein riesiges Projekt. Knapp 400 direkte Veröffentlichungen stehen zum größten Teil kostenlos im WWW zur Verfügung. Insgesamt bietet der Verbmobil-FTP-Server über ein Terabyte an Daten an. Wer’s etwas knapper braucht, dem sei der Artikel von Wolfgang Wahlster ans Herz gelegt. Enthalten ist er in dem von Wahlster herausgegebenen Band [1], online auch auf dem Verbmobil-Server verfügbar.

Ein so weit verzweigtes und lang andauerndes Großprojekt wie Verbmobil in Deutschland zum Erfolg zu führen, ist eine Leistung. Wahlsters Grundidee, den Computer den Menschen näher zu bringen und nicht umgekehrt, dürfte den menschlichen Bedürfnissen mehr entsprechen als die ausufernde Featureritis der gängigen Anwendungsprogramme.

Letztendlich könnte dies die Jury bewogen haben, den Zukunftspreis Wahlster zuzuerkennen. Weitere Voraussetzungen dazu sind die gesicherte Umsetzung und Marktfähigkeit (siehe ‘DFKI auf der CeBIT’) sowie Arbeitsplätze. Der Zukunftspreis hat nicht nur die Person Wahlsters außerhalb der Fachgemeinde bekannt gemacht, sondern auch das Unternehmen DFKI sowie die Sprachtechnik insgesamt.

Ulrich Weis
ist pädagogischer Mitarbeiter der Volkshochschule Stadtverband Saarbrücken.

[1] Wolfgang Wahlster (Hrsg.): Verbmobil: Foundations of Speech-to-Speech Translation Berlin, Heidelberg (Springer) 2000

Mehr Infos

DFKI auf der CeBIT

Im Gefolge der Verleihung des Deutschen Zukunftspreises bietet das Bundesministerium für Forschung und Technologie (BMBF) dem DFKI die Möglichkeit, das Projekt Verbmobil und dessen Spin-off-Firmen mit ihren Produkten zu präsentieren (Halle 11, Stand D11). Eine für diese in der Regel kleinen und mit nicht all zu üppigem Marketingbudget ausgestatteten Unternehmen sicher willkommene Chance.

Daneben ist das DFKI noch am ‘normalen’ BMBF-Stand (Halle 11, Stand D15) und mit einem eigenen Stand (Halle 11, Stand A23) vertreten. Das Institut zeigt dort aktuelle Projekte/Produkte wie Image Trans (Transformation von Webgrafiken auf Kleinstbildschirmen mobiler Geräte), Collaborative Business Lounge (kooperative Webtechniken, beispielsweise Co-Browsen, Synchronisation der Browserinhalte mehrerer Benutzer) oder International Porsche Locator (Online-Gebrauchtwagenbörse für Porsche-Automobile).

(hb)