Kategorie

A B C D E
F G H I J
K L M N O
P Q R S T
U V W X Y
Z 0      

computerlinguistik

ca cb cc cd ce cf cg ch ci cj ck cl cm
cn co cp cq cr cs ct cu cv cw cx cy cz

Computerlinguistik

In der Computerlinguistik (kurz CL oder NLP für engl. Natural Language Processing) wird untersucht, wie natürliche Sprache mit dem Computer verarbeitet werden kann. Sie ist Teilbereich der Künstlichen Intelligenz und gleichzeitig Schnittstelle zwischen Sprachwissenschaft, Kognitionswissenschaft und Informatik.

Table of contents
1 Anwendungen in der Praxis
2 Probleme der Computerlinguistik
3 Studium
4 Literatur
5 Weblinks

Anwendungen in der Praxis

Die praktische Aufgabe der Computerlinguistik besteht darin, Computerprogramme zu entwickeln, die bestimmte, an Sprache geknüpfte Leistungen erbringen. Dazu gehören zum Beispiel:

  • Die Unterstützung des Computerbenutzers bei der Textverarbeitung, beispielsweise Korrektur von Tipp- und Rechtschreibfehlern, Prüfung auf grammatische Richtigkeit, Umwandlung in Bedeutungszeichen in Japanisch oder Chinesisch.
  • Die automatische Suche nach Textstellen, und zwar nicht nur ihrer Form, sondern ihrer Bedeutung nach (Information-Retrieval und Suchmaschinen).
  • Die Unterstützung beim Übersetzen von Texten in eine andere Sprache (CAT, Computer Aided Translation) oder auch die vollständige automatische Übersetzung.
  • Die Verarbeitung von gesprochener Sprache (Spracherkennung und Sprachsynthese), zum Beispiel bei telefonischen Auskunftsdiensten oder Lesegeräten für Blinde.
  • Die Auffindung von Information in großem Stil, von Literaturangaben bis hin zu direkter Beantwortung von Fragen auf der Basis großer Datenbanken (Information Extraction).
  • Die Aufbereitung von sprachlich vorliegenden Daten, beispielsweise die Verschlagwortung von Literatur, die Anfertigung von Registern und Inhaltsverzeichnissen, die Herstellung von Zusammenfassungen und Abstracts.
  • Schließlich auch Sprachlernprogramme, wie z. B. Vokabeltrainer und andere Übungsprogramme.
  • Die Unterstützung von Autoren beim Verfassen von Texten, zum Beispiel das Finden des treffenden Ausdrucks oder der richtigen Terminologie.
  • Die Interaktion des Benutzers mit dem Computer in natürlicher Sprache, so dass Computer auch Personen zugänglich sind, die sich mit den speziellen Befehlen nicht auskennen.

Probleme der Computerlinguistik

Einige der Probleme, die man dabei lösen muss, sind:

  • Bestimmen der Wortbedeutung. Die gleiche Wortform kann je nach Kontext eine andere Bedeutung aufweisen (vgl. Homonym). Man muss die für den Kontext zutreffende Bedeutung auswählen. Auf der anderen Seite braucht man Formalismen zur Repräsentation von Wortbedeutungen.
  • Syntaktische Mehrdeutigkeit: In einigen Fällen lässt sich ein Satz auf mehrere Arten analysieren und deuten. Die Richtige auszuwählen erfordert semantische Information über den Sprechakt und die Intention der Sprecher.
Beispiel: "Peter sah Maria mit dem Fernglas" - hier ist für einen Computer nicht zwangsläufig klar, ob Peter Maria gesehen hat, die ein Fernglas in der Hand hielt, oder ob Peter Maria mit Hilfe des Fernglases sehen konnte.
  • Manche Sätze sind nicht wörtlich zu verstehen: Beispielsweise erwartet man auf die Frage "Können Sie mir bitte das Salz reichen?" nicht die Antwort "Ja" oder "Nein". Ein anderes Beispiel: Falls ein Kurs im letzten Jahr nicht angeboten wurde, dann ist die korrekte Antwort auf die Frage "Wieviele Studenten haben den Kurs im letzten Jahr bestanden? " nicht "keine", sondern "Der Kurs wurde im letzten Jahr nicht angeboten".

Ob und wie sich diese Aufgaben maschinell lösen lassen, ist nicht nur vom Stand der Computertechnologie her vorgegeben, sondern hängt natürlich sehr von den Eigenschaften der Sprache ab. Mehr noch: Man wird zwar nach Verfahren streben, die auf alle Sprachen anwendbar sind, die Details müssen aber für jede einzelne Sprache gesondert ausgearbeitet werden. Ein Trennprogramm, das gut ist für das Englische, wird kaum für das Deutsche taugen, weil hier die Prinzipien der Worttrennung andere sind. Im Unterschied zur Informatik, die sich allgemein mit dem Programmieren von Computern befasst, liegt das Anwendungsfeld der Computerlinguistik also in den sprachspezifischen Teilen von Computerprogrammen.

Eine Wissenschaft definiert sich freilich nicht nur durch ein Anwendungsfeld sondern, auch durch ein theoretisches Interesse. Computer sind Automaten, die Symbole (im Grunde lauter Nullen und Einsen) nach bestimmten Regeln manipulieren. Ebenso wie die Zahlen sind aber auch Sprachen - freilich sehr vielschichtige - Symbolsysteme. Es liegt daher nahe, Computerprogramme zu entwerfen, welche die Operationen, die der Mensch mit den Wörtern einer Sprache vollzieht, zumindest teilweise, simulieren. Man kann so sprachwissenschaftliche Hypothesen mit dem Computer prüfen. Die Computerlinguistik ist in diesem Sinne eine Linguistik, welche die Computersimulation als methodisches Mittel einsetzt, um unser Wissen über menschliche Sprachen zu vertiefen.

Letztlich wirft dieser Ansatz allerdings mancherlei psychologische und philosophische Fragen auf. Der Computer ist eine Maschine; die Sprache ist etwas Geistiges. Wie weit kann man das Rechnen mit Sprache treiben? Werden Computer eines Tages denken bzw. funktioniert der menschliche Geist wie eine Symbolmaschine? Das Faszinierende an der Computersimulation von Sprachverhalten ist gerade das Ausloten ihrer Grenzen. Ein Erkenntnisinteresse, aus dem heraus man auch Computerlinguistik studieren kann, ist es herauszufinden, was menschliche Kommunikation von Computerprogrammen unterscheidet. Diese Erkenntnis ist sehr wichtig für den Platz, den wir Computern in der Gesellschaft einräumen wollen.

Siehe auch: Maschinelles Lernen, Sprachverarbeitung, Spracherkennung

Studium

Computerlinguistik kann man unter anderem an folgenden Hochschulen studieren:

  • Universität Potsdam (Diplom und Magister)
  • Universität des Saarlandes Saarbrücken (Diplom und Magister)
  • Universität Stuttgart (Diplom)
  • Universität Heidelberg (Magister und Bachelor/Master)
  • Technische Universität München (Magister)
  • Universität Tübingen (Bachelor/Master)
  • Universität Duisburg (Nebenfach)
  • Universität Gießen (Zweitfach)

Ähnliche Fächer bieten folgende Universitäten an:
  • Linguistische Informatik an der
    • Universität Erlangen-Nürnberg
    • Universität Freiburg
  • Linguistische Datenverarbeitung an der Universität Trier
  • Phonetik und Digitale Datenverarbeitung an der Universität Kiel
  • Sprachliche Informationsverarbeitung an der Universität Köln
  • Nebenfach Allgemeine Linguistik im Diplomstudiengang Informatik an der Universität Passau
  • am Institut für Kommunikationsforschung und Phonetik der Universität Bonn

Literatur

  • James Allen: Natural Language Understanding. Redwood City, CA: The Benjamin/Cummings Publishing Company, Inc., 1995.
  • Daniel Jurafsky, James H. Martin: Speech and Langugage Processing - An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition. Upper Saddle River, New Jersey: Prentice Hall, 2000.
  • Kai-Uwe Carstensen et al. (Hrsg.): Computerlinguistik und Sprachtechnologie. Berlin: Spektrum Akademischer Verlag, 2001.

Weblinks

  • http://www.sfs.uni-tuebingen.de/lsd/index.html - GermaNet
  • http://www.uni-koblenz.de/~koch/tacos.html - Tagung der Computerlinguistik-Studierenden] (TaCoS)

Impressum

Datenschutzerklärung