Definition und Abgrenzung

Als Bot wird häufig Software bezeichnet, die etwas selbstständig ausführt. Das beinhaltet eine Reihe von sehr unterschiedlichen Technologien: Zum einen taucht der Begriff im Zusammenhang mit bösartiger Software auf und beschreibt etwa Viren, die selbstständig Aktionen auf einem infizierten Rechner ausführen. Des Weiteren wird Software als Bot bezeichnet, die in Computersystemen bzw. anderer Software Aktionen ausführt, entweder als gewollte Automatisierung oder anstelle von Aktionen, die eigentlich von Menschen erwartet werden. Letzteres ist etwa bei Bots in Computerspielen oder zur Überwindung von Zugriffseinschränkungen der Fall – weswegen viele Registrierungen im Internet nach der Bestätigung „Ich bin kein Roboter“ fragen.

In diesem Artikel stehen jedoch Bots als interaktive Systeme im Vordergrund, mit denen Nutzer*innen interagieren können, wobei das Interaktionskonzept den Bot dabei in einer personenartigen Rolle vorsieht [1]. Das beinhaltet insbesondere die Fähigkeit des Systems, natürliche Sprache zu verstehen, sowohl textuell als auch gesprochen. Prominente Beispiele hierfür sind Chatbots und Sprachassistenten (z. B. Apple Siri, Google Assistant, Amazon Alexa, Microsoft Cortana).

Anwendung und Beispiele

Ein oft angeführtes historisches Beispiel ist ELIZA, ein von Joseph Weizenbaum am MIT in den 1960er-Jahren entwickeltes Computerprogramm [2]: ELIZA simulierte Konversationen nach vorgegebenen Regeln und war als eine Art Parodie von (oberflächlichen) Konversationen gedacht, wie man sie mit einem Psychotherapeuten haben könnte. Erstaunlicherweise jedoch wirkte das System unerwartet realistisch auf eine Reihe früher Nutzer*innen bzw. wurde von diesen mit menschlichen Eigenschaften interpretiert.

Heutige Anwendungen und Beispiele finden sich in modernen Sprachassistenten, z. B. in Smartphones und Fahrzeugen sowie in Chatbots, die an vielen Stellen z. B. einen (ersten) Kundenkontakt übernehmen, etwa auf Webseiten von Unternehmen. Ein besonders aktuelles Beispiel ist ein Chatbot der WHO, der Informationen zur Covid-19-Pandemie liefert [3]. Erwähnenswert (und online ausprobierbar) ist auch Kuki, ein Chatbot, der wider den aktuellen Trend hin zu immer größeren Sprachmodellen aus dem Bereich des maschinellen Lernens stattdessen per händisch gepflegtem Regelsystem kommuniziert – und viele Preise gewonnen hat [4].

Kritik und Probleme​​

Hier soll auf zwei wesentliche kritische Aspekte eingegangen werden: Zum einen können Probleme aus dem Sprachverständnis von Bots entstehen, zum anderen aus einer Diskrepanz von vermittelten und tatsächlichen Fähigkeiten.

Eine Reihe von Herausforderungen ergibt sich aus der Komplexität und den Eigenschaften natürlicher Sprache: Bots sollen diese verstehen, allerdings scheitern sie dabei oft an Aspekten wie Mehrdeutigkeit und Kontext. Als Beispiel dient hier ein kurzer Dialog im Café:

  • Kundin: „Haben Sie zum Mitnehmen?“
  • Mitarbeiter: „Milch und Zucker?“
  • Kundin: „Schwarz bitte.“

Weder ist die Frage der Kundin grammatikalisch vollständig, noch antwortet der Mitarbeiter direkt auf die Frage, noch ist „Schwarz“ als Farbe eine passende Antwort auf „Milch und Zucker?“ – es sei denn, man versteht eben den Kontext. Was für die Menschen im Beispiel reibungslos funktioniert, könnte einen „Barista-Bot“ vor eine schwierige Herausforderung stellen. Ähnlich verhält es sich mit sozialen und kulturellen Aspekten, Dialekten, Slang, Prosodie (Sprachmelodie) und weiteren Faktoren.

Ein weiteres Problem mit Bots sind die Erwartungen, die eine Darstellung von Systemen als (personifizierter) eigenständiger Akteur für Nutzer*innen vermittelt: Menschen nutzen Sprache im Alltag, um mit Menschen zu kommunizieren. Sprache als Interaktionskonzept vermittelt daher schnell Fähigkeiten und Intelligenz, die ein Chatbot oder Sprachassistent allerdings nicht besitzt; zumindest aktuell (noch) nicht [5].

Insgesamt ergibt sich daraus die Kritik, dass Bots als „konversationsbasierte“ interaktive Systeme heute nicht wirklich Konversation betreiben: Sie nehmen nicht an einer Konversation im menschlichen Sinne teil, sondern werden höchstens aus einer solchen heraus bedient (z. B. wenn man im Gespräch mit anderen als Nebentätigkeit die Anweisung „Alexa, mach das Licht an“ gibt).

Forschung

Bots verbinden Aspekte aus unterschiedlichen Forschungsbereichen, da verschiedene Teilprobleme gelöst werden müssen: So muss ein Sprachassistent gesprochene Sprache als Eingabe verstehen, aber auch Sprachsynthese beherrschen, um zu antworten. Dazwischen wird die Eingabe in Text umgewandelt, der dann analysiert werden muss, wie auch bei Chatbots. Hierbei ergeben sich viele weitere Unteraufgaben von Sprachverständnis und -erzeugung, wie etwa das Einbeziehen von Kontext (z. B. was bisher gesagt wurde) oder auch das Erkennen und Verstehen von benannten Entitäten (z. B. Personen, Orte, Firmennamen) – und natürlich das Generieren einer passenden und sinnvollen Antwort bzw. Reaktion. Forschung zu diesen Fragen findet z. B. im Bereich der Signalverarbeitung und der Computerlinguistik bzw. Natural Language Processing statt.

Über diese technischen Aspekte hinaus stellt auch der Bot als Schnittstelle zwischen Menschen und Computersystemen zahlreiche Herausforderungen für die Forschung; so z. B. Fragen dazu, wie ein Dialog für einen bestimmten Einsatzzweck des Bots zielführend gestaltet werden kann, welche Varianten es geben soll bzw. verstanden werden müssen oder etwa auch wie der Bot damit umgehen soll, wenn Eingaben der Nutzer*innen nicht verstanden werden [6]. Dazu kommen Fragen hinsichtlich der Gestaltung und Präsentation des Bots, etwa ob dieser einen Namen haben oder eine bestimmte Art Persönlichkeit präsentieren soll. Forschung zu theoretischen wie praktischen Aspekten solcher Fragestellungen findet sich im Bereich der Mensch-Computer-Interaktion.