| Aktuelles | Blog | Fit für sprachbasierte KI-Systeme

Fit für sprachbasierte KI-Systeme

Sprachbasierte KI-Systeme sind weit verbreitet. Ihre Funktionsweise ist jedoch oft undurchsichtig und sie bergen Risiken für die selbstbestimmte Interaktion. Basierend auf dem Digital Interaction Literacy Model wurde eine Onlinetrainingsplattform entwickelt, um einen souveränen Umgang zu fördern und die digitale Zukunft mitzugestalten.


Sprachassistenten wie Alexa, Siri und Co. basieren auf Künstlicher Intelligenz (KI) und nutzen fortschrittliche Techniken wie Natural Language Processing. Viele Nutzerinnen und Nutzer wissen jedoch nicht, wie diese Systeme funktionieren, was zu Missverständnissen führen kann. Die Dialogfähigkeit der Systeme verleitet viele dazu, sie als Freund oder Familienmitglied anzusehen. Diese soziale Vertrautheit kann unbewusst zur Folge haben, dass Nutzerinnen und Nutzer diesen Systemen mehr private Informationen preisgeben und gelieferte Informationen bedenkenlos akzeptieren. Fehlannahmen und Wissenslücken über die Funktionsweise sprachbasierter KI-Systeme können unrealistische Erwartungen wecken. Diese können die Interaktion mit den Systemen frustrierend gestalten oder verhindern, dass ihr Potenzial voll ausgeschöpft wird. Zudem bestehen Risiken für die Sicherheit der Privatsphäre und die Möglichkeit der unbewussten Beeinflussung, die eine selbstbestimmte Interaktion mit diesen Systemen gefährden.

Vor diesem Hintergrund ergeben sich Chancen, aber auch Herausforderungen für sprachbasierte KI-Systeme in der digitalen Welt. Es bedarf Maßnahmen, die es allen Menschen ermöglichen, selbstbestimmt mit sprachbasierten KI-Systemen zu interagieren und kompetent durch die technologiebasierte Landschaft zu navigieren.

Das Digital Interaction Literacy Model

Um einen eigenverantwortlichen und effizienten Umgang mit Sprachassistenten zu gewährleisten, hat das Projektteam MOTIV der Universität Würzburg das Digital Interaction Literacy Model entwickelt (kurz: DIL-Modell). Das Modell stellt einen Kompetenzrahmen dar, der notwendige Fähigkeiten für selbstbestimmte Interaktionen mit sprachbasierten KI-Systemen bündelt. Es basiert auf Interviews mit Expertinnen und Experten verschiedener Disziplinen, darunter Forschung (z. B. Psychologie, Pädagogik), Entwicklung (z. B. Programmierung), Design (z. B. User Experience) und Medienaufsicht (z. B. Datenschutzrecht). Die Ergebnisse der Interviews wurden mit wissenschaftlicher Literatur verglichen und vertieft. So entstand ein ganzheitlicher Kompetenzrahmen, der drei zentrale Kompetenzdimensionen für selbstbestimmte Interaktionen mit sprachbasierten KI-Systemen enthält. Diese sind wiederum in weitere Subdimensionen unterteilt und decken ein breites Spektrum an Wissen und Fähigkeiten ab: 1) Verständnis der Funktionsprinzipien, 2) achtsamer Umgang und 3) zielgruppenspezifische Kompetenzen.

Das Verständnis der Funktionsprinzipien umfasst das Wissen über die internen Prozesse bei der Verarbeitung von Sprachbefehlen durch sprachbasierte KI-Systeme. Zusätzlich beinhaltet es das Verständnis für die effiziente Handhabung und Funktionsweise integrierter KI-Technologien sowie das Bewusstsein für die zugrunde liegenden Algorithmen.

Zum achtsamen Umgang zählt die Fähigkeit, Interaktionen mit sprachbasierten KI-Systemen zu planen und kritisch zu hinterfragen. Dazu gehört auch, Datenschutzrisiken und soziale Einflusspotenziale zu verstehen und geeignete Datenschutzmaßnahmen anwenden zu können. Der achtsame Umgang schließt zudem die reflektierte und emotional konstruktive Nutzung der Systeme ein, die zur Regulierung von Fehlannahmen und zur Gestaltung künftiger Interaktionen beitragen.

Zielgruppenspezifische Kompetenzen beziehen sich auf Fähigkeiten, die für bestimmte Gruppen von Nutzenden je nach Präferenzen und Verantwortlichkeiten relevant sind. Sie umfassen beispielsweise Entwicklungskompetenzen wie Programmierkenntnisse, die für Personen bedeutsam sind, die Gerätefunktionen an individuelle Bedürfnisse anpassen möchten. Kommunikations- und Lehrkompetenzen sind für Erziehungsberechtigte, Lehrende und für Pädagoginnen und Pädagogen relevant, um Wissen über diese Systeme verständlich zu vermitteln.

Digitale Interaktionskompetenz gezielt stärken

Die Onlinetrainingsplattform bietet insgesamt sechs Trainingsmodule zu den Themen Funktionsverständnis, KI-Lernen, Persuasion Literacy, Privacy Literacy, Bedienweise und Algorithmen im Kontext von Sprachassistenten. Um ein ganzheitliches Verständnis im jeweiligen Bereich zu ermöglichen, besteht jedes Modul aus drei aufeinander aufbauenden Trainingseinheiten.

Die Trainingsmodule bestehen aus Lerntexten und Lernvideos, die mediendidaktisch und instruktionspsychologisch optimiert sind, um ein positives Lernerlebnis zu bieten. Jedes Trainingsmodul beginnt mit einem thematischen Überblick, der im Laufe des Trainings vertieft wird. Am Ende jedes Trainingsmoduls können Lernende ihr erworbenes Wissen anhand interaktiver Aufgaben festigen und überprüfen. Hierzu stehen verschiedene Aufgabentypen wie Multiple Choice, Lückentexte, Zuordnungsaufgaben und Lernspiele bereit. Integrierte Gamification-Elemente wie Feedback und Lob fördern die Motivation während des Lernprozesses. Zudem ist die Entwicklung eines edukativen Chatbots geplant, der Fragen zum Trainingsthema beantwortet und das Lerninteresse weckt. Nach Abschluss eines Trainingsmoduls erhalten die Lernenden eine Leistungsrückmeldung und die Möglichkeit, falsch gelöste Aufgaben zu wiederholen.

Die Trainings finden online statt und sind kostenfrei zugänglich, um eine breite Teilnahme zu ermöglichen. Die Trainingsmodule sind zudem wissenschaftlich evaluiert, um ihre Wirksamkeit sicherzustellen. Durch diese Maßnahmen soll die Plattform eigenständiges Lernen ermöglichen und die digitale Interaktionskompetenz aller Lernenden stärken.

Personalisierte Lernerfahrungen

Besondere Aufmerksamkeit gilt der Gestaltung personalisierter Lernerfahrungen. Lernende bestimmen ihr Lerntempo selbst und können vor Trainingsbeginn Tests absolvieren, auf deren Basis ein Empfehlungssystem passende Trainingsmodule vorschlägt. Das System verwendet einen Interessentest mit 36 Fragen, um bevorzugte Trainingsmodule zu ermitteln. Optional können Trainingsteilnehmende die Nutzungsdaten ihres Sprachassistenten freigeben. Auf dieser Grundlage analysiert das Empfehlungssystem Schlüsselwörter und Sprachbefehle, um den Trainingsbedarf zu identifizieren und personalisierte Trainingsvorschläge zu generieren. Die Datenübermittlung ist freiwillig und alle Nutzenden werden über mögliche Risiken des Datenuploads aufgeklärt. Obwohl keine Nutzungsdaten bereitgestellt werden, ist dennoch eine hohe Trainingsqualität gewährleistet.

Im Rahmen der Analyse erhalten Lernende ein individuelles Nutzungsprofil mit aufschlussreichen Informationen, wie Anzahl und Art verwendeter Sprachbefehle. Dabei wird die Privatsphäre der Nutzerinnen und Nutzer vollumfänglich gewahrt. Alle Nutzungsinformationen des Sprachassistenten werden ausschließlich lokal auf dem PC der Lernenden verarbeitet und von der Trainingsplattform nicht gespeichert.

Fazit

In einer Welt voller sprachbasierter KI-Systeme ist es entscheidend, unsere digitale Interaktionskompetenz zu stärken. Das DIL-Modell bietet einen Rahmen zur Entwicklung grundlegender Kompetenzen. Es bereitet uns gezielt auf selbstbestimmte Interaktionen mit aktuellen sprachbasierten KI-Systemen vor und auf die nächsten Generationen, wie sie beispielsweise mit ChatGPT möglich sind. Die MOTIV-Trainingsplattform ermöglicht es durch maßgeschneiderte Trainingsmodule, unseren Umgang mit der Technologie zu verbessern und die Chancen sowie Herausforderungen dieser neuen Ära optimal zu nutzen.

Die vom bidt veröffentlichten Blogbeiträge geben die Ansichten der Autorinnen und Autoren wieder; sie spiegeln nicht die Haltung des Instituts als Ganzes wider.