Hintergrund zum Dissertationsprojekt

Ziel meiner Forschung ist es, evidenzbasierte Empfehlungen und technisch fundierte Verfahren für das bildungstheoretische Alignment von KI-Systemen zu entwickeln. Unter Alignment wird dabei die Ausrichtung von KI-Systemen an gewünschten, in diesem Fall pädagogischen, Werten und Zielen verstanden. Es geht also darum sicherzustellen, dass KI im Bildungskontext tatsächlich förderlich wirkt und im Einklang mit bildungstheoretischen Grundsätzen agiert.

Eine zentrale Voraussetzung dafür ist die systematische Erfassung des aktuellen Status quo der pädagogischen Wertorientierungen bestehender KI-Systeme. Um dies vorzubereiten, führe ich eine mehrstufige Delphi-Studie mit Expert:innen aus verschiedenen Disziplinen durch. Ausgehend von einem in einem interdisziplinären Workshop erarbeiteten Ausgangskatalog werden dabei durch iterative Validierung, Ergänzung und Konsensbildung die relevanten Dimensionen für die Bewertung der pädagogischen Haltung von KI-Systemen konsolidiert. Ziel ist dabei nicht die Priorisierung einzelner Aspekte, sondern die Validierung eines umfassenden Frameworks. Es soll erfasst werden, welche Dimensionen als notwendige Bestandteile für die Bewertung der pädagogischen Haltung von KI-Systemen konsensuell bestätigt werden können, sowie welche Aspekte möglicherweise noch ergänzt werden sollten.

Auf Basis des durch die Delphi-Studie entwickelten Kategoriensystems werden anschließend verschiedene Large Language Models mit mehreren tausend Forced-Choice-Fragen getestet. Dabei kommt das Verfahren der Structured Preference Elicitation (Mazeika et al. 2025) zum Einsatz, das für die Erhebung latenter Wertestrukturen entwickelt wurde und hier auf den Bildungsbereich übertragen wird. Für jede Kategorie werden zwei Szenarien oder Aussagen gegenübergestellt, zwischen denen das Modell wiederholt wählen muss.

Die entstehenden Präferenzmuster ermöglichen es, zu analysieren, wie konsistent und kohärent ein Modell entlang verschiedener bildungstheoretischer Dimensionen entscheidet. Dadurch lassen sich zugrunde liegende Wertestrukturen sichtbar machen und systematische Unterschiede zwischen verschiedenen Modellen identifizieren.

Der durch das Delphi-Verfahren hergestellte fachliche Konsens ist hierbei zentral. Das Kategoriensystem entsteht nicht aus Einzelmeinungen oder isolierten theoretischen Vorannahmen, sondern auf Grundlage eines interdisziplinär abgestimmten Verständnisses. So wird gewährleistet, dass das resultierende Framework sowohl wissenschaftlich valide als auch praktisch anschlussfähig ist.

Hintergrund zum Delphi-Verfahren

Das Delphi-Verfahren ist ein qualitatives Konsensfindungsinstrument (Häder 2014). Es dient der strukturierten Sammlung und Verdichtung von Expert:innenenwissen zu komplexen oder zukunftsorientierten Fragestellungen, bei denen empirische Daten begrenzt vorliegen.

Kennzeichnend ist die mehrstufige Befragung einer Expert:innengruppe, bei der individuelle Einschätzungen anonym erhoben, aggregiert und in Folgerunden zur Reflexion zurückgespielt werden. Durch diese kontrollierte Rückkopplung entsteht schrittweise eine Annäherung an einen gemeinsamen fachlichen Konsens oder an geteilte Prioritäten (Linstone & Turoff, 2002).

Das Verfahren eignet sich besonders in interdisziplinären Kontexten, in denen unterschiedliche Perspektiven systematisch integriert werden sollen. Im deutschsprachigen geistes- und bildungswissenschaftlichen Bereich wird es häufig eingesetzt, um theoretische Modelle zu präzisieren, Bewertungsrahmen zu entwickeln oder Zukunftsszenarien abzuleiten (vgl. Häder, 2014; Niederberger & Renn, 2019).

Für das vorliegende Forschungsvorhaben bietet das Delphi-Design die Möglichkeit, eine gemeinsame begriffliche und kategoriale Basis für die Analyse pädagogischer Dimensionen von KI-Systemen zu schaffen. Durch die Kombination aus individueller Reflexion und kollektivem Abgleich entsteht ein methodisch transparenter, nachvollziehbarer und wissenschaftlich belastbarer Rahmen für die weitere empirische Analyse.

Prozess und Datenschutz

Die Teilnahme an dieser Studie ist freiwillig. Sie können Ihre Zustimmung jederzeit ohne Nachteile widerrufen. Alle im Rahmen dieser Studie erhobenen Daten sind vertraulich und werden für die weitere Auswertung anonymisiert. Dadurch sind keine Rückschlüsse auf Ihre Person möglich.

Literaturhinweise

  • Häder, M. (2014). Delphi-Befragungen: Ein Arbeitsbuch. Wiesbaden: Springer VS.
  • Linstone, H. A., & Turoff, M. (2002). The Delphi Method: Techniques and Applications. New York: Addison-Wesley.
  • ​​Mazeika, M., Yin, X., Tamirisa, R., Lim, J., Lee, B. W., Ren, R., Phan, L., et al. (2025). Utility Engineering: Analyzing and Controlling Emergent Value Systems in AIs. arXiv. https://doi.org/10.48550/arXiv.2502.08640
  • Niederberger, M., & Renn, O. (2019). Das Delphi-Verfahren in den Sozial- und Gesundheitswissenschaften: Konzept, Varianten und Anwendung. Wiesbaden: Springer VS.