Gute Kommunikation ist ein zentraler Bestandteil der medizinischen Versorgung insbesondere in sensiblen Gesprächssituationen wie Aufklärung oder Diagnosemitteilung. Eine Pilotstudie des Helios Universitätsklinikums Wuppertal und des Instituts für Medizinische Informatik der Uniklinik RWTH Aachen hat untersucht, ob künstliche Intelligenz diese Trainingsprozesse unterstützen kann. Konkret wurde geprüft ob ein Sprachmodell automatisiert strukturiertes Feedback zu simulierten Arzt Patient Gesprächen liefert. Die Ergebnisse zeigen dass die KI die Gesprächsleistung insgesamt ähnlich bewertet wie menschliche Beurteilende und dabei besonders konsistente Ergebnisse liefert.
Diese Forschungsergebnisse wurden von Mohamed Alhaskir auf dem Europäischen Medizininformatikkongress in Genua vorgestellt. (→ MIE 2026)
Hintergrund und Problemstellung:
In der medizinischen Ausbildung werden kommunikative Fähigkeiten häufig in Simulationen trainiert. Studierende führen Gespräche mit geschulten Schauspielpatientinnen und Schauspielpatienten oder Angehörigenrollen. Diese Trainings sind praxisnah doch das Feedback im Anschluss ist oft zeitlich begrenzt und fällt unterschiedlich aus. Einheitliche und vergleichbare Rückmeldungen fehlen häufig obwohl sie für den Lernprozess wichtig sind.
Hier setzt die Studie an. Sie untersucht ob ein KI System helfen kann Feedback zu standardisieren und schneller verfügbar zu machen.
Was wurde erforscht?
In der Pilotstudie wurden vier simulierte Gesprächssituationen aus der Pädiatrie aufgezeichnet. Medizinstudierende führten strukturierte Gespräche etwa zur Aufklärung oder zur Erklärung medizinischer Befunde gegenüber Eltern.
Das entwickelte System verarbeitete die Aufnahmen vollständig lokal. Es erstellte automatische Transkripte erkannte die sprechenden Personen und nutzte einfache Hinweise zu Mimik und Körperhaltung. Auf dieser Grundlage erzeugte ein Sprachmodell einen strukturierten Bewertungsbericht anhand eines etablierten Instruments zur Beurteilung medizinischer Kommunikation.
Zum Vergleich bewerteten acht menschliche Raterinnen und Rater dieselben Szenarien unabhängig voneinander. Zusätzlich wurde das Modell mehrfach unter identischen Bedingungen ausgeführt. So ließ sich vergleichen wie nah die KI an menschlichen Einschätzungen liegt und wie stark die Bewertungen jeweils schwanken.
Die wichtigsten Ergebnisse:
Insgesamt wurden 64 Bewertungen ausgewertet jeweils zur Hälfte von Menschen und vom Modell. Die durchschnittlichen Gesamtbewertungen lagen nah beieinander. Die menschlichen Beurteilenden vergaben im Mittel 12,8 Punkte die KI 13,9 Punkte auf einer Skala bis 18.
In einzelnen Szenarien gab es Unterschiede doch insgesamt zeigte sich kein systematischer Vorteil. Besonders auffällig war die geringere Streuung der Modellbewertungen. Die KI lieferte über wiederholte Durchläufe hinweg gleichmäßigere Ergebnisse als die menschlichen Beurteilenden.
Zudem erstellt das System die Rückmeldungen innerhalb weniger Sekunden. Menschliche Bewertungen benötigen im Vergleich mehrere Minuten pro Fall.
Was bedeutet das?
Die Ergebnisse zeigen dass KI gestütztes Feedback eine sinnvolle Ergänzung in der medizinischen Ausbildung sein kann. Es ermöglicht strukturierte und vergleichbare Rückmeldungen und kann Lehrende entlasten.
Für Patientinnen und Patienten ist dies indirekt relevant. Eine bessere Schulung der Kommunikation kann dazu beitragen dass medizinische Informationen verständlicher vermittelt werden und Gespräche einfühlsamer ablaufen.
Gleichzeitig ersetzt das System keine persönliche Rückmeldung durch erfahrene Lehrende. Die KI basiert auf Transkripten und vereinfachten Analysen und kann die Tiefe eines direkten Gesprächs nicht vollständig abbilden. Daher eignet sie sich vor allem als ergänzendes Instrument.
„Die Studie zeigt dass automatisiertes Feedback auf Basis von Sprachmodellen technisch umsetzbar ist und zu stabilen Ergebnissen führt“, erklärt Mohamed Alhaskir. „Unsere Ergebnisse zeigen, dass KI-basierte Analyseverfahren grundsätzlich in der Lage sind, simulationsgestützte Kommunikationstrainings sinnvoll zu ergänzen. Damit entsteht eine Grundlage, KI künftig stärker in medizinische Simulation und Lehre zu integrieren“, ergänzt Hannah Haven vom Helios Universitätsklinikum Wuppertal.
Die Forschungsarbeit wurde als Originalarbeit in den → Proceedings veröffentlicht: Mohamed Alhaskir, Hannah Haven, Michael Langer, Tim Peters, Miriam Hertwig, Jenny Unterkofler, Christopher Plata, Simon Ostermann, Yannik Haven, Kai O. Hensel, Jonas Bienzeisler: Feasibility of LLM-Assisted Communication Feedback in Simulation-Based Medical Education: A Pilot Study. Stud Health Technol Inform 336, 2026, 2140 - 2144. DOI: 10.3233/SHTI260639.








