Künstliche Intelligenz

Denken schärfen. KI verantworten. Entscheidungen tragen.

KI verändert vor allem, wie Menschen urteilen.

Weil Outputs plausibel, schnell und souverän wirken, sinkt die Fehlerüberwachung, ohne dass das auffällt.

In einer Studie berichteten 79 Prozent der befragten Wissensarbeitenden, dass sie durch KI-Nutzung weniger kognitiven Aufwand betreiben als zuvor (Lee et al., 2025). Das eigentliche Risiko liegt damit in der Interaktion selbst.

Ich helfe Führungskräften und Organisationen, diese Veränderung zu verstehen und Entscheidungssysteme zu bauen, die auch mit KI funktionieren.

Zwei Monitore in abgedunkeltem Raum, auf denen die ChatGPT-Oberfläche und die OpenAI-Website geöffnet sind, als Symbol für den Einsatz von KI im Arbeitsalltag.

Wo Urteilsqualität im KI-Kontext verloren geht

Automation Bias und sinkende Fehlerüberwachung

KI-Outputs wirken objektiver als menschliche Einschätzungen, weil sie von einem System stammen.

Das führt dazu, dass Ergebnisse seltener aktiv hinterfragt werden, Fehler später auffallen und Verantwortlichkeiten im Team diffuser werden. Automation Bias ist in der Forschung gut belegt und tritt auch bei erfahrenen Fachpersonen auf, die wissen, dass KI-Systeme Fehler machen (Goddard, Roudsari & Wyatt, 2012).

Das Wissen um die Fehleranfälligkeit allein schützt nicht vor dem Effekt.

Verantwortungsdiffusion

Wenn eine Entscheidung technisch vermittelt wirkt, fällt es leichter, kritische Konsequenzen auszublenden und Verantwortung auf die KI zu verschieben.

Das ist ein kognitiver Mechanismus, der unabhängig davon wirkt, wie kompetent oder gewissenhaft die beteiligten Personen sind. Er tritt besonders dann auf, wenn Entscheidungsprozesse nicht klar definieren, wer was auf welcher Grundlage prüft.

Fehlt diese Klarheit, übernimmt niemand die Prüfung, weil alle annehmen, dass jemand anderes sie übernimmt.

Illusion of Understanding

KI-Outputs klingen sprachlich glatt und inhaltlich plausibel. Das erzeugt das Gefühl, den Inhalt verstanden zu haben, auch wenn keine echte Prüfung stattgefunden hat.

Das ist ein strukturelles Merkmal der Interaktion mit Systemen, die sehr gut darin sind, Kompetenz zu signalisieren.

Wer nicht aktiv prüft, ob ein Output fachlich belastbar ist, prüft stattdessen unbewusst, ob er sich stimmig anfühlt. Das sind zwei verschiedene Fragen mit oft unterschiedlichen Antworten.

Modellgrenzen und Evaluierungsprobleme

Die ausgewiesene Kompetenz eines KI-Modells hängt von den Tests ab, denen es unterzogen wurde. Jede neue Implementierung bringt neue Unsicherheit darüber, wo die tatsächlichen Leistungsgrenzen liegen, besonders in domänenspezifischen oder hochstakigen Kontexten.

Wer diese Grenzen nicht realistisch einschätzt, trifft Entscheidungen auf einer Grundlage, die er für stabiler hält als sie ist. Und weil die Fehler von KI-Systemen oft nicht zufällig, sondern systematisch auftreten, können sie sich über viele Entscheidungen hinweg aufaddieren, bevor sie sichtbar werden.

  • Goddard, K., Roudsari, A., & Wyatt, J. C. (2012). Automation bias: A systematic review of frequency, effect mediators, and mitigators. Journal of the American Medical Informatics Association19(1), 121–127. https://doi.org/10.1136/amiajnl-2011-000089

    Ikeda, S. (2024). Inconsistent advice by ChatGPT influences decision making in various areas. Scientific Reports14(1), 15876. https://doi.org/10.1038/s41598-024-66821-4

    Kosmyna, N., Hauptmann, E., Yuan, Y. T., Situ, J., Liao, X.-H., Beresnitzky, A. V., Braunstein, I., & Maes, P. (2025). Your Brain on ChatGPT: Accumulation of Cognitive Debt when Using an AI Assistant for Essay Writing Task(arXiv:2506.08872). arXiv. https://doi.org/10.48550/arXiv.2506.08872

    Lee, H.-P. (Hank), Sarkar, A., Tankelevitch, L., Drosos, I., Rintel, S., Banks, R., & Wilson, N. (2025). The Impact of Generative AI on Critical Thinking: Self-Reported Reductions in Cognitive Effort and Confidence Effects From a Survey of Knowledge Workers. Proceedings of the 2025 CHI Conference on Human Factors in Computing Systems, 1–22. https://doi.org/10.1145/3706598.3713778

    Logg, J. M., Minson, J. A., & Moore, D. A. (2019). Algorithm appreciation: People prefer algorithmic to human judgment. Organizational Behavior and Human Decision Processes151, 90–103. https://doi.org/10.1016/j.obhdp.2018.12.005

    Risko, E. F., & Gilbert, S. J. (2016). Cognitive Offloading. Trends in Cognitive Sciences20(9), 676–688. https://doi.org/10.1016/j.tics.2016.07.002

    Shojaee, P., Mirzadeh, I., Alizadeh, K., Horton, M., Bengio, S., & Farajtabar, M. (2025). The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity(arXiv:2506.06941). arXiv. https://doi.org/10.48550/arXiv.2506.06941

Wie ich arbeite

Ich berate nicht zu einzelnen KI-Modellen oder Tools. Ich setze dort an, wo fachliche Expertise vorhanden ist, aber die Arbeit mit KI das Urteilen verändert.

Dafür mache ich Verzerrungseffekte und Verantwortungsstrukturen im eigenen Kontext erfahrbar, auf Grundlage realer Fälle und Studienbefunde.

Daraus entwickeln wir gemeinsam Prüfstandards, Verantwortlichkeiten und Governance-Strukturen, die modellunabhängig tragen.

Kurzformate

  • Ein 20-minütiger Impuls für interne Fortbildungen oder Fachveranstaltungen

  • Eine 30 bis 60-minütige Keynote mit oder ohne Q&A

Workshops

90 bis 180 Minuten, interaktiv und fallbasiert

Geeignet für Führungsteams und Entscheider:innenkreise, die den Umgang mit KI-gestützten Entscheidungen strukturell schärfen wollen.

Begleitung

Sparring und Begleitmandate für Führungskräfte sowie moderierte Klärungsformate für Entscheider:innenkreise

Der Fokus liegt auf Governance-Standards, die auch dann tragen, wenn neue Modelle eingeführt werden.

Für wen das relevant ist

Diese Arbeit richtet sich an Führungskräfte und Geschäftsleitungen, die KI-Nutzung als Governance-Frage verstehen wollen,

an Teams, die täglich mit KI-Outputs arbeiten und strukturierte Prüfstandards brauchen

und an Organisationen, die Verantwortlichkeiten rund um KI-gestützte Entscheidungen klar definieren wollen, bevor Fehler passieren.

Allen gemeinsam ist die Frage, warum KI-Implementierungen trotz guter Vorbereitung zu schlechteren Entscheidungen führen können.

Mehr zum Thema