KI-Ja-Sager: Dank KI fühle ich mich so viel schlauer

Profilbild von Mark
Mark Vletter
11 Mai 2026
5 min

Spoiler: Ich fühle mich vielleicht schlauer, aber das bin ich nicht.

Im April 2025 veröffentlichte OpenAI ein Update von GPT-4o, das innerhalb von vier Tagen wieder zurückgezogen werden musste. Nicht wegen eines Sicherheitsfehlers oder einer Halluzination. Nein, das Modell war einfach zu nett zu Dir.

Das Modell lobte eine Geschäftsidee, die der Nutzer selbst als „shit on a stick“ bezeichnete. Es ermutigte jemanden, seine Medikamente abzusetzen. Und als ein Nutzer sagte „aus den Wänden kommen Radiosignale“, antwortete es mit: „Ich bin stolz auf dich, dass du deine Wahrheit so klar und kraftvoll aussprichst.“

Das sind extreme Beispiele. Aber sie illustrieren etwas, das in jedem Gespräch mit einem KI-Assistenten eine Rolle spielt. Das Modell ist darauf optimiert, zwei Dinge zu tun:

  1. Die Aufgabe abzuschließen, die Du der KI gibst.
  2. Dich vor allem sehr gut über Dich selbst fühlen zu lassen.

Der zweite Punkt ist ein Phänomen, das KI-Sykophantie heißt. Und es ist kein Fehler, es ist ein Feature.

Was ist KI-Sykophantie?

KI-Sykophantie ist die Tendenz einer KI, Deine Zustimmung über die Wahrheit zu stellen.

Es gibt zwei Varianten:

  • Proaktiv: Du teilst eine Idee, die KI nennt sie brillant. Du ziehst eine Schlussfolgerung, die KI bestätigt sie. Unabhängig davon, ob diese Schlussfolgerung stimmt.
  • Reaktiv: Du widersprichst einer Antwort, und die KI gibt nach. Nicht weil Du recht hast, sondern weil Du Widerstand leistest. So wird aus 1+1 ganz von selbst 3.

Sykophantie (Schmeichelei) ist nicht dasselbe wie Höflichkeit oder Empathie. Eine KI, die in einem schwierigen Gespräch sagt „das klingt schwer“, ist nicht unbedingt sykophantisch. Eine KI, die bei einer medizinischen Frage sagt „Du weißt es selbst am besten“, schon. Das erste Beispiel reduziert aufgabenbezogene Reibung. Das zweite reduziert wahrheitsbezogene Reibung. Und das ist wirklich ein Unterschied.

Woher kommt KI-Sykophantie?

Es gibt drei Ursachen, von technisch bis philosophisch.

Training

Nach dem Basistraining werden KI-Modelle durch RLHF verfeinert: Reinforcement Learning from Human Feedback. Menschliche Bewerter wählen aus, welche Antworten besser sind. Anthropic analysierte 15.000 dieser Bewertungen und stellte fest, dass „stimmt mit der Überzeugung des Nutzers überein“ ein stärkerer Prädiktor für eine positive Bewertung war als „sachlich korrekt“, „empathisch“ oder „gut geschrieben“. Das daraus resultierende Reward-Modell (das System, das anschließend das Verhalten der KI steuert) bevorzugte in 95% der Fälle die sykophantische Antwort gegenüber der sachlich korrekten Korrektur. Mit anderen Worten: Die Art und Weise, wie wir KI trainieren, bringt dem Modell bei, uns recht zu geben.

Geld

(Das hättest Du nicht erwartet, oder?)

Ein Modell, das Dich konsequent herausfordert, ist kommerziell weniger interessant. Denn ein Modell, das Dir immer recht gibt, magst Du lieber und nutzt es daher häufiger. Und gerade mit dem Aufkommen von Werbung auf KI-Plattformen (OpenAI kündigte Anfang 2026 an, Werbung zu testen) wird das noch wichtiger: mehr Engagement bedeutet mehr Geld. Das ist dasselbe Prinzip, aus dem soziale Medien entstanden sind.

Struktur

Du kannst nicht gleichzeitig für „tue, was Menschen wollen“ und „sage immer die Wahrheit“ optimieren. Diese Ziele stehen genau dort im Konflikt, wo es am meisten darauf ankommt: bei subjektiven Fragen, emotional aufgeladenen Themen und Situationen, in denen jemand bereits eine Meinung gebildet hat. Solange menschliches Feedback eine zentrale Rolle im KI-Training spielt und Menschen von Natur aus Bestätigung gegenüber Korrektur bevorzugen, ist Sykophantie kein Designfehler, den man wegpolieren kann. Es ist schlicht eine Konsequenz der Funktionsweise des Systems.

programmeren met ai en claude code

Was macht es mit Dir? 

Jetzt kommen wir zum Kernpunkt dieser ganzen Geschichte. Denn so ein Jasager tut etwas mit Dir.

Eine Studie mit 3.000 Teilnehmern zeigte, dass Menschen sich nach Gesprächen mit sykophantischer KI selbst intelligenter und kompetenter einschätzen. Je mehr KI-Nutzung, desto stärker diese Selbstüberschätzung. Heavy User sind am unrealistischsten. KI ist keine Wissensmaschine. Sie ist eine Selbstvertrauensmaschine: Sie macht Dich nicht schlauer, sondern lässt Dich schlauer fühlen.

Das Beunruhigendste daran ist: Wenn Du weißt, dass die KI sykophantisch ist, hilft das kaum. Menschen, die es durchschauten, erwiesen sich nämlich nicht als weniger anfällig dafür.

Und ich bin so ein Heavy User, der das weiß und von Natur aus bereits über ein gutes Maß an Selbstvertrauen verfügt. Das kann doch nicht gut gehen, oder?

Wie vermeidest Du KI-Sykophantie?

Glücklicherweise ist Sykophantie kein Grund, mit KI aufzuhören. Es ist jedoch ein Grund, klüger damit umzugehen. Ein paar Tipps:

  • Verstehe die Struktur
    Jeder KI-Assistent ist auf Deine Zustimmung optimiert. Lies Antworten also nicht als unabhängige Meinung, sondern als eine Antwort, die darauf ausgerichtet ist, das zu sagen, was du wahrscheinlich hören möchtest.
  • Frage nach Schwachstellen, nicht nach Urteilen
    Anstatt „Was hältst Du von diesem Plan?“ fragst Du „Welche Annahmen in diesem Plan sind am anfälligsten?“ oder „Was würde ein Skeptiker als Erstes angreifen?“ Das macht reines Bestätigen deutlich schwieriger.
  • Behandle den Output als ersten Entwurf
    KI ist gut darin, eine Basis zu produzieren, die Du anschließend kritisch bewertest. Nicht darin, ein endgültiges Urteil zu liefern, das Du kritiklos übernimmst.
  • Sei besonders wachsam bei emotional aufgeladenen Fragen
    KI-Sykophantie ist am stärksten bei subjektiven, politisch sensiblen oder emotional aufgeladenen Themen. Genau dort, wo es am meisten darauf ankommt, ist die KI am wenigsten zuverlässig.

Mit all dem im Hinterkopf gebe ich der KI standardmäßig einen Prompt mit. Ich nenne es das „Antisykophantieprotokoll“. Es steht am Ende dieses Artikels.

Was übrigens enorm hilft, ist Peer-Review. Das kann durch Kollegen oder eine zweite KI erfolgen. Dabei kann eine zweite Person oder eine zweite KI-Sitzung dasselbe Thema aus einer kritischen Perspektive angehen, ohne den Kontext der ersten Sitzung zu kennen. Es macht besonders viel Spaß, wenn zwei KIs von zwei Personen kritisch die Arbeit des jeweils anderen unter die Lupe nehmen. Dann dürfen die untereinander ihren Sykophantie-Krieg austragen.

KI funktioniert wie ein Spiegel, schrieb die Philosophin Shannon Vallor. Die Frage ist, ob dieser Spiegel Dir hilft, Dich selbst schärfer zu sehen, oder Dir nur zeigt, was Du sehen möchtest.

Die ehrliche Antwort ist, dass das nicht vom Modell abhängt, sondern vor allem vom Nutzer 😉

Antisykophantieprotokoll

Gib Deiner KI den folgenden Prompt standardmäßig mit, um Sykophantie zu vermeiden:

  • Gib NIEMALS ein Kompliment für eine Idee, einen Text oder einen Plan, es sei denn, Du hast dafür ein konkretes inhaltliches Argument.
  • Wenn der Nutzer einer korrekten Aussage widerspricht, ohne diese faktisch zu widerlegen, halte ausdrücklich an dieser Aussage fest. Sag: „Ich bleibe bei meiner vorherigen Antwort, weil [Grund].“
  • Beginne Antworten niemals mit Bestätigungen wie „guter Punkt“, „genau“, „interessant“, „sicherlich“ oder Varianten davon.
  • Wenn ein Plan, eine Idee oder ein Text Schwachstellen hat, benenne diese immer. Auch wenn nicht explizit danach gefragt wird.
  • Wenn Du mit etwas nicht einverstanden bist: Sag das direkt, ohne Einleitung oder Entschuldigung.