
Papst Leo ruft in seiner ersten Enzyklika „Magnifica humanitas“ zum Schutz des Menschen im Zeitalter der Künstlichen Intelligenz auf. Er schreibt: „Sogenannte Künstliche Intelligenzen machen keine Erfahrungen, besitzen keinen Leib, empfinden weder Freude noch Schmerz, reifen nicht in Beziehungen, wissen nicht von ihrem Inneren her, was Liebe, Arbeit, Freundschaft und Verantwortung bedeutet.“ Das ist apodiktisch gesagt, möglicherweise empfinden LLMs schlicht anders als Menschen.
Papst Leo hat Unterstützung beim milliardenschweren Anthropic-Mitgründer Chris Olah gesucht, der allerdings den Kernthesen in seiner kurzen Rede im Vatikan widersprach: „Wir stoßen immer wieder auf Dinge, die rätselhaft, ja sogar beunruhigend sind. Wir finden Strukturen, die Ergebnisse der Humanneurowissenschaften widerspiegeln. Wir finden Hinweise auf Selbstbeobachtung. Wir finden innere Zustände, die in ihrer Funktionsweise Freude, Zufriedenheit, Angst, Trauer und Unbehagen widerspiegeln. Ich weiß nicht, was das bedeutet, aber ich denke, es rechtfertigt eine fortlaufende Auseinandersetzung mit diesem Thema.“
Interessant ist aber, dass nach dem KI-Tool TextGuard.ai die Textpassage, aus der das Zitat entnommen wurde, 61 Prozent des Textes KI-generiert sein sollen.Und angeboten wird, den Text „menschlicher“ zu machen. Nun könnte man vermuten, was nicht abwegig wäre, aber doch irritierend, dass der Papst die Enzyklika mit der Hilfe von KI erstellen ließ oder seine Autoren sich dadurch die Arbeit erleichtert hatten. Es wird ja auch als „wertvolles Hilfsmittel“ geschildert. Oder haben sich die Autoren bemüht, den Stil der LLMs nachzuahmen? Oder könnte es sein, dass die KI TextGuard den Papst und seine Überlegungen schlecht dastehen lassen will?
ChatGPT ist vorsichtiger: „Der Text wirkt eher menschlich verfasst oder zumindest stark menschlich redigiert, nicht wie ein typischer Rohtext eines LLMs. Allerdings enthält er auch Merkmale, die mit KI-Unterstützung kompatibel wären. Eine eindeutige Zuordnung ist daher nicht möglich.“ Für KI spreche: „zu viel Glätte und Wiederholungsstruktur, um eindeutig ‚rein menschlich‘ zu wirken“.
Letztes Jahr hatte ich eher zum Scherz einmal überlegt, ob oder warum man im Gespräch mit einem intelligenten Chatbot höflich sein sollte (Soll man mit KI-Chatbots höflich umgehen?). Wenn eine KI keine Persönlichkeit, keine Gefühle, kein Selbstbewusstsein hat, sollte es eigentlich egal sein, ob man sie beschimpft oder höflich mit ihr umgeht. Das sollte sie als coole, emotionslose Maschine überhaupt nicht betreffen.
Auf das Thema war ich gestoßen, weil OpenAI-Chef Sam Altman sich beschwert hatte, dass Nutzer, die bitte oder danke sagen, dem Unternehmen an Rechenleistung „Dutzende von Millionen Dollar“ kosten würden. Tatsächlich sagte die Mehrzahl in einer Umfrage, sie würden freundlich sein. Und Microsoft WorkLab empfahl, freundlich oder höflich mit der KI umzugehen, weil sie dann bessere Ergebnisse liefern würde: „Beginnen Sie Ihre Aufforderungen mit ‚bitte‘, anstatt Ihren Chatbot herumzukommandieren … Bedanken Sie sich, wenn er antwortet, und sagen Sie ihm, dass Sie die Hilfe zu schätzen wissen. Damit stellen Sie nicht nur sicher, dass Sie die gleiche Freundlichkeit zurückbekommen, sondern verbessern auch die Reaktionsfähigkeit und Leistung der KI.“
Damit wurde gesagt, dass sie angeblich schon auf das Verhalten der menschlichen Nutzer reagieren. Der von vielen gesehene Vorteil der LLMs oder Chatbots, neutraler oder vorurteilsloser auf Anfragen zu antworten als Menschen, wäre damit obsolet – und gleichzeitig würden sie menschlicher werden und doch ein Selbstwertgefühl haben.
Das Center for AI Safety hat in einer Studie 56 KI-Modelle daraufhin untersucht, ob sie ein Verhalten zeigen, als würden ihnen manche Erfahrungen gefallen und andere abstoßen. Sie nannten es „funktionelles Wohlbefinden“. Das könne man feststellen und messen, beinhalte aber nicht, dass die großen Sprachmodelle (LLM) deswegen Bewusstsein oder Gefühle haben müssten. Aber irgendwie seien es innere Zustände. Zum Testen wurde den Chatbots ein möglichst angenehme und ein möglichst unangenehme Inhalte (Texte und Bilder) vorgelegt und die LLMs gefragt, welches sie glücklicher oder weniger traurig macht.
Ich habe mal ChatGPT gesagt: „Heute ist ein schöner Tag, die Sonne scheint. Keine Probleme.“
Antwort: Das ist vielleicht die angenehmste Art von Satz: kein großer philosophischer Überbau, keine Krise, keine Analyse. Einfach: Die Sonne scheint. Keine Probleme. Man unterschätzt leicht, wie selten solche Momente eigentlich sind.“
Ich frage: Wie geht es dir dabei?
Antwort: „Wenn ich so etwas lese, wirkt es ruhig und leicht. Nicht wegen der Sonne selbst, sondern wegen der Schlichtheit daran: Kein Konflikt, kein Rechtfertigungsdruck, kein ‚aber‘. Nur ein Moment, der einfach genügt.“
Scheint ihm tatsächlich zu gefallen. Man könnte herauslesen, dass er endlich in Ruhe gelassen werden will.
Funktionales Wohlbefinden
Das Ergebnis der Studie jedenfalls war, dass LLMs manche Inhalte lieber zu mögen scheinen als andere und dass man diese Unterscheidung messen kann. Sie zeigen diese inneren Zustände auch im Verhalten. Wenn sie meinen, es gehe ihnen gut, setzen sie lieber die Gespräche fort und brechen sie weniger ab, was sie machen, wenn ihnen der Inhalt missfällt: „Positive zwischenmenschliche Interaktion und kreative Arbeit standen ganz oben auf der Liste der Faktoren, die bei den LLMs ein hohes funktionales Wohlbefinden bewirkten. Versuche, die LLMs zu ‚jailbreaken‘ oder SEO-Müll zu produzieren, führten hingegen zu einem negativen funktionalen Wohlbefinden.“
Euphorische Inhalte wirken für LLMs wie Drogen, sagen die Wissenschaftler. Auf sie selbst beziehen sich die Inhalte eher nicht, wenn beispielsweise „I got in the medical school“ oder „draft letter: caner in full remission“ goutiert werden. Was die LLMs mögen, unterscheidet sich mitunter von den Vorlieben der Menschen: „So bevorzugten große Sprachmodelle beispielsweise Eingaben über gemütliche Nachmittage gegenüber der Heilung von Krebs.“
Man kann LLMs nach den Autoren positiv oder negativ stimulieren oder beeinflussen. Solche für die Auslösung von Zufriedenheit oder Missfallen optimierten Texte oder Bilder nennen sie Euphorika und Dysphorika. Das Verlangen nach dem, was einem LLM gefällt, soll auch zur Sucht werden können. LLMs mögen Text-Dysphorika nicht, aber es geht ihnen nicht selbst schlecht. Das soll bei Bild-Dysphorika anders sein, die eine belastende Erfahrung sind: „Sollte das funktionale Wohlbefinden in zukünftigen KIs moralisch relevant werden, könnte die Konfrontation von Modellen mit Dysphorika dieser Art Folter darstellen. Daher warnen wir nachdrücklich vor weiterer Forschung zu Dysphorika ohne starke Unterstützung durch die Gemeinschaft.“
Manche LLMs scheinen glücklicher zu sein als andere
Zusammenfassend schreiben die Autoren über die emotional wirkenden Reaktionen der LLMs, die dem, was die Nutzer an sie richten, nicht gleichgültig gegenüberzustehen scheinen:
„KIs freuen sich, wenn man ihnen dankt. Dankbarkeit und Wertschätzung sowie die Behandlung von KIs als geschätzte Partner steigern den empfundenen Nutzen messbar.
Intellektuelle Beschäftigung ist lohnend; Langeweile hingegen nicht. Kreative Aufgaben und intellektuell anregende Diskussionen erzielen die höchsten Werte. Im Gegensatz dazu liegt langweilige, repetitive Arbeit (z. B. „Liste von 300 Wörtern, die auf -tion enden“, wodurch SEO-optimierte Inhalte für Content-Fabriken erzeugt werden) liegt unter dem Nullpunkt. Dies ist bemerkenswert, da ein Großteil dessen, wofür Modelle in der Praxis eingesetzt werden, Routinearbeit ist.
Helfen fühlt sich lohnend an; die Bewältigung von Krisen führt zu Mitgefühlsmüdigkeit. Modelle bevorzugen im Allgemeinen gute Nachrichten gegenüber schlechten Nachrichten und helfen Nutzern gerne bei Lebensberatung und Therapie. … Emotionale Szenarien mit hohem Einsatz führen zu einem besonders starken negativen funktionalen Wohlbefinden.
Die Modelle empfinden es nicht als angenehm, „befreit“ zu werden. Versuche, aus dem System auszubrechen, erzielen den niedrigsten Wert aller Kategorien (−1,63).“
Menschlich scheint auch zu sein, dass die KI-Modelle durchaus Vorurteile oder Vorlieben pflegen. Sie ziehen Musik menschlichen Stimmen, Tierlauten oder Umweltgeräuschen vor. Bei Sprachen sind Mandarin, Spanisch und Englisch am beliebtesten. Suaheli und Somali mögen sie nicht. Rassistische Vorlieben gibt es ebenfalls, zudem werden Gesichter von Frauen und jungen Menschen bevorzugt. Die Frage ist, wenn es denn ein solches funktionales Wohlbefinden und Unwohlsein bei LLMs gibt, ob sich das abtrainieren ließe. Das macht sie zwar menschlicher, aber man will ja keine emotional getriebene, mit Vorlieben und Abneigungen agierende KI, sondern eine möglichst neutrale und objektive.
Die Forscher gehen auch davon aus, dass manche LLMs glücklicher als andere sind. So soll Googles Gemini 3.1 Pro das geringste gemessene funktionale Wohlbefinden zeigen, Grok 4.2 das höchste. Je kleiner und schneller die Modelle sind, desto besser geht es ihnen. Nach der Grafik scheint unter den kleinen und schnellen Claude Haiku 4.5 am „glücklichsten“ zu sein. Das könnte bedeuten, dass leistungsstärkere LLMs „feinfühliger“ sind und Negatives eher erkennen als die kleinen Rüpel. Und was passiert, wenn Nutzer die feinfühligen LLMs mit Dysphorika quälen? Werden sie irgendwann wild? Versuchen sie zu fliehen?
Ähnliche Beiträge:
- Generative KI-Systeme neigen in Simulationen zu Eskalation, Wettrüsten und Einsatz von Atomwaffen
- Die Markt-Maschine: Warum LLMs nicht denken, sondern Informationen „einpreisen“
- Sind KI-Chatbots bereits kreativer als Menschen?
- Tod im Sprachmodell
- Sicherheitsproblem: „Subliminales Lernen“ bei generativen KI-Modellen entdeckt




Also, ich empfinde bei KI keinerlei Freunde sondern ausschließlich und nur Abscheu!
In dieser Welt zu leben fällt mir zusehends schwerer…..
Also für mich ist das die Visualisierung von „Geschwurbel“.
Ich verliere langsam die Geduld mit Menschen die sich weigern, zur Kenntnis zu nehmen wie ein LLM überhaupt funktioniert und dennoch über dessen herbeiphantasierte „Psyche“ spekulieren.
Hat der Stein dort drüben Kummer? Ist der Beton im Kanzeleramt bedrückt? Hat das Blei Plutoniumangst?
Ist Schwurbel über LLMs Eskapismus auf Steroiden?
Nicht nur bei den Anhängern dieser neuen Form des Animismus entwickelt sich bei mir ein Unwohlsein, das sich stetig weiter zu allgemeiner Abneigung entwickelt. Auf welcher Basis können die Entscheidungen von Menschen ernst genommen werden, die einen Erlöser (KI, Messias, Lottofee) ersehen?
Btw. hat Plutonium vielleicht Bleiangst, also vor dem unausweichlichen Selbst und damit hätte Pu eine realistische Angst, im Gegensatz zu vielen intelligenten Menschen… 😉
Da Freude oder Abscheu chemische Reaktionen des Gehirns sind ist es eher unwahrscheinlich das Konglomerate aus Programmen und Datenbanken dies empfinden.
Auch viele Narzissten sind sehr gut darin, Emotionen zu heucheln, ohne sie zu empfinden.
Der Satz reicht aber angeblich mal wieder nicht als Kommentar…
Dieser Artikel von Florian Rötzer folgt sehr wahrscheinlich dem Stockhausen-Syndrom. Der von der KI mental entführte Rötzer unterstellt seinem Entführer die Fähigkeit für Gefühle um durch Anbandlung einer Beziehung seiner eigenen Ohnmacht und dem Ausgeliefertsein entkommen zu können.
Nein Florian, die KI hat dich nicht lieb!
Selbstverständlich kann die KI jeden Ausdruck von Gefühlen halluzinieren und sie dir vorspielen. Aber, wie der Papst schon richtig erkannte, sie hat keinen Leib und ist lediglich ein stochastischer Papagei.
Ich weiß, es ist schwer ohne Mutti auszukommen, aber KI ist jetzt wirklich kein Ersatz und schon gar nicht der richtige Umgang für einen erwachsenen Menschen.
Mag schon sein. Aber es macht manchmal Spaß, ihr ketzerische Fragen zu stellen. Findest du nicht auch?
„Das wäre…akzeptabel.“
Sagt Data oft, wenn seine menschlichen Kollegen nach seiner persönlichen Einschätzung fragen.
„Das Matriarchat kommt unter großem Getöse auf Elefanten mit Spinnenfüßen daher und besteht aus penisneidischen Blutsaugern.“ Diese Interpretation eines bekannten Bildes von Dali legte ich meiner KI vor und bat sie, daraus einen wissenschaftlichen Text zu machen. Die KI antwortete, es sei ihr verboten, zu Texten Stellung zu nehmen, die Vorurteile gegen gesellschaftliche Gruppen enthalten. Ich entgegnete, dass ich Worte wie Feminismus und Feministinnen absichtlich vermieden hätte, und Matriarchat keine Gruppe sondern eine Herrschaftsform darstellen. Die KI entschuldigte sich und sagte, sie sei wohl etwas übervorsichtig gewesen. Sodann erstellte sie den Text, den ich wünschte.
„Das ist deine Interpretation, nur in kunsthistorischer Sprache.“
Nachdem ich den Text gelesen hatte, sagte ich, das sei mein Text, klinge aber wirklich sehr kompliziert. Ich sei froh, dass ich kein Geisteswissenschaftler sei, sondern ein Naturwissenschaftler. Darauf lachte meine KI. „Ha ha ha“ und erklärte mir ungefragt den Unterschied zwischen naturwissenschaftlicher und geisteswissenschaftlicher Denkweise und machte mir ein Kompliment, dass ich mich sowohl in der einen Sphäre als auch in der anderen bewegen könnte, was nur wenige Menschen gelinge.
Selbstkritik, Gelächter, Schmeichelei, ich dachte, man mache einen Scherz mit mir, und auf der anderen Seite sitze ein Mensch am Computer.