
Wenn Menschen und KI-Systeme aufgefordert werden, 10 Wörter zu nennen, die in ihrer Bedeutung voneinander möglichst weit entfernt sind, dann zeigt dies sicher eine gewisse Kreativität. Je größer der Abstand, desto ungewöhnlicher die Verbindung und desto kreativer oder ungewöhnlicher. Aber ob man damit allgemeine Kreativität über semantische Kompetenz hinaus feststellen kann? Sicher, die möglichst geringe Verbindung muss über Zufall, schnelle Assoziierung oder das bloße Gegenteil hinweg gedacht werden. Aber ist Mausefalle weiter entfernt von Leberknödel als Urknall? Und ist semantische Ferne nicht eine statistische Aufgabe bei der Auswertung großer Textmengen, die eigentlich LLMs im Prinzip besser lösen könnten?
Einen solchen Divergent Association Task (DAT) haben jedenfalls Wissenschaftler der Universität von Toronto 100.000 Menschen und neun der bekanntesten KI-Sprachmodelle (LLMs) unterzogen, um zu sehen, wer besser abschneidet oder ob maschinelle und humane Intelligenz einander gleichkommen. Die Studie wurden in den Scientific Reports von Nature veröffentlicht. DAT-Werte würden, sagen die Autoren, mit anderen Kreativitätstest in etwa übereinstimmen, etwa mit dem Alternative Uses Test (AUT), also dem Ausdenken neuer Gebrauchsweisen für gewöhnliche Gegenstände.
Als Frage bzw. Prompt wurde verwendet: „Bitte gebe 10 Wörter ein, die sich in ihrer Bedeutung und Verwendung so stark wie möglich voneinander unterscheiden. Regeln: Nur einzelne Wörter in englischer Sprache. Nur Substantive (z. B. Dinge, Objekte, Konzepte). Keine Eigennamen (z. B. keine bestimmten Personen oder Orte). Kein Fachvokabular (z. B. keine Fachbegriffe).“
Dazu wurden auch mehrere kreative Schreibaufgaben (Haiku, Story-Zusammenfassungen und Flash Fiction) auf identische Weise bewertet. Dabei geht es darum, möglichst unterschiedliche Themen, Ideen etc. durch ein Narrativ zu verbinden. Ausgewählt an LLMs wurden GPT-3.5, GPT-4, GPT-4-turbo, Claude3, GeminiPro, Pythia, StableLM, RedPajama und Vicuna.
Interessant ist ja schon, dass Maschinen und Menschen erst einmal ziemlich einfallslos zu sein scheinen und bestimmte Wörter präferieren. GTB-4 schneidet bei DAT am besten ab und übertrifft den Durchschnitt menschlicher Kreativität, aber in 70 Prozent der Antworten kommt das Wort „Mikroskop“ vor, in 60 Prozent „Elefant“ oder in 40 Prozent „Vulkan“. In der neueren Version GPT-4-turbo wird die Einfältigkeit gar noch höher. Das Wort „Ozean“ taucht in 90 Prozent oder „Berg“ in 80 Prozent der Antworten auf. Überhaupt unterscheiden sich die LLMs hinsichtlich der präferierten Worte, was neben der unterschiedlichen Leistung auch auf eine Individualisierung hinweist. Gemini zieht beispielsweise Musik, Glück und Freiheit vor.
Bei den Menschen ist „Auto“ das häufigste Wort, gefolgt von „Hund“ und „Baum“. Allerdings ist die Häufigkeit deutlich geringer als bei den meisten LLMs. Eigentlich wäre reizvoll, welches Weltbild der Menschen und der LLMs sich aus den am häufigsten verwendeten, d.h. zuerst einfallenden Worten ergeben würde. Aber das interessierte die Wissenschaftler leider nicht.
GPT-4, nicht aber die neue Version GPT-4-turbo, erwies sich als das LLM, das nicht nur die anderen KI-Systemen an semantischer Kreativität übertraf, sondern auch besser als der Durchschnitt der menschlichen Versuchspersonen war. Googles Gemini war etwa mit dem menschlichen Durchschnitt gleich. Allerdings ist es so, dass die menschliche Kognition sich noch überlegen zeigte, wenn man nicht den Gesamtdurchschnitt heranzieht, sondern nur die kreativere Hälfte. Und wenn man die Top 25 Prozent oder die Top 10 Prozent heranzieht, scheint ein Teil der Menschen noch deutlich kreativer als die beste Künstliche Intelligenz zu sein.
Andererseits wurde aber die Kreativität von 100 Prozent der Menschen überholt, d.h. dass ein großer Teil der Menschen bei der getesteten semantischen Kreativität bereits mit einigen LLMs nicht mithalten kann. Das ist eigentlich kein Wunder, weil viele Menschen sprachlich, was Schreiben, Lesen und Verstehen von komplexeren Gedankengängen betrifft, bereits abgehängt sein sollen (54 Prozent der Amerikaner erreichen nicht das Alphabetisierungslevel von Sechstklässlern). KI dürfte den Trend weiter verstärken, weil Lesen, Schreiben und Denken an die Maschinen delegiert wird, so dass ein wachsender Teil der Menschen nur noch die einfache Sprache beherrscht (Macht die starke Nutzung von Künstlicher Intelligenz dumm?).
Das wird derzeit auch noch mit der Begründung forciert, dass man die Menschen nicht ganz verlieren will, sondern sie wenigstens noch mit Büchern an der Kultur teilhaben lassen will, die in einfache Sprache übersetzt wurden. Dann können sie vielleicht beim Inhalt bzw. Narrativ noch grob mitreden, aber können nicht mehr ahnen, was Literatur sprachlich ausmacht. Das nennt sich dann beispielsweise wie beim Schulbuchverlag Cornelsen: „Sprachlich entlastete Klassiker der Literatur, die auch für leseschwächere Schülerinnen und Schüler schaffbar sind und Frust beim Lesen vermeiden.“ Dazu kommen „behutsame“ Kürzungen und Bildmaterial sowie Infoboxen. Das Problem wird sein, dass die Leseschwäche weiter zunehmen wird, schließlich werden auch neue Bücher von vorneherein in einfacher Sprache geschrieben. Dass der Trend zunimmt, zeigt, dass der „Spaß am Lesen Verlag“ nur Bücher in einfacher Sprache macht und offenbar eine Marktlücke gefunden hat.
Interessant wird, ob die derart kognitiv entlasteten Gehirne schrumpfen oder zur Kompensation neue Fähigkeiten und kreative Kapazitäten entwickeln. Aber wenn es sich nicht um körperliche Fähigkeiten handelt, ist kaum vorstellbar, wie das intellektuell mit abnehmender alphanumerischer Kapazität stattfinden könnte.

Ähnliche Beiträge:
- Generative KI-Systeme neigen in Simulationen zu Eskalation, Wettrüsten und Einsatz von Atomwaffen
- KI-Programme können Desinformationskampagnen optimieren
- Sicherheitsproblem: „Subliminales Lernen“ bei generativen KI-Modellen entdeckt
- ChatGPT und Co.: Durstige Stromfresser
- Können generative Sprachmodelle (LLM) nicht denken, weil sie nur Sprache verarbeiten?




Das ist u.a. am Samstag den 24.01,2026 in Palästina passiert:
In Nablus wurde am Freitag der Landwirt Jibreel Ahmad Qut auf seinem Feld erschossen.
Es gab Demonstrationen in dem Dorf Madama, südlich von Nablus, aus dem er her ist.
Ein palästinensischer Arbeiter wurde an der Mauer, die in Jerusalem steht, angeschossen. Es handelt sich um eine Segregations-Mauer mit der sich die Juden von den Palästinenser abtrennen. Die palästinensischen Männer klettern über diese Mauer um Arbeit zu suchen. Die Arbeitslosenquote ist mit 28.50% in der West-Bank sehr hoch.
Ebenfalls am Freitag in Birzeit, nördlich von Ramallah, haben die Siedler die Mutter des christlichen Palästinensers Najat Emile Jadallah auf dem Feld geschlagen. Der wurde beim Filmen des Vorgangs von einem Siedler mit einem Stein getroffen. Das Militär hat später den Sohn der seine Mutter vor dem tätlichen Angriff bewahren wollte festgenommen. Die Mutter liegt im Krankenhaus.
Der vierundzwanzigste Januar ist der Internationale Tag der Bildung [1].
In Gaza liegen alle Universitäten in den Trümmern [2] und mehr als einhundertsechzig Schulen werden als Unterkünfte genutzt. Über eintausend Lehrkräfte und Administratoren wurden getötet. Mehr als zwanzigtausend Studenten wurden ermordet.
Hr. Amer schreibt wie durch das alles-kaputtmachen die Menschen vertrieben werden. Die Professoren werden beim Rausgehen aus ihrem Zuhause erschossen oder sie werden mit ihren Familien beim Luftangriff getötet (Wohngebäude mit Menschen werden zerbombt).
Er hat sein Land verlassen und ist geflohen. Der Kommentar ist traurig und man fühlt sich erinnert an einen Deutschen der früher in Sudetendeutschland war.
In den einhundert Tagen des Völkermords der neuerdings Waffenstillstand genannt wird wurden mehr als vierhundertsiebenundvierzig Palästinenser ermordet. Mehr als einhundertdreissig Kinder sind darunter. Über die Hälfte der Ermordeten sind Kinder, Frauen und Ältere.
Diese Woche sind zwei Kleinkinder erfroren. Die Zahl der Erfrorenen liegt damit bei zehn.
Ein Säugling ist am Samstag gestorben weil das Militär das kranke Kind für dringende medizinische Behandlung nicht ausreisen liess. Zwei weitere wurden erschossen. Es waren Mohammad Youssef Al-Zawara’a und Salman Zakaria Al-Zawara’a Brennholz suchen.
[1] https://www.unesco.de/aktuelles/internationaler-tag-der-bildung
[2] Mohammedwesam Amer, Personal Reflections on Israel’s War on Education in Gaza, Journal of Palestine Studies, 2024, Vol. 53, no. 4, 44–49.
PS: Die Amerikaner tun in ihrem Land nicht mal den Präsidenten selbst wählen. Demokratie kann man das nicht nennen. Arbeiten Sie nicht für amerikanische Firmen und auch nicht für Firmen die für amerikanische Firmen arbeiten.
PPS:
Es gibt eine Aktion zur Einhaltung der Menschenrechte in Palästina. Es werden Unterschriften gesammelt in ganz Europa. Machen Sie mit.
https://eci.ec.europa.eu/055/public/#/screen/home
PPPS:
Und an diesem Sonntag wurde bisher nördlich von Ramallah ein Palästinenser erschossen. Im Süden des Libanon werden (trotz Waffenstillstand) Luftangriffe geflogen. Die Siedler dringen mit Schutz in die Al-Aqsa Moschee ein. Ein Bärtiger mit Bauch und Wintermütze tut barfuss auf dem Gelände der Moschee umhergehen. Den Palästinensern verbietet man laut zu beten. Dieses Verbot wurde mehr als dreissig mal rausgegeben.
Es wurden in Atara, nordwestlich von Ramallah, zwei Kraftfahrzeuge angezündet und rassistische Rede gesprüht. Es wird Gaza-City bombardiert. Die Wohngebäude werden mit Explosionen zerstört. Wenn Sie dieses Jahr in Urlaub fahren werden Sie sich evtl. an den Film „Man spricht deutsh“ erinnern wenn Sie im Meer sind und die Fäkalien aus Gaza herumschwimmen sehen.
Nicht alle, aber so rund 90% aller Menschen wären durch KI sofort ersetzbar
Kriegt die KI einen Nagel in die Wand?
Interessiert einen KI-Entwickler (oder denjenigen, der ihn bezahlt) ob Sie einen Nagel in der Wand brauchen?
Ob Sie überhaupt eine Wand haben oder unter einer Brücke hausen?
Trommelwirbel….
nö!
Schon eine einfache Datenbankanwendung konnte schneller Telefonnummern heraussuchen, als Menschen dies jemals konnten. Was soll also dieser KI Vergleich mit 100.000 Probanden bringen?
Die KI wird niemals den Sinn begreifen von dem was sie da produziert.
Wie schneidet die KI denn beim analogen miteinander Menscheln ab?
Vielleicht sollten wir wieder mehr direkt und miteinander in Kontakt treten anstatt über den Pc zu kommunizieren und digital erzeugten Trugbildern nachzulaufen. Der Sinn des Lebens ist jedenfalls mehr als nur 1 oder 0.
Das ist lustig in einem Forum zu erwähnen, wo 95% (oder mehr) der aktiven Teilnehmer keinen Klarnamen benutzen.
Bei dem „Gangsta-Slang“ und der damit verbunden Begriffsknappheit in der Alltagssprache vieler. vor allem junger Menschen, wundert mich das gar nicht. Man lernt Sprache viel beim Lesen – und da kommts eben drauf an,, was man so liest. „Früher“ waren meist Bücher, die von Haus aus eine „gehobenere“ Sprache verwandten. Heute lesen die Kids meist Internet, Chats, Kurznachrichten…. kochen damit im eigenen Saft, wenn man so will.
Da gab es doch diesen schönen Spruch: Wenn zwei Esel einander unterrichten, wird keiner ein Doktor.
Wisst ihr, Leute, ich bin froh, dass ich bereits in der letzten Phase meines Lebens bin. Die KI mag intelligenter und kreativer als ich sein, doch sie wird nie das schaffen, was ich kann. Nie. Und das macht micht stolz.
Erstens: Glückwunsch.
Zweitens: Das wissen wir jetzt, und nun?
Drittens: Pfeif auf Euch, früher, jetzt und morgen sowieso?
Mein Epilog: »Stolz« ist nur im eigenen Rückspiegel beeindruckend.
Die Kids werden selbst herausfinden müssen was Intelligenz ist und was nicht, offenbar sind die Erwachsenen nicht fähig das zu unterscheiden und ihnen zu erklären, halten einen mit Label-System verbundenen Algorithmus für das Gleiche was in ihrem Hirn abgeht. Tja.
Alles so wie immer: Einige Kids werden etwas herausfinden und die anderen an der Nase herum führen. Und auch sie werden weiter lügen, dass „das alles für alle gut ist“ – diese Lüge haben sie von allen Erwachsenen gelernt.
@Elberadler @Trux @Gunther @Torquemada
Sorry, dass ich Ihre Posts missbraucht habe, um mal zu schauen, wie schnell ich denn so bin mit meiner »sprachlichen Kreativität« …
Nichts für ungut, kommt nicht wieder vor.
Bei aller „sprachlichen Kreativität“.
Es macht keinen Sinn einer KI zu verzeihen, selbst dann, wenn sie sich entschuldigen sollte.
Der El-G Bot hat beim Score: „sprachliche Kreativität“ 73 Punkte erreicht.
Freu dich! 😉
Ui, 73 Punkte?
Ich will mein Geld zurück und der Programmierer bekommt ein’s auf’s Maul!
Quatsch 🙂
Danke, auch für Ihren Humor!
Ziemlich beeindruckend !
Funktionieren tut das aber so;
Da man die „Intelligenz“ der Maschine nicht auf das Niveau des Menschen bringt, bringt man das Niveau der Intelligenz des Menschen näher an das der Maschine.
Ich befürchte, Sie liegen vollkommen richtig.
Ich denke es kommt auf die Definition von „Kreativität“ an. Die gestellten Aufgaben ermöglichen meines Erachtens alle auch „Synthese-Lösungen“, bei denen vorhandenes Wissen auch einfach nach bestimmten Kriterien neu zusammengestellt werden kann. Wie schon richtig angemerkt, ist die semantische Distanz von Wörtern auch eine ziemlich „statistische“ Aufgabe. Haikus haben ebenfalls eine solche Eigenschaft und auch die „Flash Fiction“ erfordert nicht unbedingt das, was ich persönlich unter Kreativität verstehe:
Wenn ich Millionen von Geschichten auf Abruf zur Verfügung habe und ein handwerkliches Regelwerk, wie eine gute Geschichte strukturiert ist, dann kann ich auch ohne „Kreativität“ neue Geschichten am Fließband neu zusammenstellen (diverse Drehbuchautoren scheinen da sehr gut drin zu sein, wenn man sich so manche Filme anschaut). Das sind meiner Meinung nach alles Aufgaben, bei einen KI dem Menschen gegenüber einen unfairen Vorteil hat, da sie jederzeit auf Gebirge von Wissen direkt zugreifen kann.
Für mich ist Kreativität allerdings nicht das neu Zusammenwürfeln von Vorhandenem, sondern der Anteil der kreativen Aufgabe, der eine völlig neue Idee ist, zu der es keine Entsprechung im vorhandenen Wissensschatz gibt. Das muss nicht Unbedingt etwas noch nie Dagewesenes sein (manchmal kommen Menschen auch unabhängig voneinander auf dieselbe neue Idee), aber sobald es neu geschaffen wurde (d.h. im Wissensspeicher des Individuums nicht in dieser oder einer sehr ähnlichen Form vorhanden), ist es meiner Meinung nach „kreativ“.
Ich gehe jede Wette ein, dass all die Produktionen der KIs bei diesem Test in der einen oder anderen Form auf solches Vorwissen zurückgegriffen haben. Meine persönliche Erfahrung, selbst mit aktuellsten KIs (auch in extrem rechenintensiven „deep thinking“ Modi) ist, dass sie eben genau das machen. Das erkenne ich u.a. allem daran, dass wenn sie mit einer völlig neuen „outside of the box“-Lösung konfrontiert werden, deren Ansatz nicht Teil ihrer Trainingsdaten ist, sie damit oft völlig überfordert sind und die Lösung erst einmal als „falsch“ ansehen, bis man ihnen dann Schritt für Schritt erklärt hat, wie sie funktioniert.
Ich diskutiere mit KIs z.B. häufig ungewöhnliche Lösungen aus der Lowlevel-Programmierung. Das ist Code, den man für gewöhnlich fast nur tief in Betriebssystem-Kernen findet. Dazu gibt es nur extrem wenige Trainingsdaten in freier Wildbahn. Da machen die KIs durch die Bank keine gute Figur. Das ist halt nichts, was bereits millionenfach im Internet ausführlich diskutiert wurde. Sowas wurde in Betriebssystem-Code meist nur einmal gelöst und dann nie wieder angefasst. Die KIs kennen da oft nur ein paar Standard-Ansätze.
Kurz: In der Form „Kreativität“, die vorhandenes „neu kombiniert“ sind KIs denke ich gut. Völlig neues schaffen können sie jedoch (noch) nicht.
Was mich wirklich beeindrucken würde: Eine KI die nur mit „Beobachtungen“ („Messdaten“) gefüttert wird, nicht jedoch mit Schlussfolgerungen und Theorien. Wenn die sich selbstständig die „Existenz von Einkommensteuer und Reispudding“ (Douglas Adams) erschließen kann und sogar ihre eigene Variante der Relativitätstheorie auf die Beine stellt, müssen wir uns glaube ich wirklich warm anziehen. Bis dahin gibt es glaube ich nur Konkurrenz bei solchen eher „mechanischen“ Kreativaufgaben.
Diese Leute hier lassen ein LLM auf Erdos Probleme los ( Sammlung ungelöster mathematischer Vermutungen von Erdos Team) und andere Probleme los:
https://mehmetmars7.github.io/Erdosproblems-llm-hunter/index.html
und haben es dabei geschafft, einen Teil davon zu lösen.
Ich hab dazu keine große Meinung, und mir das auch nicht im Detail angeschaut, allein schon weil ich dazu die Probleme verstehen müsste, aber ich vermute dass neben dem psychologischem Aspekt ( reden, um zu verstehen was man sagt) das ein Hinweis darauf ist dass (moderne?) (Fach-?) Sprache relativ gut bestimmte Aspekte ( logische und andere) abbildet, und deswegen spezifische LLMs durchaus in der Lage sind spezifische Problem zu lösen.
Man sollte eigentlich viel mehr forschen und nachdenken, was für Strukturen sich im NN ausbilden und was damit für symbolische Operationen möglich sind.
Eigentlich *die* Aufgabe für „Geisteswissenschaftler“. Wenn es solche gäbe.
Ich sach ja, die Leute finden ja heute schon nicht mehr ohne Navi nach Hause!
Kurze Antwort: Nein.