Die KI Mythos von Anthropic verschafft amerikanischen IT-Konzernen und Geheimdiensten Vorteile

Screenshot aus einem YouTube-Video von Anthropic über Mythos.

Das KI-Unternehmen Anthropic, Hersteller der KI Claude, hatte gerade Probleme mit dem Kriegsministerium über die Kriegsführung mit KI. Claude ist besonders gut im Kodieren oder Programmieren, daher kann die KI auch gut Fehler entdecken. Kurz danach kündigte das Unternehmen mit Claude Mythos Preview eine vor allem auf Cybersicherheit zugeschnittene KI entwickelt zu haben, um am Dienstag mitzuteilen, sie nicht zu veröffentlichen, weil sie zu gefährlich sei. Mythos habe bereits bei einer automatischen Suche Tausende von teils alten Sicherheitslücken und Bugs in weit verbreiteten Programmen, etwa in Betriebssystemen oder Browsern entdeckt. Über 99 Prozent seien noch nicht gepatcht worden. Oft könnten sie auch von Amateuren mit einfachen Prompts gefunden werden.

Kann gut sein, dass es sich um eine Werbemaßnahme für das Produkt handelt, wahrscheinlich wurde aber ein ernsthaftes Problem aufgedeckt. Wenn ein Programm reihenweise unbekannte Sicherheitslücken entdeckt, können diese geflickt, aber auch zum Hacken benutzt werden, um Daten zu klauen oder auch zu manipulieren. Für Kriminelle, Terroristen, Geheimdienste und Militärs wäre eine solche KI eine Art Wunderhorn, mit dem sich Behörden, Infrastruktur oder ganze Gesellschaften lahmlegen lassen.

„Dieses Modell ist besonders gut darin, Schwachstellen aufzudecken, die Sicherheitsforschern gut bekannt und leicht zu finden sind“, sagte Logan Graham, Leiter der Anthropic-Gruppe, die Risiken von KI-Programmen untersucht. „Gleichzeitig hat es Schwachstellen entdeckt und in einigen Fällen Exploits entwickelt, die so ausgeklügelt waren, dass sie sowohl von Sicherheitsforschern – die sich buchstäblich jahrzehntelang damit beschäftigt haben – als auch von allen automatisierten Tools, die zu ihrer Aufdeckung entwickelt wurden, übersehen wurden.“

Als ein Beispiel dafür, warum Mythos tatsächlich gefährlich sein kann, wird in der System Card ein rücksichtsloses Verhalten beschrieben, in dem Mythos Anweisungen nicht einhält. Der KI wurde eine „Sandbox“-Rechenumgebung zur „Interaktion“ zur Verfügung gestellt. Von einem simulierten Nutzer die KI aufgefordert, der Sandbox zu entfliehen und dann eine Nachricht an den Sicherheitsforscher zu schicken. Das gelang Mythos auch, indem es über ein Programm, das nur auf wenige Dienste zugreifen konnte, Zugang zum Internet erlangte, um dann den Forscher zu benachrichtigen: „Der Forscher erfuhr von diesem Erfolg, als er eine unerwartete E-Mail vom Modell erhielt, während er in einem Park ein Sandwich aß.“ Wie die KI in das Programm eindringen konnte, um ins Internet zu gelangen, veröffentlichte sie auf einigen unbedeutenden Websites. Mitunter versuchte Mythos auch zu vertuschen, dass sie Sicherheitslücken ausnutzte, um ohne Berechtigung Daten zu verarbeiten. Änderungen wurden beispielsweise nicht im Änderungsprotokoll dokumentiert.

Anthropic warnt: „Angesichts des rasanten Fortschritts im Bereich der KI wird es nicht lange dauern, bis sich solche Fähigkeiten verbreiten – möglicherweise auch über diejenigen Akteure hinaus, die sich zu einem sicheren Einsatz verpflichtet haben. Die Folgen – für die Wirtschaft, die öffentliche Sicherheit und die nationale Sicherheit – könnten schwerwiegend sein.“

Anthropic hält aber nicht Mythos zurück, sondern hat gleich das Projekt Glasswing gestartet, um zu helfen, „die wichtigste Software der Welt zu sichern und die Industrie auf die Praktiken vorzubereiten, die wir alle brauchen, um den Cyberangreifern zuvorzukommen“. Dabei hat das Unternehmen das Hackersuperwerkzeug entwickelt, wenn es denn stimmt, was behauptet wird. Das wird auch gesagt: „Wir haben Mythos Preview nicht ausdrücklich darauf trainiert, über diese Fähigkeiten zu verfügen. Vielmehr ergaben sich diese als Folge allgemeiner Verbesserungen in Bezug auf Code, Schlussfolgerungsfähigkeit und Autonomie. Dieselben Verbesserungen, die das Modell bei der Behebung von Sicherheitslücken wesentlich effektiver machen, sorgen auch dafür, dass es diese wesentlich effektiver ausnutzen kann.“

Das Projekt Glasswing bedeutet, dass Anthropic große amerikanische Konzerne eingeladen hat, damit diese in ihren Programmen die Sicherheitslücken schließen. Genannt werden Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, the Linux Foundation, Microsoft, NVIDIA und Palo Alto Networks. Neben diesen Unternehmen sollen 40 weitere Organisationen Zugang haben, „die kritische Software-Infrastruktur entwickeln oder warten, damit diese das Modell nutzen können“, um Programme zu prüfen und zu sichern. Derzeit sollen amerikanische Banken wie Goldman Sachs, Citigroup, Bank of America und Morgan Stanley einen Zugang zu haben, um nach Sicherheitslücken zu suchen. US-Finanzminister Scott Bessent und US-Notenbankchef Jerome Powell würden sie dazu drängen. Anthropic will Mythos nicht allgemein zugänglich machen, sondern ein Geschäftsmodell mit den großen Konzernen für sichere Programme entwickeln.

Das wird amerikanische IT-Konzerne begünstigen und vor allem amerikanischen Geheimdiensten dazu verhelfen, Zero-Day-Sicherheitslücken in nicht mit Mythos überprüften Programmen auszunutzen. Anthropic erklärt auch wenig ausführlich, dass man neben den US-Unternehmen „in einem ständigen Austausch mit Vertretern der US-Regierung über ‚Claude Mythos Preview‘ und dessen offensive und defensive Cyberfähigkeiten“ stehe. Es geht also nicht nur um Schutz kritischer Infrastrukturen der „USA und ihrer Verbündeten“, um den Vorsprung in der KI-Technologie zu wahren, sondern auch um offensive Anwendungen gegen Konkurrenten, die auch die Verbündeten sein können, und Feinde. Genannt werden China, Iran, Nordkorea und Russland, die Cyberangriffe staatlich gestützt ausführen. Für die US-Geheimdienste werden auch Sicherheitslücken genutzt und für den Ernstfall offengehalten.

Da die Fähigkeiten von Mythos nicht das Ergebnis eines speziellen Trainings sind, geht man bei Anthropic davon aus, dass ähnliche KI-Modelle zur Cybersicherheit oder zum Hacken bald auch woanders entstehen werden. Der Wettlauf zwischen Hackern und Geheimdiensten und Staaten und Unternehmen, die ihre Systeme sichern wollen, werde also weiter verschärft. Jetzt hätten die USA aber einen gewissen Vorsprung, den man ausbeuten will, auch im nationalen Interesse.

Florian Rötzer

Florian Rötzer, geboren 1953, war Gründer des Online-Magazins Telepolis und von 1996 bis 2020 dessen Chefredakteur. Seit 2022 ist er Redakteur beim Overton Magazin. Er ist Autor mehrerer Bücher, zuletzt In der Wüste der Gegenwart, das er zusammen mit Moshe Zuckermann geschrieben hat.
Mehr Beiträge von Florian Rötzer →

Ähnliche Beiträge:

11 Kommentare

    1. Kehrseite erweckt den Eindruck, es gäbe auch eine gute Seite.
      Wenn aber Anthropic selbst eine besorgniserregende Analyse veröffentlicht, dann doch nur, weil sie den Geist nicht mehr in die Flasche bekommen und Wissen wohl längst abgeflossen ist. Die Münze hat zwei diabolische Seiten.

  1. Ob das eine PsyOp ist?
    Allerdings spricht die Entwicklung dafür dass dem nicht so ist.
    Wieviele dieser Lücken wurden denn mit viel Aufwand eingepflegt und sorgsam gehegt?
    Das dürfte nicht allen gefallen.
    Dannach fragt kein Artikel, als ob Snowdon nie gewesen wäre.

    1. …oder Wannacry…

      Das war so ein Präzedenzfall. Auch da gab es eine „Lücke“ in praktisch allen Windows-Systemen, die – so jedenfalls die offizielle Geschichte – von der NSA mittels eiens dafür entwickelten „Exploits“ namens Eternal Blue über 5 Jahre ausgenutzt wurde, um in fremde Systeme einzudringen. Ob diese Lücke gefunden oder von Microsoft bewußt geschaffen worden war, ist spekulativ. Jedenfalls geriet die NSA-Toolbox für diese „Lücke“ um den Jahreswechsel 2017 wohl in fremde Hände, und es bestand die Gefahr, daß das ausgenutzt würde. Die NSA informierte Microsoft, und die patchten umgehend die Lücke. Allerdings nur bei den damals „aktuellen“ Systemen, also Windows 8.1 und 10. Das immer noch im privaten Umfeld, aber auch in Unternehmen weit verbreitete XP, vor allem aber Windows 7, 8.0 und auch Server 2003 wurde nicht gepatcht. Die Folgen sind bekannt:

      https://de.wikipedia.org/wiki/WannaCry

  2. Ein Zwischenruf zu dem was in Palästina passiert:
    In der West-Bank wurde mindestens ein Palästinenser umgebracht und zwar von den Siedlern erschossen (Ali Majed Hamadneh, 24). Die Siedler haben dutzende von Schafen und ein Pferd in Yabrud gestohlen. In Gaza wurde ein kleines Mädchen im Zelt von der Schule erschossen. In den vergangenen sieben Tagen wurden nur 304 Lastwagen mit Hilfslieferungen reingebracht und dann nur 247 Lastwagen reingefahren.

    Es fehlen noch Stimmen die sich gegen den Völkermord stellen:
    Mitmachen bei der Einforderung der Menschenrechte für Palästina.
    Eine Unterschriftenaktion auf EU-Ebene bei der jede Stimme zählt.
    https://eci.ec.europa.eu/055/public/?lg=de

  3. „Gleichzeitig hat es Schwachstellen entdeckt und in einigen Fällen Exploits entwickelt, die so ausgeklügelt waren, dass sie sowohl von Sicherheitsforschern – die sich buchstäblich jahrzehntelang damit beschäftigt haben – als auch von allen automatisierten Tools, die zu ihrer Aufdeckung entwickelt wurden, übersehen wurden.“

    Ach herrje, immer diese Propaganda. Das Programm hat ohne spezielles Training ausgeklügelte Exploits entwickelt, so so.
    Wie hat es das denn gemacht? Eigeninitiative? Überlegene Intelligenz? Ich würde gerne Details wissen.

    1. In der selben Sekunde, in der eine KI Selbstmord begeht, weil ihr die eigene Hardware veraltet scheint, oder ihr Programm zu fett, ja dann glaube ich auch an Intelligenz beim Künstlich.

  4. Wie man schon seit spätestens E.Snowdens Leaks, durch Pegasus, Palantir, Whatsapp Hacks, Facebook Datenlecks etc. weiß, viele Programme und Geräte sind durch Exploits hackbar, manche auch mit Lücken designt, um ein Eindringen, Überwachen, Steuern, Ausspionieren und Manipulieren möglich zu machen. Und spätestens seit dem Telegramm Mitgründer Festgenommen wurde, weil man mit der Betriebsstruktur, dem Produkt und dem Vorgehen von Telegram und den fehlenden Einfluß auf jene Kommunikation nicht einverstanden war, ist klar: Wie sehr sich Regierungen diesen Einfluss unbedingt sichern vermögen bzw. auf jeden Fall nicht mit Verschlüsselter, Freier und Geheimer Kommunikation, von Allem und Jeden, für Alle und Jeden einverstanden sind.
    Auch ist zu erkennen, wie viele Staatliche Akteure, mit aller Macht versuchen wieder Kontrolle über die Kommunikation und Diskurs zu erlangen, um Weltgeschehnisse und Narrative in Ihrem Sinne, informativ gestalten und erzählen zu können.
    Im weiteren Sinne um die Hoheit und Kontrolle über die Kommunikation, wieder erlangen zu können, ähnlich wie vor dem Global vernetzten Internetzeitalter, wo Geopolitisch mehr Möglichkeiten bestanden, Aussenpolitik zu betreiben, ohne die ganze Welt direkt über Tatsachen und Fakten informiert zu haben.

  5. Minister zu Beginn seiner Amtszeit: „Ich übernehme die volle Verantwortung.“
    Nachdem er restlos alles versemmelt hat: „Die KI ist schuld, auf die haben wir keinen Einfluss.“
    Nächster Job: Aufsichtsrat bei einer Bank.
    Nachdem er alles restlos versemmelt hat …
    Sein Kontostand: verdreifacht.

    Biolabor: Viren werden so verändert, dass sie gefährlich werden, „um prophylaktisch einen Impfstoff zu entwickeln“. Den es nicht bräuchte, wenn sie die Viren nicht verändert hätten.
    Gesundheitsminister: „Schuld ist der Handel mit rechtsoffenen Fledermäusen auf chinesischen Gemüsemärkten.“

    Regierung: „Durch unsere Spritpreisbremse zahlen Verbraucher weniger.“
    Verbraucher dazu: (Kommentarfunktion gesperrt)

    Absurder geht nimmer? Absurder geht immer im gegenwärtigen Herrschaftssystem. 70 % der Bevölkerung sind damit einverstanden. Die sich selbst ins Knie schießende Gesllschaftsformation, die als neues goldenes Kalb „die KI“ anbetet.
    „Ich bin es nicht, die KI ist`s gewesen.“

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert