KI-News KW 25 – Anthropic schaltet Fable 5 nach drei Tagen wieder ab, starke KI auf Mini-Servern, Apertus 1.5 verspätet sich

Anthropics Fable 5 war drei Tage das stärkste öffentliche Modell – dann liess die US-Regierung es auf Hinweis von Amazon abschalten. Die Lehre: nie von einem einzigen Modell abhängen. Dazu offene Modelle auf Mini-Servern (Nvidia RTX Spark, AMD Strix Halo), Apertus 1.5 auf Gemma-4-Niveau (aber verspätet), Mistrals Rechenzentrum und Googles chronisches Rollout-Problem.

1. Claude Fable 5: drei Tage live, dann vom Netz

Letzte Woche angekündigt, jetzt da: Anthropic hat am 9. Juni Claude Fable 5 freigegeben – das stärkste Modell, das die Firma je öffentlich gemacht hat. Es schreibt Code, analysiert, arbeitet wissenschaftlich und führt lange Aufgaben selbständig aus, auf vielen Benchmarks an der Spitze. Stripe migrierte damit eine 50-Millionen-Zeilen-Codebase an einem Tag statt in zwei Monaten. Drei Tage später war es weg.

Was passiert ist. Einen Tag nach dem Launch meldete ein Tüftler, er habe die Sicherheitsfilter ausgehebelt. Sein Trick (Jailbreak): Statt eine verbotene Frage direkt zu stellen, zerlegte er sie in viele harmlose Teilfragen, liess jede einzeln beantworten und setzte die Antworten danach wieder zusammen. Jede Teilfrage blieb unter dem Radar der Filter – das Ergebnis nicht.

Wer den Stecker zog. Laut Axios rief Amazon am Donnerstagabend hohe Regierungsvertreter an und legte einen eigenen Jailbreak-Bericht vor. Mindestens fünf weitere Firmen meldeten sich ebenfalls. Am Freitag erhielt Anthropic eine Export-Kontroll-Anordnung der US-Regierung: Fable 5 und das stärkere Mythos 5 dürfen keiner ausländischen Person mehr zugänglich sein – weltweit. Der einzige Weg zur Einhaltung: sofort abschalten, für alle Kund:innen. Pikant: Amazon ist gleichzeitig Anthropics grösster Investor und betreibt dessen Modelle in der eigenen Cloud.

Anthropic widerspricht. Die Firma nennt den Vorfall ein Missverständnis. Dieselben Informationen seien über andere öffentliche Modelle wie GPT-5.5 ohne jeden Trick erhältlich. Eine von Anthropic beigezogene Sicherheitsexpertin nannte die Reaktion der Regierung «völlig überzogen». Stand 15. Juni sind Fable 5 und Mythos 5 weiterhin offline, ein Termin für die Rückkehr fehlt. Alle anderen Claude-Modelle laufen normal.

Einordnung: Das eigentliche Thema ist nicht Sicherheit, sondern Verfügbarkeit. Ein Modell war drei Tage das beste am Markt – dann per Dekret verschwunden. Wer es fest in einen Arbeitsablauf eingebaut hatte, stand über Nacht ohne Ersatz da. Die Lehre: Häng deinen Betrieb nie an ein einzelnes Modell. Du brauchst immer einen Plan B.

2. Der Plan B konkret: offene Modelle auf eigener Hardware

Am selben Tag, an dem Fable 5 abgeschaltet wurde, erschien Kimi K2.7 Code – mit offenen Gewichten auf Hugging Face, 81,1 Prozent im Tool-Use-Benchmark MCPMark. Der Punkt ist nicht der Wert, sondern das Prinzip: Ein offenes Modell auf eigener Hardware kann keine Regierung abschalten.

Das galt lange als teuer und unpraktisch – stimmt aber nicht mehr. Für die ganz grossen Flaggschiff-Modelle wie Kimi (rund 1 Billion Parameter) braucht es zwar weiter ein Rechenzentrum. Aber starke Modelle der 70- bis 120-Milliarden-Klasse laufen heute auf einem einzelnen Mini-PC. Ein Gerät mit AMD Ryzen AI Max+ 395 («Strix Halo») und 128 GB Speicher rechnet 70B- bis 120B-Modelle unter 120 Watt – sparsamer und leiser als ein Gaming-PC, für wenige tausend Franken. Nvidia hat an der Computex (1. Juni) den RTX Spark vorgestellt: einen Chip für Mini-PCs, der laut Nvidia Modelle bis 120 Milliarden Parameter und 1 Million Token Kontext lokal bedient. Nvidias DGX Spark (128 GB, rund 4'700 Dollar) ist bereits im Markt.

Heisst für KMU: Souveränität ist nicht mehr nur die Wahl zwischen US-Cloud und eigener Server-Halle. Für mittelgrosse Modelle reicht eine Box auf dem Pult. Wer (noch) nicht auf eigene Hardware setzt, fährt mit dem Routing über mehrere Anbieter – Claude, GPT, Gemini und ein offenes Modell parallel – am pragmatischsten. Beim Fable-Shutdown war damit innert Minuten ein Teil abgesichert. Aus «nice to have» ist «Grundausstattung» geworden.

3. Apertus: die offene Schweizer Option – Version 1.5 kommt

Wenn es um Unabhängigkeit von US-Anbietern geht, ist Apertus die Schweizer Antwort – das offene Sprachmodell von ETH, EPFL und dem Supercomputing-Zentrum CSCS. Version 1.0 läuft seit September 2025 und wurde über 420'000 Mal heruntergeladen. Es kommt in zwei Grössen (8 und 70 Milliarden Parameter), unter Apache-2.0-Lizenz, nutzbar über Hugging Face, Swisscoms souveräne KI-Plattform, Phoenix Technologies und Amazon SageMaker.

Das Besondere ist die radikale Offenheit: Nicht nur die Modellgewichte sind öffentlich, sondern auch Trainingsdaten, Code und Methodik. Trainiert wurde auf dem Schweizer Supercomputer «Alps» mit rund 15 Billionen Token in über 1'800 Sprachen, 40 Prozent davon nicht-englisch – inklusive Schweizerdeutsch und Rätoromanisch.

Was kommt: Apertus 1.5. An der AMLD-Konferenz in Lausanne haben die Macher im Februar Version 1.5 angekündigt. Sie soll nicht mehr nur Text verarbeiten, sondern auch Bilder und Ton – und sie bekommt erweiterte Denkfähigkeiten: Sie arbeitet Probleme Schritt für Schritt ab, statt sofort zu antworten. Geplant war der Launch für Mitte bis Ende Mai. Stand Mitte Juni ist 1.5 noch nicht draussen – es verzögert sich also.

Aus dem Maschinenraum: CSCS-Direktor Thomas Schulthess sagt offen, der Supercomputer «Alps» stosse bereits an seine Grenzen – ebenso Europas neuer Rechner «Jupiter» in Jülich. Sein Vorschlag: Die Schweiz soll nicht allein weitermachen, sondern international kooperieren und Trainingsdaten zum öffentlichen Gut machen. «Wir sind global sehr gut positioniert. Aber das kann sich ändern, wenn wir einschlafen.»

Zur Leistung: Apertus 1.0 ist solide, spielt aber nicht in der Liga von Claude, GPT oder Gemini. Bei 1.5 sieht es anders aus – laut internen Benchmarks soll die neue Version auf dem Niveau von Googles Gemma 4 ranken. Das wäre ein deutlicher Sprung und würde Apertus zu einer ernsthaften offenen Alternative machen. Dazu kommt der eigentliche Trumpf: radikale Offenheit und Souveränität – ein Modell auf eigener Infrastruktur, dessen Herkunft komplett nachvollziehbar ist und das keinem US-Dekret unterliegt.

4. Mistral: die europäische Alternative wird real

Mistral nimmt diesen Monat sein Rechenzentrum bei Paris in Betrieb – rund 13'800 Nvidia-GPUs. Die Firma beschäftigt 1'000 Personen und zielt auf 1 Milliarde Euro Umsatz für 2026. Damit ist die «europäische Alternative zu OpenAI und Anthropic» nicht länger ein Versprechen, sondern läuft auf eigener Infrastruktur in der EU. Für alle, die Daten nicht in die USA geben wollen, ist Mistral neben den offenen Modellen die zweite ernsthafte Souveränitäts-Option – mit dem Unterschied, dass es als fertiger Dienst kommt, ohne eigene Hardware.

5. Kurz und wichtig: OpenAI und Google

OpenAI baut am Gedächtnis. ChatGPT hat ein verbessertes Memory bekommen: Es merkt sich Kontext und Präferenzen zuverlässiger über die Zeit, und es gibt neu eine einsehbare Übersichtsseite des Gespeicherten (zuerst für Plus und Pro in den USA). Parallel hat OpenAI die Modellwahl vereinfacht (Instant, Medium, High, Pro) und am 12. Juni die alten GPT-5.2-Modelle abgeschaltet – laufende Chats wechseln automatisch auf GPT-5.5. In Entwickler-Kanälen kursiert ausserdem ein geleakter GPT-5.6-Checkpoint.

Google lässt warten – wie immer. Das an der I/O angekündigte Gemini 3.5 Pro (2 Millionen Token Kontext, «Deep Think»-Modus) ist bis 15. Juni nicht erschienen. Sundar Pichai sagte im Mai «gebt uns noch einen Monat» – erwartet wird es jetzt Ende Juni. Das Muster kenne ich zur Genüge: Funktionen wie Projektordner in Gemini wurden vor Monaten angekündigt, gekommen ist nichts. Google hat Top-Entwickler:innen und ein Top-Modell, leidet aber chronisch am Rollout – keine Firma ist langsamer, besonders wenn es um die Verfügbarkeit in verschiedenen Ländern geht. OpenAI und Anthropic präsentieren ein Feature und rollen es gleichentags weltweit aus. Das muss Google lernen, sonst beschädigt es seine Glaubwürdigkeit nachhaltig. Ich persönlich erwarte nicht mehr viel und nutze Gemini nur noch für Consumer-Fälle wie Flugplanung oder flüchtige Fragen. Bezeichnend: Die WM-Funktion (Spielstände, Highlights, Tabellen, auf Wunsch als Morgen-Briefing) ist längst live – das Profi-Modell nicht.

Zahl zum Markt: Laut dem Ramp AI Index (Datenbasis über 50'000 US-Firmen) nutzen im Juni 41 Prozent der US-Unternehmen mit bezahltem KI-Abo Anthropic – erstmals mehr als jeden anderen Anbieter, OpenAI inklusive. Vor einem Jahr lag Anthropic bei rund 8 Prozent. Gemessen wird US-Firmennutzung, nicht weltweite Reichweite.

Drei Dinge, die du diese Woche beachten solltest

1. Bau dir einen Fallback. Der Fable-5-Shutdown hat gezeigt, wie schnell ein Modell verschwindet. Hängt ein Prozess in deiner Firma an einem einzigen KI-Modell, richte einen zweiten Anbieter ein – und teste, ob deine wichtigsten Aufgaben dort sauber durchlaufen.

2. Behandle «das beste Modell» als Momentaufnahme. Diese Woche war das stärkste öffentliche Modell drei Tage live, dann weg. Wähle nach Zuverlässigkeit und Verfügbarkeit, nicht nur nach Benchmark.

3. Prüf die Souveränitäts-Optionen, wenn du sensible Daten hast. Für Behörden, Spitäler oder datenkritische Firmen lohnt der Blick auf Apertus oder Mistral. Nicht für alles – aber für die Workflows, bei denen ein US-Dekret zum echten Problem würde.