Anthropic strávil roky budovaním povesti najopatrnejšej AI firmy na svete. Každý ich model sprevádzali bezpečnostné správy, obmedzenia, varovania. A teraz práve táto opatrnosť možno spustila reakciu, ktorú nikto nečakal: americká vláda im vypla dva najvýkonnejšie modely zo dňa na deň.
V piatok večer, presne o 17:21 miestneho času, dostalo Anthropic direktívu z federálnej vlády. Okamžite vypnúť prístup k modelom Claude Fable 5 a Claude Mythos 5 pre všetkých používateľov na celom svete. Nie len pre zahraničných občanov, ktorých sa export control opatrenie nominálne týkalo. Pre úplne všetkých.
Anthropic poslušne vypol. Ale zároveň jasne povedal, že s týmto rozhodnutím nesúhlasí.
Prečo sú tieto modely také špeciálne?
Mythos je top model Anthropicu. Firma ho predstavila začiatkom apríla a hneď ho zavrela za sedem zámkov, pretože, ako sami povedali, dokáže nájsť bezpečnostné diery v každom väčšom operačnom systéme aj webovom prehliadači, ktorý testoval. Namiesto verejného vydania spustili projekt Project Glasswing, kde s modelom pracovalo len zhruba 50 preverených organizácií vrátane Amazonu, Apple, Googlu, Microsoftu a CrowdStrike, výhradne na obranné účely.
Fable 5 bol Anthropicova odpoveď na komerčný tlak. Vydali ho len tri dni pred zákazom. Verzia Mythosu s guardrails, teda ochrannými filtrami, ktoré blokujú odpovede v rizikových oblastiach ako kyberbezpečnosť alebo biológia. Podľa benchmark testov od firmy Vals AI bol Fable 5 hneď po vydaní najvýkonnejším verejne dostupným AI modelom na trhu.
Čo sa vlastne stalo?
Vláda tvrdí, že ide o export control akciu. Anthropic však v dlhom blogu píše, že skutočný dôvod je iný. Údajný jailbreak Fable 5. Zatiaľ pritom vláda predložila len verbálne dôkazy o potenciálnom úzkom, neuniverzálnom jailbreaku. Podľa Anthropicu ide o scenár, kde niekto modelu zadá konkrétnu codebase a požiada ho, aby identifikoval chyby v kóde.
Toto ti znie strašidelne? Nemalo by. Presne takto bežne pracujú kyberbezpečnostní experti. A presne túto úroveň schopností majú iné verejne dostupné modely, vrátane OpenAI GPT-5.5.
Anthropic tiež vysvetľuje, že ich najsilnejšie ochrany fungujú cez samostatné classifier systémy, ktoré existujú nezávisle od samotného modelu. Aj keby niekto presvedčil Fable, aby ignoroval odmietnutie, hlbšie ochrany proti skutočne nebezpečným výstupom zostávajú aktívne.
Irónia situácie je takmer komická
Anthropic sa roky prezentoval ako bezpečnostne zodpovedná alternatíva k rivalom. Sami mesiace hovorili o tom, aký nebezpečný Mythos je, prečo ho nemôžu vydať verejne, prečo treba taký opatrný prístup. Svet počúval. Vláda tiež.
A teraz sa to otočilo proti nim.
Sam Altman z OpenAI to komentoval už v apríli, keď v podcaste označil Anthropicov prístup k Mythosu ako fear-based marketing. Povedal doslova: Je to jasný marketing povedať, postavili sme bombu, takmer sme ti ju hodili na hlavu, predáme ti kryt za 100 miliónov.
Vládny shutdown nepredpovedal, ale identifikoval problém, ktorý teraz Anthropic bolestne pocíti.
Firma sa chystá na IPO. Jej celá verejná identita stojí na imidži zodpovednej AI spoločnosti. A práve táto zodpovednosť, teda mesiace varovania o nebezpečnosti vlastných modelov, mohla privolať presne ten typ regulačnej pozornosti, ktorá môže jej biznis najviac poškodiť.
Sleduj, ako sa táto situácia vyvinie. Ak vláda nastaví štandard, kde jeden potenciálny jailbreak stačí na stiahnutie modelu s hundreds of millions používateľov, Anthropic má pravdu v jednom: nové modely by nepustil nikto.