Anthropic-läcka avslöjar AI-modell med alarmerande hackningsförmåga

Techjätten Anthropic har av misstag exponerat intern data om en kommande AI-modell, Claude Mythos, som beskrivs som "överlägset den kraftfullaste AI-modell vi någonsin utvecklat" och som väcker allvarliga farhågor om cybersäkerhet.

Läckan kom via ett felkonfigurerat publikt system

Uppgifterna kom i dagen genom en säkerhetsbrist i Anthropics innehållshanteringssystem, CMS, rapporterar Fortune. Systemet lagrade allt webbplatsinnehåll, bland annat blogginlägg, bilder och dokument, i ett centralt datalager som var öppet utan inloggning.

Nära 3 000 opublicerade filer var tillgängliga för vem som helst med teknisk kunskap att hämta dem, enligt Alexandre Pauwels, cybersäkerhetsforskare vid University of Cambridge, som Fortune bad granska materialet. Bland de exponerade filerna fanns ett utkast till ett blogginlägg om Claude Mythos, interna personaluppgifter och detaljer om ett exklusivt vd-evenemang.

– Ett problem med ett av våra externa CMS-verktyg ledde till att utkast till innehåll blev tillgängligt. Det rör sig om mänskliga fel i CMS-konfigurationen, uppger en talesperson för Anthropic i ett uttalande till Fortune.

Företaget betonar att felet inte har något samband med Claude eller andra Anthropic-verktyg.

Modellen beskrivs som "långt före" alla konkurrenter i cyberförmåga

Det läckta utkastet målar upp en oroande bild av vad Claude Mythos kan göra i fel händer. Anthropic beskriver själva modellen som "för närvarande långt före alla andra AI-modeller i cyberfunktioner" och skriver att den "förebådar en kommande våg av modeller som kan utnyttja sårbarheter på sätt som vida överträffar försvararnas förmåga att hänga med."

Modellen uppges kunna driva självständiga AI-agenter som automatiserar intrång, vilket innebär att enskilda aktörer kan genomföra avancerade och storskaliga cyberattacker utan tidigare teknisk expertis, skriver Axios.

Läckan avslöjade också en helt ny modellnivå kallad Capybara, som enligt Mashable placerar sig ovanför Anthropics nuvarande toppnivå Opus och ska bli företagets största och mest avancerade modell.

Anthropic bekräftade läckan och uppgav att Claude Mythos befinner sig i testfasen och är tillgänglig för utvalda kunder med tidig åtkomst. Företaget sa i ett uttalande att modellen innebär ett "prestandaskifte" jämfört med tidigare versioner. Bolaget uppger också att man inför lanseringen av Claude Capybara avser att agera med extra försiktighet och dela resultat från säkerhetstester för att hjälpa cyberförsvarare att förbereda sig.

Anthropic-läcka avslöjar AI-modell med alarmerande hackningsförmåga

Läckan kom via ett felkonfigurerat publikt system

Modellen beskrivs som "långt före" alla konkurrenter i cyberförmåga

Aftonbladets kulturchef kräver att Schibsted river upp OpenAI-avtalet

OkCupid delade tre miljoner bilder med AI-bolag utan användarnas vetskap

Instagram testar betaltjänst som låter användare se händelser anonymt