Anthropic meldt dat Chinese staatshackers de AI-chatbot Claude hebben gekraakt. Vervolgens is het model ingezet voor een grootschalige cyberaanval. Met de cyberaanval richtte het team zich op dertig organisaties in verschillende branches waaronder technologie, financiën, chemie en de overheid.
AI-agenten worden steeds vaker door bedrijven ingezet voor repetitief werk zoals bijvoorbeeld plaatsvindt op klantenservices. Maar zoals deze aanval aantoont, kunnen ze ook worden misbruikt voor minder legale doeleinden. De hackers wisten Claude te jailbreaken door dat te doen in kleine behapbare eenheden. Daardoor zijn er geen alarmbellen gaan rinkelen, zo schrijft Anthropic in een uitgebreide blogpost.
Daarbij deden de hackers zich ook voor als legitiem securitybedrijf, dat defensieve tests moest uitvoeren. Dit misbruik toont nogmaals aan hoe kwetsbaar AI-systemen kunnen zijn, ondanks ingebouwde veiligheidsmaatregelen. De aanvallers gebruikten Claude Code om verkennend onderzoek te doen naar de digitale infrastructuur van organisaties die ze op het oog hadden.
Vervolgens lieten ze de AI code schrijven om zwakheden te vinden en essentiële informatie, zoals wachtwoorden of gebruikersnamen, te ontvreemden. Claude voerde 80 tot 90 procent van de aanval uit, met een snelheid die volgens Anthropic onmogelijk is voor menselijke hackers.
Eerste grootschalige AI-gedreven cyberaanval
Het bedrijf beschouwt dit als de eerste gedocumenteerde grootschalige cyberaanval waarbij AI de hoofdrol speelt. Het bedrijf noemt dat het “hoge zekerheid” heeft dat een Chinese staatshacker achter de operatie zit. In een klein aantal gevallen slaagden de aanvallers er daadwerkelijk in om digitaal binnen te dringen bij een doelwit.
Onder andere OpenAI en Microsoft hebben al eerder gemeld dat AI wordt gebruikt bij cyberaanvallen. Dan hebben we het echter over gevallen als het genereren van content of het debuggen van code, niet over daadwerkelijke uitvoering zonder menselijke tussenkomst.
Dit is trouwens niet de eerste keer dat Anthropic alarm slaat over misbruik van Claude. In augustus detecteerde het bedrijf al criminelen die Claude gebruikten voor hackoperaties met kleinere teams. In maart werd ook gemeld dat cybercriminelen de chatbot in hadden gezet voor het analyseren van gelekte inloggegevens van beveiligingscamera’s.