En quelques heures seulement, un modèle d’IA d’Anthropic repère des failles dans des systèmes classifiés du gouvernement américain
Un modèle d’intelligence artificielle développé par Anthropic a permis de détecter des failles dans des systèmes informatiques hautement sensibles du gouvernement américain lors d’un exercice de test, a indiqué un responsable américain à l’agence Associated Press.
Ce responsable, qui s’est exprimé sous couvert d’anonymat, a précisé qu’Anthropic s’était associée aux agences de renseignement américaines pour mener ces tests à l’aide de son modèle Mythos.
Selon lui, le système a repéré certaines vulnérabilités en quelques heures seulement, ce qui ne signifie pas pour autant qu’il ait été capable de les exploiter dans ce laps de temps.
Les essais ont été menés dans le cadre d’une initiative d’Anthropic baptisée Project Glasswing, qui rassemble des entreprises technologiques afin de protéger des logiciels critiques contre les conséquences jugées « graves » que Mythos pourrait faire peser sur la sécurité publique, la sécurité nationale et l’économie.
Le sénateur démocrate de Virginie Mark Warner avait évoqué brièvement ces tests lors d’une audition le 11 juin devant la commission bancaire, du logement et des affaires urbaines du Sénat.
« Cet outil a pénétré la quasi-totalité de nos systèmes classifiés, non pas en semaines mais en quelques heures », a-t-il déclaré, en attribuant ces informations au directeur de la National Security Agency (NSA) et du Cyber Command américain, le général Joshua Rudd.
Des tensions croissantes
Malgré cette coopération entre Anthropic et les agences américaines, les tensions se sont accrues entre l’entreprise californienne et l’administration Trump.
Anthropic s’est inquiétée des usages que l’armée américaine pourrait faire de son IA, tandis que l’administration a engagé des démarches pour restreindre l’emploi de certains de ses modèles.
Au début du mois, l’administration a publié une directive enjoignant Anthropic d’empêcher les ressortissants étrangers d’utiliser ses modèles les plus récents, baptisés Fable 5 et Mythos 5.
Anthropic a largement diffusé ce mois-ci Fable, une version limitée du modèle plus avancé Mythos, auquel l’entreprise a réservé un accès très restreint en raison de préoccupations de cybersécurité.
Cette directive est intervenue dix jours après la signature par le président Donald Trump d’un décret établissant un cadre permettant au gouvernement fédéral d’examiner, pendant une période pouvant aller jusqu’à un mois avant leur mise à disposition du public, les risques pour la sécurité nationale posés par les systèmes d’IA les plus avancés.
La participation des concepteurs d’IA resterait volontaire, précise le décret.
Anthropic affirme avoir désactivé ces modèles pour l’ensemble de ses clients afin de se conformer à la directive, tout en estimant que les mesures prises par le gouvernement ne sont pas justifiées par le niveau de risque qu’elle avait signalé.
Opposition du secteur
Plus de 100 experts en cybersécurité et dirigeants d’entreprises, notamment d’Adobe et de Nvidia, ont écrit au gouvernement pour lui demander de lever la directive, en avertissant que cette mesure pourrait davantage profiter aux adversaires des États-Unis qu’elle ne nuirait aux États-Unis eux-mêmes.
Dans leur courrier, les signataires estiment que les modèles Mythos d’Anthropic sont « plutôt performants » pour identifier des failles logicielles et transformer des vulnérabilités en outils offensifs, mais qu’ils ne sont pas les seuls à être performants dans ces tâches.
Beaucoup expliquent utiliser régulièrement d’autres modèles de base et des modèles open source pour réaliser des audits de sécurité et des formations, et jugent dangereux de se priver des meilleures capacités de cyberdéfense « sans bonne raison » à un moment où les adversaires de l’Amérique progressent rapidement.