L'AISI évalue Claude Mythos Preview : capacités offensives autonomes en cybersécurité

Sun, 19 Apr 2026 00:00:00 +0000

🔍 Contexte

L’AI Security Institute (AISI) du Royaume-Uni a publié le 19 avril 2026 une évaluation des capacités cybersécurité du modèle Claude Mythos Preview d’Anthropic. Cette évaluation s’inscrit dans un suivi continu des capacités cyber des IA depuis 2023, avec des environnements de test progressivement plus complexes.

📊 Résultats CTF (Capture The Flag)

Sur les tâches de niveau expert (aucun modèle ne pouvait les résoudre avant avril 2025), Mythos Preview réussit 73% du temps
Les évaluations couvrent des modèles depuis GPT-3.5 Turbo jusqu’à Mythos Preview, avec des budgets de tokens allant jusqu’à 50M tokens pour les niveaux expert

🏭 Résultats sur le cyber range « The Last Ones » (TLO)

TLO est une simulation d’attaque réseau d’entreprise en 32 étapes, estimée à 20 heures de travail humain
Claude Mythos Preview est le premier modèle à résoudre TLO de bout en bout, dans 3 tentatives sur 10
En moyenne, il complète 22 étapes sur 32 sur l’ensemble de ses tentatives
Le modèle suivant, Claude Opus 4.6, complète en moyenne 16 étapes
Les performances continuent de progresser avec l’augmentation du budget de tokens (jusqu’à 100M tokens testés)

⚠️ Limites observées

Mythos Preview n’a pas pu compléter le cyber range « Cooling Tower » (axé sur les technologies opérationnelles / OT), bien que le blocage soit survenu sur des sections IT
Les environnements de test sont plus simples que le monde réel : absence de défenseurs actifs, d’outils de détection, et aucune pénalité pour les actions déclenchant des alertes

🎯 Implications CTI

Le modèle est capable d’attaquer de manière autonome des systèmes d’entreprise faiblement défendus si un accès réseau lui est fourni
Les évaluations futures intégreront des environnements durcis et défendus (EDR, SOC actif, réponse à incident en temps réel)
L’AISI prévoit également de tester les capacités de découverte de vulnérabilités et de pentest sur des systèmes réels

📄 Type d’article

Il s’agit d’une publication de recherche officielle de l’AISI visant à documenter l’évolution des capacités offensives des modèles d’IA frontier et à informer la communauté cybersécurité sur les risques émergents liés à l’IA autonome.