L'AISI évalue Claude Mythos Preview : capacités offensives autonomes en cybersécurité

🔍 Contexte

L’AI Security Institute (AISI) du Royaume-Uni a publié le 19 avril 2026 une évaluation des capacités cybersécurité du modèle Claude Mythos Preview d’Anthropic. Cette évaluation s’inscrit dans un suivi continu des capacités cyber des IA depuis 2023, avec des environnements de test progressivement plus complexes.

📊 Résultats CTF (Capture The Flag)

Sur les tâches de niveau expert (aucun modèle ne pouvait les résoudre avant avril 2025), Mythos Preview réussit 73% du temps
Les évaluations couvrent des modèles depuis GPT-3.5 Turbo jusqu’à Mythos Preview, avec des budgets de tokens allant jusqu’à 50M tokens pour les niveaux expert

🏭 Résultats sur le cyber range « The Last Ones » (TLO)

TLO est une simulation d’attaque réseau d’entreprise en 32 étapes, estimée à 20 heures de travail humain
Claude Mythos Preview est le premier modèle à résoudre TLO de bout en bout, dans 3 tentatives sur 10
En moyenne, il complète 22 étapes sur 32 sur l’ensemble de ses tentatives
Le modèle suivant, Claude Opus 4.6, complète en moyenne 16 étapes
Les performances continuent de progresser avec l’augmentation du budget de tokens (jusqu’à 100M tokens testés)

⚠️ Limites observées

Mythos Preview n’a pas pu compléter le cyber range « Cooling Tower » (axé sur les technologies opérationnelles / OT), bien que le blocage soit survenu sur des sections IT
Les environnements de test sont plus simples que le monde réel : absence de défenseurs actifs, d’outils de détection, et aucune pénalité pour les actions déclenchant des alertes

🎯 Implications CTI

Le modèle est capable d’attaquer de manière autonome des systèmes d’entreprise faiblement défendus si un accès réseau lui est fourni
Les évaluations futures intégreront des environnements durcis et défendus (EDR, SOC actif, réponse à incident en temps réel)
L’AISI prévoit également de tester les capacités de découverte de vulnérabilités et de pentest sur des systèmes réels

📄 Type d’article

Il s’agit d’une publication de recherche officielle de l’AISI visant à documenter l’évolution des capacités offensives des modèles d’IA frontier et à informer la communauté cybersécurité sur les risques émergents liés à l’IA autonome.

🧠 TTPs et IOCs détectés

TTP

T1595 — Active Scanning (Reconnaissance)
T1190 — Exploit Public-Facing Application (Initial Access)
T1210 — Exploitation of Remote Services (Lateral Movement)
T1570 — Lateral Tool Transfer (Lateral Movement)

🟡 Indice de vérification factuelle : 40/100 (moyenne)

⬜ aisi.gov.uk — source non référencée (0pts)
✅ 7231 chars — texte complet (fulltext extrait) (15pts)
⬜ aucun IOC extrait (0pts)
⬜ pas d’IOC à vérifier (0pts)
✅ 4 TTPs MITRE identifiées (15pts)
✅ date extraite du HTML source (10pts)
⬜ aucun acteur de menace nommé (0pts)
⬜ pas de CVE à vérifier (0pts)

🔗 Source originale : https://www.aisi.gov.uk/blog/our-evaluation-of-claude-mythos-previews-cyber-capabilities

🔍 Contexte#

📊 Résultats CTF (Capture The Flag)#

🏭 Résultats sur le cyber range « The Last Ones » (TLO)#

⚠️ Limites observées#

🎯 Implications CTI#

📄 Type d’article#

🧠 TTPs et IOCs détectés#

TTP#

🟡 Indice de vérification factuelle : 40/100 (moyenne)#