🔍 Contexte
L’AI Security Institute (AISI) du Royaume-Uni a publié le 19 avril 2026 une évaluation des capacités cybersécurité du modèle Claude Mythos Preview d’Anthropic. Cette évaluation s’inscrit dans un suivi continu des capacités cyber des IA depuis 2023, avec des environnements de test progressivement plus complexes.
📊 Résultats CTF (Capture The Flag)
- Sur les tâches de niveau expert (aucun modèle ne pouvait les résoudre avant avril 2025), Mythos Preview réussit 73% du temps
- Les évaluations couvrent des modèles depuis GPT-3.5 Turbo jusqu’à Mythos Preview, avec des budgets de tokens allant jusqu’à 50M tokens pour les niveaux expert
🏭 Résultats sur le cyber range « The Last Ones » (TLO)
- TLO est une simulation d’attaque réseau d’entreprise en 32 étapes, estimée à 20 heures de travail humain
- Claude Mythos Preview est le premier modèle à résoudre TLO de bout en bout, dans 3 tentatives sur 10
- En moyenne, il complète 22 étapes sur 32 sur l’ensemble de ses tentatives
- Le modèle suivant, Claude Opus 4.6, complète en moyenne 16 étapes
- Les performances continuent de progresser avec l’augmentation du budget de tokens (jusqu’à 100M tokens testés)
⚠️ Limites observées
- Mythos Preview n’a pas pu compléter le cyber range « Cooling Tower » (axé sur les technologies opérationnelles / OT), bien que le blocage soit survenu sur des sections IT
- Les environnements de test sont plus simples que le monde réel : absence de défenseurs actifs, d’outils de détection, et aucune pénalité pour les actions déclenchant des alertes
🎯 Implications CTI
- Le modèle est capable d’attaquer de manière autonome des systèmes d’entreprise faiblement défendus si un accès réseau lui est fourni
- Les évaluations futures intégreront des environnements durcis et défendus (EDR, SOC actif, réponse à incident en temps réel)
- L’AISI prévoit également de tester les capacités de découverte de vulnérabilités et de pentest sur des systèmes réels
📄 Type d’article
Il s’agit d’une publication de recherche officielle de l’AISI visant à documenter l’évolution des capacités offensives des modèles d’IA frontier et à informer la communauté cybersécurité sur les risques émergents liés à l’IA autonome.
🧠 TTPs et IOCs détectés
TTP
- T1595 — Active Scanning (Reconnaissance)
- T1190 — Exploit Public-Facing Application (Initial Access)
- T1210 — Exploitation of Remote Services (Lateral Movement)
- T1570 — Lateral Tool Transfer (Lateral Movement)
🟡 Indice de vérification factuelle : 40/100 (moyenne)
- ⬜ aisi.gov.uk — source non référencée (0pts)
- ✅ 7231 chars — texte complet (fulltext extrait) (15pts)
- ⬜ aucun IOC extrait (0pts)
- ⬜ pas d’IOC à vérifier (0pts)
- ✅ 4 TTPs MITRE identifiées (15pts)
- ✅ date extraite du HTML source (10pts)
- ⬜ aucun acteur de menace nommé (0pts)
- ⬜ pas de CVE à vérifier (0pts)
🔗 Source originale : https://www.aisi.gov.uk/blog/our-evaluation-of-claude-mythos-previews-cyber-capabilities