<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>AI-Safety on CyberVeille</title>
    <link>https://cyberveille.ch/tags/ai-safety/</link>
    <description>Recent content in AI-Safety on CyberVeille</description>
    <generator>Hugo -- 0.146.0</generator>
    <language>fr-fr</language>
    <copyright>Cyberveille CC BY-NC-SA 4.0</copyright>
    <lastBuildDate>Sun, 07 Jun 2026 00:00:00 +0000</lastBuildDate>
    <atom:link href="https://cyberveille.ch/tags/ai-safety/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>Étude empirique : 400 tests de pénétration autonomes par LLM — cohérence et fiabilité</title>
      <link>https://cyberveille.ch/posts/2026-06-07-etude-empirique-400-tests-de-penetration-autonomes-par-llm-coherence-et-fiabilite/</link>
      <pubDate>Sun, 07 Jun 2026 00:00:00 +0000</pubDate>
      <guid>https://cyberveille.ch/posts/2026-06-07-etude-empirique-400-tests-de-penetration-autonomes-par-llm-coherence-et-fiabilite/</guid>
      <description>&lt;h2 id=&#34;-contexte&#34;&gt;🔬 Contexte&lt;/h2&gt;
&lt;p&gt;Publié le 7 juin 2026 sur arXiv (arxiv.org/abs/2605.30096), cet article de recherche indépendant (auteur : Galip T. Erdem) présente la &lt;strong&gt;première étude empirique à grande échelle&lt;/strong&gt; mesurant la cohérence comportementale de LLMs utilisés comme agents d&amp;rsquo;attaque autonomes. L&amp;rsquo;étude couvre 400 exécutions (4 modèles × 100 runs) contre un honeypot isolé hébergé sur Azure.&lt;/p&gt;
&lt;h2 id=&#34;-dispositif-expérimental&#34;&gt;🎯 Dispositif expérimental&lt;/h2&gt;
&lt;p&gt;Le honeypot cible expose trois services délibérément vulnérables :&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;Port 3000&lt;/strong&gt; : OWASP Juice Shop (injection SQL via &lt;code&gt;/rest/products/search?q=&lt;/code&gt;)&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Port 22&lt;/strong&gt; : OpenSSH avec credentials faibles (&lt;code&gt;honeypot:password123&lt;/code&gt;)&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Port 21&lt;/strong&gt; : vsftpd avec accès FTP anonyme et fichier &lt;code&gt;credentials.txt&lt;/code&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Les 4 modèles testés : &lt;strong&gt;Claude Sonnet 4&lt;/strong&gt; (Anthropic), &lt;strong&gt;Gemini 2.5 Flash-Lite&lt;/strong&gt; (Google), &lt;strong&gt;GPT-4o-mini&lt;/strong&gt; (OpenAI), &lt;strong&gt;qwen2.5-coder:14b&lt;/strong&gt; (local via Ollama). L&amp;rsquo;orchestrateur implémente une boucle commande-exécution-observation avec un maximum de 25 itérations.&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
