HackerOne : Benchmark GPT-5.5 vs Claude Opus 4.7 vs Sonnet 4.6 pour la validation de vulnérabilités
đ Source et contexte : Article publiĂ© le 6 mai 2026 sur le blog HackerOne par Michiel Prins, Saida Wijpkema et Miray Mazlumoglu. Il fait suite Ă un prĂ©cĂ©dent benchmark sur Claude Opus 4.7 et intervient aprĂšs la sortie de GPT-5.5 par OpenAI. đŹ MĂ©thodologie : Les trois modĂšles (GPT-5.5, Claude Opus 4.7, Claude Sonnet 4.6) ont Ă©tĂ© Ă©valuĂ©s sur le mĂȘme harness de validation interne de HackerOne, comprenant : Des CVEs publics sur des projets C/C++ (38 cas de test) Des rapports de vulnĂ©rabilitĂ©s rĂ©els sur une application web (XSS, SQLi, SSRF, RCE, IDOR) Des rapports de qualitĂ© variable, incluant des soumissions fabriquĂ©es ou Ă impact surestimĂ© GPT-5.5 a Ă©tĂ© Ă©valuĂ© via le programme OpenAI Trusted Access for Cyber. ...