CrowdStrike formalise un dĂ©coupage de donnĂ©es antiâfuite pour mieux Ă©valuer les modĂšles ML en cybersĂ©curitĂ©
Source: CrowdStrike (blog) â Dans un billet technique, CrowdStrike met en lumiĂšre un problĂšme clĂ© de lâIA appliquĂ©e Ă la cybersĂ©curitĂ©: la fuite dâinformation entre ensembles dâentraĂźnement et de test qui gonfle artificiellement les performances des modĂšles. Le cĆur du problĂšme prĂ©sentĂ© est la trainâtest leakage lorsque des observations corrĂ©lĂ©es (Ă©vĂ©nements liĂ©s au mĂȘme arbre de processus, scripts similaires, ou provenant de la mĂȘme machine) sont rĂ©parties alĂ©atoirement entre train et test. Cette pratique crĂ©e des attentes de performance irrĂ©alistes et peut conduire Ă des Ă©checs face Ă des menaces inĂ©dites en production. ...