Source: CNIL — La CNIL annonce le 18 décembre 2025 un démonstrateur permettant de naviguer dans la généalogie des modèles d’IA open source afin d’étudier leur traçabilité et d’appuyer l’exercice des droits des personnes (opposition, accès, effacement) lorsque des données personnelles peuvent avoir été mémorisées par ces modèles.
🔎 Contexte et enjeu: La mise à disposition de modèles d’IA en source ouverte favorise leur adoption et leur réutilisation (génération de texte, images, traduction, transcription, etc.). Ces modèles sont souvent modifiés ou spécialisés, puis republis. Chaque modèle s’inscrit ainsi dans une généalogie avec des ascendants (modèles sources) et des descendants (modèles dérivés). La traçabilité devient essentielle pour comprendre comment un modèle a été constitué.
🧠 Mémorisation et RGPD: La communauté académique a montré qu’il est possible d’extraire ou de régurgiter des éléments de la base d’entraînement via l’accès au modèle. Lorsque des données personnelles ont pu être utilisées, le Comité européen de la protection des données (CEPD) considère, dans la plupart des cas, que le RGPD s’applique, sauf si le responsable de traitement démontre via des tests qu’aucune donnée personnelle ne peut être extraite ou déduite.
🧪 Expérimentation CNIL: La CNIL a mené une expérimentation visant à explorer des scénarios d’exercice des droits d’opposition, d’accès et d’effacement pour des personnes concernées par la mémorisation de leurs données. Première étape clé: identifier, à partir d’un modèle ayant mémorisé des données d’une personne, les autres modèles de sa généalogie susceptibles d’avoir mémorisé ces mêmes données.
🧭 L’outil publié: Le service IA de la CNIL, avec le LINC, propose un outil de démonstration pour explorer la généalogie d’un modèle d’IA présent sur HuggingFace, facilitant la navigation entre ascendants et descendants. L’objectif est d’étudier la traçabilité de l’écosystème open source et de soutenir l’exercice des droits.
🧩 Nature de la publication: Annonce d’un outil et présentation d’une expérimentation visant la traçabilité et la conformité RGPD dans l’écosystème des modèles d’IA open source.
🔗 Source originale : https://www.cnil.fr/fr/la-cnil-publie-un-outil-pour-la-tracabilite-des-modeles-dia-publies-en-source-ouverte