Décryptages
29/01/25
Controverses sur la définition de l’Open Source à l’ère de l’intelligence artificielle

Le règlement européen sur l’intelligence artificielle du 13 juin 2024 (ou « AI Act »), qui a pour objectif de garantir une utilisation sécurisée et éthique de l’IA tout en permettant l’innovation et la croissance dans ce secteur technologique stratégique, prévoit un régime d’exemptions bénéficiant en particulier aux systèmes d’IA publiés dans le cadre de licences libres et ouvertes – sauf exceptions tenant notamment à leur niveau de risque – et aux modèles d’IA à usage général publiés dans le cadre de ces mêmes licences. Ce régime d’exemptions explique l’enjeu autour de la définition de l’Open Source appliqué à l’IA, qui ne fait pour l’heure l’objet d’aucun consensus clair et établi parmi les principaux acteurs de ce secteur.
Le régime d’exemption de l’AI Act
L’AI Act a établi un régime spécifique d’exemptions pour les systèmes et pour les modèles d’IA. En ce qui concerne les systèmes d’IA, le règlement ne s’applique pas aux systèmes publiés dans le cadre de licences libres et ouvertes, sauf s’ils sont à haut risque, relèvent de pratiques interdites au sens de l’article 5 du même règlement (profilage de personnes physiques, biométrie, etc.), ou impliquent un risque de transparence au sens de l’article 50. Toutes ces limites au régime d’exemption pour les systèmes d’IA réduisent grandement l’impact réel de ce dernier, regardé comme « quasi-inexistant » par certains commentateurs.
S’agissant des modèles d’IA à usage général, une exemption spécifique est prévue pour la fourniture de ces modèles « dans le cadre d’une licence libre et ouverte permettant de consulter, d’utiliser, de modifier et de distribuer le modèle, et dont les paramètres, y compris les poids, les informations sur l’architecture du modèle et les informations sur l’utilisation du modèle, sont rendus publics » : ils ne sont pas tenus d’élaborer et de tenir à jour une documentation technique du modèle (y compris son processus d’entraînement et d’essai et les résultats de son évaluation), ni d’élaborer, de tenir à jour et de mettre à disposition des informations et de la documentation à l’intention des fournisseurs de systèmes d’IA qui envisagent d’intégrer leur modèle d’IA à usage général dans leurs systèmes d’IA. Toutefois, là encore, l’impact de l’exemption est limité, celle-ci ne s’appliquant pas aux modèles d’IA présentant un risque systémique (même si ces derniers sont rares à date). Surtout, elle n’exonère pas le fournisseur du modèle d’IA de toutes ses obligations imposées par le règlement, ce dernier étant toujours soumis à la politique de respect du droit d’auteur et à l’obligation de publier un résumé des contenus d’entraînement.
La nécessité d’un consensus sur la définition de l’IA Open Source
Selon l’Open Source Alliance, une organisation récemment créée et très attachée à l’état d’esprit open source originel, les bénéfices de l’Open Source pour l’IA seraient nombreux et reposeraient sur la transparence et l’autonomie qu’il prône, permettant, à travers la diffusion massive et libre des systèmes d’intelligence artificielle, le développement collaboratif, le perfectionnement et la démocratisation de ces systèmes à toute la communauté des utilisateurs. L’IA Open Source nécessite dès lors d’être définie clairement dans un souci d’intelligibilité et d’efficacité, voire de survie des principes de l’Open Source à l’heure de l’essor de l’intelligence artificielle.
La question de la définition de l’Open Source à l’ère de l’IA pourrait cependant être plus délicate que pour les logiciels, compte-tenu de la nature complexe et évolutive des systèmes d’IA construits à partir d’un code logiciel et de données d’entraînement sous-jacentes. Certains ont pu soutenir que retenir une définition « allégée », qui qualifierait d’Open Source un système d’IA dont seulement une partie des caractéristiques seraient en libre accès (les paramètres et les poids, à l’exclusion du code source et des données d’entraînement par exemple), pourrait inciter les développeurs à concevoir des modèles semi-ouverts, voire fermés, et enrayer le développement d’un écosystème Open Source mondial en matière d’intelligence artificielle.
L’antagonisme entre l’OSI et l’AOS : la question de l’inclusion des données d’entraînement dans la définition de l’IA open source
Dans un contexte particulier à la veille du sommet pour l’action sur l’intelligence artificielle qui se déroulera à Paris les 10 et 11 février 2025 (AI France Summit 2025), les acteurs du numérique ne convergent pas tous sur une seule et même définition de l’IA Open Source. L’Open Source Initiative (OSI), organisation créée en 1998 pour promouvoir les logiciels open source, a publié en octobre 2024 sa version 1.0 de la définition de l’IA Open Source (OSAID), après de nombreux rounds de négociation marqués par un certain tiraillement au sujet de l’inclusion – finalement écartée – des données d’entraînement des systèmes d’IA dans ladite définition. Des entreprises telles que Meta ont en effet plaidé pour cette exclusion, en invoquant, à l’appui, leur protection par le droit d’auteur et leur confidentialité, tandis que d’autres acteurs de l’open source sollicitaient son inclusion.
In fine, la définition retenue par l’OSI met l’accent sur le respect des quatre libertés fondatrices du logiciel libre, à savoir la liberté (i) d’exécuter le système sans demander de permission, (ii) de l’étudier, (iii) de le modifier et (iv) de partager librement le système modifié (ces libertés s’appliquant au système d’IA dans son ensemble ainsi qu’à chacun de ses éléments pris isolément). Cette définition exige par ailleurs que le code source, les poids et les paramètres du système d’IA soient ouverts. Néanmoins, si l’OSI, dans sa définition, insiste sur le besoin d’une description complète des données d’entraînement, elle n’exige pas pour autant que ces données soient totalement connues, leur ouverture n’étant, de ce fait, pas une condition sine qua non de la qualification en IA Open Source. Ce choix d’une définition « allégée » de l’IA Open Source se justifie, pour certaines entités comme Mozilla, par un certain pragmatisme de l’OSI, qui prend acte de ce que « le développement ouvert de l’IA est en piteux état » et accepte certains compromis imposés par les géants de la Tech.
Pour autant, cette « largesse » a été critiquée, notamment par des développeurs de Debian (système d’exploitation et de distribution de logiciels libres de Linux). Selon eux, cette définition de l’IA Open Source serait incompatible avec la définition originelle de l’Open source (OSD) dès lors que les données d’entraînement constitueraient – toujours selon eux – la « source » de ces logiciels particuliers que sont les systèmes d’IA.
Plusieurs développeurs se sont alors réunis autour de la figure de Sam Johnston (entrepreneur australien spécialisé dans la tech et l’IA), affilié à l’OSI, pour faire sécession et créer leur propre organisation, l’Alliance pour l’Open Source (ou Open Source Alliance). Elle réunit des organisations nationales et des leadeurs internationaux établis dans le domaine des logiciels libres. A cet égard, les fondateurs de l’AOS désirent rallier certains acteurs influents du secteur tels que l’association April, le projet Debian, la Free Software Foundation Europe ou bien encore les structures internationales que sont la Software Freedom Conservancy ou la fondation Linux. Les organisations participant à l’AOS doivent respecter les valeurs de l’Open Source, en particulier les quatre libertés fondatrices du logiciel libre précitées et adhérer à une définition plus large de l’IA Open Source, incluant clairement la publication des données d’entraînement, qui, d’après Sam Johnston, « sont considérées comme faisant partie intégrante du programme et sont soumises aux mêmes exigences ».
L’AOS multiplie ainsi les démarches et interventions pour renforcer son écosystème et sensibiliser les différents acteurs du secteur à son projet, pour « maintenir l’intégrité des principes de l’Open Source » que sont la transparence, l’équité et l’interopérabilité des systèmes d’IA. L’organisation espère également renforcer sa sphère d’influence dans la perspective de l’AI France Summit 2025, étant rappelé que l’enjeu de cette définition est celui du périmètre des exemptions relatives aux licences Open Source prévues par l’AI Act.
Avocats concernés :