L’hétérogénéité des régimes d’exception au text and data mining face aux usages de l’IA : risques de fragmentation et forum shopping
Les récents progrès des différents outils d’intelligence artificielle (ci-après IA) dans la génération d’images s’inspirant de styles artistiques existants ont relancé les questionnements autour de l’utilisation d’œuvres protégées par le droit d’auteur. Tandis que les législations relatives à l’intelligence artificielle demeurent à un stade embryonnaire — en grande partie en raison des difficultés à concilier la protection des droits des auteurs avec la promotion de l’innovation —, des disparités commencent à émerger entre les différents ordres juridiques, tant nationaux que communautaires.
Bien que la création bénéficie d’une protection largement reconnue à l’échelle internationale grâce au droit d’auteur, celui-ci se trouve aujourd’hui fragilisé par la multiplication d’exceptions liées à l’entraînement des IA. Une tolérance relativement étendue à l’utilisation d’œuvres protégées à des fins d’apprentissage semble se dessiner, dont les divergences d’application pourraient, à terme, encourager des stratégies de « forum shopping »[1].
Au sein de l’Union européenne, la question de la protection du droit d’auteur face à son utilisation par l’intelligence artificielle est principalement encadrée par la Directive (UE) 2019/790 sur le droit d’auteur et les droits voisins dans le marché unique numérique. Son article 4 prévoit que l’utilisation d’œuvres protégées à des fins d’entraînement d’IA ne constitue pas une infraction, sauf si les ayants droit exercent leur droit d’exclusion (opt out). Si ces dispositions peuvent être perçues comme assurant un équilibre entre innovation et protection des droits d’auteur, elles suscitent néanmoins des critiques doctrinales. Celles-ci pointent notamment l’absence de dispositifs permettant d’anticiper ou d’empêcher l’exploitation des œuvres, réduisant considérablement l’efficacité du mécanisme d’opt out voire le bienfondé d’un tel droit[2]. Ces dispositions ont été transposées en France par le biais de l’ordonnance du 14 novembre 2021 introduisant l’article L.122-5-3 dans le code de propriété intellectuelle, ainsi que dans les autres pays de l’Union Européenne, sans qu’aucune réserve manifeste ne semble y avoir été introduite. Le cadre législatif européen offre donc une certaine lisibilité et peut contribuer à limiter les risques de law shopping. Cependant, en tant que premières normes encadrant ce phénomène, ces dispositions demeurent incomplètes et ouvrent la voie à des interprétations jurisprudentielles divergentes entre les États membres. L’appropriation de ces nouvelles règles par des juges encore peu formés à ces questions, tend donc à se révéler comme la pierre angulaire du futur des contentieux européens, s’agissant de la confrontation du droit d’auteur au modèle génératif des outils d’IA. En ce sens, les récentes poursuites engagées par les principaux syndicats de l’édition français contre Meta, en réaction à l’utilisation de près de 200 000 livres afin d’entraîner son modèle de langage Llama[3], apporteront probablement certaines réponses quant à l’évolution juridique de ces notions.
Aux États-Unis, la question semble encore être complexifiée par la doctrine du fair use[4] (non reconnue en droit européen ni français) qui permet l’utilisation d’une œuvre protégée, sans que celle-ci soit autorisée par son auteur, selon un faisceau d’indices comprenant entre autres la finalité et la nature de l’usage, la nature de l’œuvre protégée ou encore l’effet de l’utilisation sur le marché potentiel. Cette doctrine a été récemment mise en œuvre dans l’affaire Thomson Reuters contre Ross Intelligence, jugée le 11 février 2025[5]. Dans cette affaire, les juges ont condamné une entreprise de recherche juridique basée sur l’IA, en se fondant notamment sur l’impact de l’utilisation des résumés juridiques établis par Thomson, ainsi que sur leur absence de transformation. La méthode d’analyse en cause soulève des questionnements en matière de sécurité juridique puisqu’elle implique notamment une comparaison des buts artistiques, amenant les juges à se saisir de questions pour lesquelles ils ne possèdent aucune spécialisation. Cela apparaît d’autant plus contestable dès lors que les juges américains ont eux-mêmes admis leur incompétence s’agissant des questions touchant directement à la question artistique[6] à la suite de la désapprobation de la décision Greenberg Gallery[7] par les acteurs du marché de l’art.
Il convient cependant de relever que certaines législations résistent encore à la consécration de ce régime dérogatoire. Il s’agit notamment du cas du Royaume-Uni où les sociétés créatives britanniques ont fait entendre leurs voix en contestant, par le biais de leurs lobbys, la volonté d’élargissement de l’exception posée par la section 2A du CPDA[8]. Le projet britannique de réforme, amorcé en 2022, visait à élargir le champ de l’exception de fouille de textes et de données aux usages commerciaux des œuvres protégées, rompant ainsi avec la réserve initiale en faveur des seuls usages non lucratifs. Les contestations évoquées ont toutefois conduit les autorités à en suspendre la mise en œuvre et à engager une consultation publique[9]. Cette évolution maintient, pour l’instant, le Royaume-Uni dans le camp des États adoptant une approche protectrice des œuvres face aux usages de l’IA.
Les disparités des législations pourraient, dès lors, mener les acteurs de l’IA à se tourner vers des ordres juridiques particulièrement permissifs en matière de protection des droits d’auteurs. Cela pourrait par exemple être le cas du Japon où l’article 30-4 du Japanese Copyright Act n’inclut pas d’autorisation ni de critères spécifiques à l’utilisation d’œuvres protégées aux fins du data mining.
Bien que la question s’inscrive au-delà de la génération d’image, les craintes renforcées par les récents développements de l’IA, notamment avec l’imitation des Studio Ghibli, poussent à une réflexion autour de ces régimes d’exception qui érodent progressivement les garanties protectrices du droit d’auteur. En somme, plus les exceptions à l’utilisation d’œuvres protégées pour l’entrainement des IA seront importantes, plus elles aminciront la frontière entre entraînement et génération d’image.
Cette question s’inscrit dans un mouvement législatif d’ampleur entourant l’intelligence artificielle, comme en témoigne la proposition de loi n°1630 du 12 septembre 2023, qui vise à encadrer et protéger les œuvres créées à l’aide de l’IA, afin de combler les lacunes de la seule protection générale actuellement en vigueur. Ces considérations paraissant hautement contestables comme l’illustrent les propos de Pierre Sirinelli et Stéphane Prévost-Boyard développant que « les auteurs voient leurs droits paralysés tandis que les industriels de l’IA voient leurs machines protégées par le droit d’auteurs »[10]. Bien que selon Thierry Breton, les exceptions « assurent un équilibre entre deux éléments : protéger les titulaires de droits, notamment les artistes, et faciliter l’exploration de textes et de données, notamment par les développeurs d’IA»[11], les dispositions aujourd’hui en vigueur doivent être nécessairement complétées au risque de voir la balance largement penchée en faveur des entreprises d’IA. À cet égard, une piste législative est sans doute à creuser du côté de l’encadrement des utilisateurs des outils eux-mêmes[12].
Ugo Censi, doctorant contractuel, Université Paris I Panthéon-Sorbonne.
Notes
[1] BRUGUIERE Jean-Michel, DELTORN Jean-Marc, « Intelligences artificielles génératives. Y a-t-il exploitation des œuvres, au sens du droit d’auteur ? N’y aurait-il pas d’autres modèles à considérer ? », Recueil Dalloz, 2023, 32, pp.1657.
[2] SIRINELLI Pierre, PREVOST-BOYARD Stéphane, « Création par une IA : les droits d’auteur sous influence ? », Dalloz IP/IT : droit de la propriété intellectuelle et du numérique, 2023, 12, pp.609.
[3] Près Xavier, « Plusieurs syndicats d’éditeurs et d’auteurs poursuivent Meta et son IA », dans Le Journal Des Arts, 4 avril 2025, https://www.lejournaldesarts.fr/actualites/plusieurs-syndicats-dediteurs-et-dauteurs-poursuivent-meta-et-son-ia-177128, consulté le 30 avril 2025.
[4] Copyright Law of the United States (Title 17) §107.
[5] United States District Court for the District of Delaware [2023]: Thomson Reuters Enter. Centre GmbH v. Ross Intelligence Inc., 694 F.Supp.3d 467.
[6] Voir notamment : Thome v. Alexander & Louisa Calder Found., 2009, Andrea Blanch v. Jeff Koons, 2006, Andy Warhol Found. for the Visual Arts, Inc. v. Goldsmith, 2019.
[7] Greenberg Gallery, Inc. v. Bauman, 817 F. Supp. 167, US District Court for the District of Columbia, April 2, 1993.
[8] The Copyright, Designs and Patents Act 1988 (c. 48).
[9] Milmo Dan, « The UK’s new AI-copyright consultation: a path to clarity or controversy? », dans The Guardian, 25 février 2025, https://www.dentons.com/en/insights/articles/2025/january/2/the-uks-new-ai-copyright-consultation-a-path-to-clarity-or-controversy, consulté le 21 avril 2025.
[10] SIRINELLI Pierre, PREVOST-BOYARD Stéphane, « Création par une IA : les droits d’auteur sous influence ? », Dalloz IP/IT : droit de la propriété intellectuelle et du numérique, 2023, 12, pp.609.
[11] Réponse donnée par Thierry Breton au nom de la Commission européenne, E-000479/202, 31 mars 2023.
[12] Fauchoux Vincent et Kahn Benjamin, « IA et propriété intellectuelle : les leçons juridiques du cas OpenAI & Studio Ghibli », Actualités, DDG Deprès Guignot Associés, 9 avril 2025, https://www.ddg.fr/actualite/ia-propriete-intellectuelle-quels-enseignements-tirer-du-buzz-mondial-lie-a-la-generation-de-videos-dans-le-style-du-studio-openai-ghibli, consulté le 18 avril 2025.
