New York Times v. Open AI: disputa per il futuro dell'IA
- Luca Polesel
- 19 set 2024
- Tempo di lettura: 7 min
Aggiornamento: 1 ott 2024
1. Introduzione
Si pone spesso l’accento sull’output generato dai sistemi di intelligenza artificiale, ovverosia il prodotto della sua elaborazione, e ci si chiede se il diritto d’autore possa essere utilizzato per proteggere tali creazioni e, ancora, a chi debba essere riconosciuto, se del caso.
Nel farlo, talvolta, non si presta attenzione al processo antecedente la creazione dell’output e la rielaborazione dei materiali, che porta al risultato. Un sistema di intelligenza artificiale, infatti, per poter generare, deve essere addestrata con un insieme di materiali, che le vengono forniti – o che esso ricerca in rete. In questo contributo, si desidera volgere lo sguardo proprio alla problematica legata a tali materiali utilizzati per la creazione di un testo o di un’opera grafica, qualora essi siano soggetti al diritto d’autore, attraverso la sintetica esposizione di un famoso e recentissimo caso che vede contrapporsi il New York Times come attore e Microsoft e Open AI (sotto varie forme giuridiche) come convenuto, il quale ha portato, prepotentemente, questo tema alla ribalta. È proprio sui materiali di formazione del sistema ChatGPT che la causa verte: l’allegazione principale dell’attore è che l’utilizzo di articoli del suo giornale, come strumento di apprendimento del sistema, determini una significativa lesione del diritto d’autore, dovuto al loro impiego non autorizzato e alla replicazione di strutture linguistiche e, talvolta, alla riproduzione pedissequa di parti di essi nelle risposte generate dal sistema, oltre alla mancata menzione degli articoli come fonti.
Dall’altro lato, Open AI rigetta quanto affermato dall’attore ed esplicita pubblicamente la propria posizione in una dichiarazione liberamente consultabile sul sito Open AI (riferimento infra), in cui stauisce «Training AI models using publicly available internet materials is fair use». Prosegue, inoltre, il testo pubblicato con la considerazione che il principio del fair use in merito agli articoli pubblicati online sia «necessary for innovators, and critical for US competitiveness». E, in effetti, osserva Andreessen Horowitz, un venture capital firm, con un commento ufficiale di ottobre 2023, che riconoscere la responsabilità da violazione del diritto d’autore alle società come Open AI «[would] either kill or significantly hamper their development», affermando dunque l’importanza della problematica, già da mesi nell'aria, in toni (forse volutamente) drammatici. Prima di esporre il caso di cui si è detto, tuttavia, conviene dare una (breve) panoramica sulla dottrina giuridica del fair use, che costituisce un elemento fondamentale per comprendere la lite tra NYT e Open AI.
2. La dottrina del fair use
La sezione 107 del Copyright Act statunitense, rubricata limitations on exclusive rights: Fair use, tratta delle ipotesi in cui l’utilizzo di opere protette con il diritto d’autore possa essere sfruttata da soggetti diversi dall’autore, senza la sua autorizzazione, «for purposes such as criticism, comment, news reporting, teaching, scholarship, or research», attività che lo stesso Copyright Office definisce un esempio delle possibili che possono qualificare un fair use. Segue, alla stessa sezione, l’elenco dei parametri sulla base dei quali considerare se un uso sia fair o meno, che qui non si riportano, brevitatis causa.
La dottrina del fair use, dunque, è definita dal Copyright Office come «promotrice di libertà di espressione, permettendo l’utilizzo non autorizzato di opere protette con il diritto d’autore in talune circostanze». Una deroga alla privativa concessa dal diritto d’autore per finalità ritenute meritevoli dall’ordinamento, che viene invocata anche da Open AI, come si diceva (e si vedrà infra) per il proprio utilizzo degli articoli del New York Times come fonte di addestramento del proprio sistema di intelligenza artificiale.
Il precedente chiave, con riguardo al tema, è il caso Google Books: Google, tramite Google Books, aveva reso disponibili online grandi porzioni di libri e gli autori di essi citarono in giudizio Google per non aver chiesto l’autorizzazione per la pubblicazione, né tantomeno reso un compenso. In tal caso, inizialmente Google ebbe torto ma, in seguito, le Corti ritennero che l’uso del materiale coperto dal diritto d’autore fosse fair in quanto «transformative»: in breve, la tesi consiste nell’affermazione che Google non si sia limitato a copiare i libri, ma li abbia utilizzati per creare un prodotto nuovo e di valore, senza porsi in concorrenza con l’esistente mercato dei libri.
Potrebbe essere oggetto, questo caso, di un contributo a sé stante ma, limitandosi a prendere per vero quanto affermato dalle Corti, è molto plausibile che Open AI tenga, nel corso del processo, in primaria considerazione questo precedente per la propria difesa; ciò facendo leva sulla capacità del sistema di intelligenza artificiale di generare un novum rispetto ai materiali reperiti, distinto e non in concorrenza con la fonte.
3. Il caso: NYT v. Open AI
Il 27 dicembre 2023, il New York Times cita in giudizio Microsoft e Open AI (sotto la forma giuridica di varie società) reclamando danni ingentissimi – sebbene non espressamente quantificati – in merito alla allegata violazione del proprio diritto d’autore sugli articoli utilizzati dall’intelligenza artificiale per addestrarsi.
Principalmente, come riassunto da Mason Kortz in un’intervista pubblicata per Harvard Law Today da Rachel Reed, vi sono tre ordini di argomenti utilizzati dal New York Times.
Il primo riguarda lo stesso addestramento del sistema di IA, perché è evidente che delle copie devono essere state create, formando una libreria non autorizzata composta da articoli del Times, per poter creare modelli linguistici fluidi sulla base di essi. Questo argomento, tuttavia, porge il fianco alla prevedibile obiezione del fair use, per la verità, osserva Kortz.
Il secondo argomento è che il modello di linguaggio che risulta è, in fin dei conti, una copia, o rappresenta un’opera derivata dagli articoli del Times e, come tale, viola il diritto d’autore. Nuova teoria, quella contenuta in questo punto, che non si limita all’accusa di utilizzo non autorizzato, ma addirittura suggerisce la creazione di una distinta opera con un’autonoma dignità e non – come invece si può sostenere – una mera raccolta di dati utilizzata per le risposte dell’intelligenza artificiale agli utenti.
In terzo luogo, il Times afferma che, talvolta, le risposte fornite da ChatGPT risultano essere delle riproduzioni «verbatim» o «near verbatim» dei propri articoli. È in tal senso chiara l’accusa ad Open AI di aver copiato e riprodurre – non è ben chiaro se consapevolmente o meno, ma il convenuto risponde che si tratta solamente di un bug del sistema – forme di espressione proprie del giornale.
All’indomani dell’atto di citazione del NYT, Open AI, prima ancora di rispondere giudizialmente, si è premurata di esporre su openai.com la propria posizione. In particolare, Open AI sostiene che la collaborazione con i media dell’informazione sia proficua non solo per sé ma anche per questi ultimi, creando nuove opportunità, dal punto di vista economico; ma anche che, dal lato giuridico – com’era prevedibile – l’addestramento del sistema di intelligenza artificiale rientri nell’ipotesi di fair use. Come accennato, la dottrina del fair use può essere alla base della difesa in giudizio di Open AI, forte del precedente di cui sopra si è detto. Quanto al fenomeno della regurgitation, ovvero alla riproposizione verbatim o quasi di interi spezzoni di articoli, cui l'attore si riferisce nell'atto di citazione, viene detto che essa è un raro bug che la società sta cercando di ridurre a zero, aggiungendo che non sono stati concretamente proposti esempi di tale fenomeno nel corso di precedenti discussioni sui problemi portati all’attenzione della Corte.
«The New York Times is not telling the full story» è, infatti, il titolo dell’ultimo punto esposto in questo breve testo pubblicato, sottolineando come vi fosse stato, prima del ricorso per vie legali del New York Times, un dialogo costruttivo tra il colosso dell’informazione e quello della tecnologia, poi bruscamente interrotto. Tirando le somme, il mancato raggiungimento di un accordo e l’intravisione cinica di un enorme profitto avrebbero portato – a detta di Open AI – il NYT ad adire le vie legali. Chiara è, da quest'ultimo punto, la posizione di Open AI volta a screditare il soggetto attore, dipingendolo come rancoroso e opportunista.
Sotto questo punto di vista, osserva Audrey Pope in Harvard Law Review, il New York Times in passato aveva tenuto posizioni ben diverse dalle attuali, da paladino romantico del diritto d'autore. Il riferimento è al caso Tasini in cui il Times predilesse una linea maggiormente sensibile agli interessi di sviluppo tecnologico, legati indissolubilmente al profitto, rispetto a quella attuale, tenuta contro Open AI. Ciò sembra, almeno ad uno sguardo esterno, un elemento che può far propendere, effettivamente, per prendere, quantomeno, in considerazione la non celata accusa di opportunismo rivolta da Open AI al giornale – anche se, naturalmente, tutto è ancora da dimostrarsi. Certo è che, di sicuro, valide o meno che siano le tesi giuridiche del NYT, la prospettiva di ottenere una ragione, ancorché parziale, in giudizio, aprirebbe la strada ad un arricchimento senza dubbio senza precedenti.
4. Conclusioni
Lo scontro giudiziario che si prospetta sul fair use nell’addestramento dell’intelligenza artificiale, indubbiamente, è foriero di conseguenze rilevantissime non solo in termini economici, ma soprattutto di sviluppo tecnologico, oltre che immediatamente giuridici. Dal punto di vista economico, se davvero Open AI fosse riconosciuta responsabile di violazione del diritto d’autore, si parlerebbe di danni esorbitanti che nemmeno il claimant ha voluto quantificare nel proprio atto di citazione; ma al di là dei risvolti monetari, si pensi alla rilevanza che tale precedente potrebbe avere nel panorama statunitense – e non solo. Il proliferare di azioni legali di questa sorta, infatti, potrebbe azzoppare, a detta di molti – come il già citato venture capital firm Andeersen Horowitz – lo sviluppo tecnologico stesso. Si pensi, d'altra parte, ad un'intelligenza artificiale cui è impedito di trarre le proprie informazioni dalle principali fonti qualificate che possa trovare in rete oppure esposta costantemente a danni ingentissimi. Commenta Kortz nella già citata intervista per Harvard Law Today: il proliferare di cause come quella del NYT potrebbe rappresentare una «existential crisis for ChatGPT».
Bibliografia
Atto di Citazione NYT v. Open AI - https://nytco-assets.nytimes.com/2023/12/NYT_Complaint_Dec2023.pdf
Audrey Pope, NYT v. OpenAI: The Times’s About-Face in Harvard Law Review - https://harvardlawreview.org/blog/2024/04/nyt-v-openai-the-timess-about-face/
Fair Use in Columbia University Libraries - https://copyright.columbia.edu/basics/fair-use.html
Mira Sundara Rajan, Is Generative AI Fair Use of Copyright Works? NYT v. OpenAI, Kluwer Copyright Blog - https://copyrightblog.kluweriplaw.com/2024/02/29/is-generative-ai-fair-use-of-copyright-works-nyt-v-openai/
Notice of Inquiry on Artificial Intelligence & Copyright, commento ufficiale di Andreessen Horowitz - reperibile all'indirizzo https://www.regulations.gov/comment/COLC-2023-0006-9057
Open AI and Journalism : https://openai.com/index/openai-and-journalism/
Rachel Reed, Does ChatGPT violates NYT copytight? in Harvard Law Today -https://hls.harvard.edu/today/does-chatgpt-violate-new-york-times-copyrights/
Comments