È ampiamente accettato che le aziende di intelligenza artificiale utilizzino articoli web per addestrare i propri modelli senza pagare i creatori o chiedere il permesso. Editori come The New York Times, Chicago Tribune e Toronto Star hanno già intentato causa contro questa pratica. Ora un’altra importante organizzazione si è unita alla causa.

Lo ha riferito Techcrunch Di proprietà dell’Enciclopedia Britannica e della sua controllata Merriam-Webster ha intentato una causa La causa contro OpenAI affermava che il colosso dell’intelligenza artificiale aveva commesso una “massiccia violazione del copyright” raschiando e utilizzando quasi 100.000 dei suoi articoli online per formare LLM senza permesso.

Di cosa tratta questo caso?

Britannica sostiene che ChatGPT riduce il traffico web e le potenziali entrate generando risposte che ne sostituiscono il contenuto. Se gli utenti possono porre una domanda a ChatGPT e ricevere una risposta basata sugli articoli di Britannica, potrebbero esserci meno incentivi a visitare direttamente il sito web.

Il reclamo prende di mira anche l’uso da parte di OpenAI dei contenuti Britannica nel flusso di lavoro RAG di ChatGPT; Questo processo afferma che l’IA scansiona il web alla ricerca di informazioni aggiornate mentre risponde alle domande e l’IA ne riproduce il contenuto in tutto o in parte mentre risponde alle domande.

Inoltre, la Britannica sostiene che OpenAI ha violato la legge sui marchi. La società ha sostenuto che ChatGPT aveva avuto allucinazioni sulle informazioni e poi le ha erroneamente attribuite all’editore. Secondo Britannica, le allucinazioni di ChatGPT mettono a repentaglio “il continuo accesso del pubblico a informazioni online affidabili e di alta qualità”.

Cosa succederà dopo?

Questa è la grande domanda. Non esiste un forte precedente legale che determini se la formazione sull’intelligenza artificiale su contenuti protetti da copyright costituisca una violazione del copyright. Chiunque può dirti che va bene usare il lavoro di qualcun altro per addestrare i tuoi dati, ma la legge al riguardo è nella migliore delle ipotesi vaga.

In un recente caso che coinvolge Anthropic, un giudice federale ha stabilito che l’utilizzo di contenuti protetti da copyright come dati educativi era sufficientemente trasformativo da essere legale. Ma lo stesso giudice ha scoperto che Anthropic ha scaricato illegalmente milioni di libri, ottenendo un risarcimento di 1,5 miliardi di dollari con gli autori interessati.

C’è un terreno importante che i legislatori devono coprire poiché questo problema continua ad evolversi. L’esito di questi casi probabilmente determinerà il modo in cui le società di intelligenza artificiale potranno utilizzare legalmente i contenuti web in futuro.


Link alla fonte: www.digitaltrends.com

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *