Il mondo dell'intelligenza artificiale si trova nuovamente al centro di una battaglia legale che potrebbe ridefinire i confini dello sfruttamento dei dati online. La piattaforma Reddit ha intentato causa contro Anthropic, la startup dietro il chatbot Claude, sostenendo che l'azienda abbia continuato a raccogliere illegalmente contenuti dalla sua piattaforma anche dopo aver pubblicamente dichiarato di aver interrotto tali pratiche. La controversia, depositata presso il tribunale di San Francisco, mette in luce le crescenti tensioni tra le piattaforme social e le aziende di AI che necessitano di enormi quantità di dati per alimentare i propri modelli linguistici.
L'accusa del doppio volto
Reddit non usa mezzi termini nel descrivere Anthropic come un'azienda dal "doppio volto", capace di presentarsi pubblicamente come responsabile mentre opererebbe in violazione delle regole stabilite. Secondo i documenti legali, Anthropic avrebbe effettuato oltre 100.000 accessi alla piattaforma dopo luglio 2024, continuando a utilizzare questi dati per addestrare i suoi modelli di intelligenza artificiale nonostante gli accordi violati.
Ben Lee, responsabile legale di Reddit, ha sottolineato l'unicità della piattaforma nel panorama digitale: "Ora più che mai, le persone cercano conversazioni autentiche tra esseri umani. Reddit ospita quasi 20 anni di ricche discussioni umane su praticamente ogni argomento immaginabile. Queste conversazioni non avvengono da nessun'altra parte e sono centrali per l'addestramento di modelli linguistici come Claude".
Il valore miliardario delle conversazioni autentiche
La questione centrale del contenzioso riguarda il valore economico delle conversazioni spontanee che si sviluppano quotidianamente su Reddit. Secondo Lee, nessuna altra piattaforma può vantare l'ampiezza di discussioni autentiche che caratterizza Reddit, un tesoro digitale accumulato in decenni che vale miliardi di dollari nella corsa all'addestramento dell'AI.
La strategia commerciale di Reddit prevede la concessione di licenze per l'utilizzo dei propri dati, come dimostra l'accordo da 60 milioni di dollari all'anno siglato con Google all'inizio del 2024. Partnership simili sono state stabilite con OpenAI, Sprinklr e Cision, evidenziando come la monetizzazione dei contenuti generati dagli utenti sia diventata un pilastro del business model della piattaforma.
Una battaglia che va oltre Reddit
Il caso Anthropic-Reddit si inserisce in un panorama legale sempre più complesso, dove le tensioni sui diritti d'autore nell'era dell'AI si moltiplicano. Il New York Times ha aperto le danze nel dicembre 2023 citando in giudizio OpenAI e Microsoft per l'utilizzo non autorizzato dei propri articoli, mentre più recentemente Vox Media e Condé Nast hanno unito le forze contro l'azienda AI Cohere per accuse simili di violazione del copyright.
La risposta a queste controversie sta emergendo attraverso piattaforme decentralizzate come Lens Protocol e Farcaster, che promettono agli utenti la proprietà diretta dei propri dati e la possibilità di trarne profitto. Progetti come Bittensor e Ocean Protocol stanno costruendo infrastrutture dove gli utenti possono contribuire con dati o modelli AI in cambio di ricompense basate su blockchain.
Le richieste di risarcimento
Reddit chiede al tribunale non solo un risarcimento economico, ma anche un'ingiunzione permanente che impedisca ad Anthropic di utilizzare qualsiasi dato derivato dalla piattaforma nei suoi prodotti. La causa mira inoltre a bloccare la commercializzazione di modelli AI addestrati su contenuti Reddit, una richiesta che potrebbe avere implicazioni significative per il futuro sviluppo di Claude e altri sistemi di intelligenza artificiale.
Il caso rappresenta un punto di svolta nel dibattito sui diritti degli utenti nell'economia digitale, dove le critiche si concentrano su come le piattaforme centralizzate continuino a estrarre valore dai contenuti generati dagli utenti offrendo poco in cambio.