Foto Getty

Cose dai nostri schermi

Non è un bel momento per l'archivio più vasto di Internet

Pietro Minto

Messa in ginocchio dalle cause perse in tribunale contro i colossi dell'editoria e della musica, l'imponente biblioteca digitale di Internet Archive è costretta ad accantonare i suoi progetti più lodevoli, mentre l'IA prosegue indisturbata a sottrarre materiale altrui per i propri contenuti sintetici

È un brutto periodo per Internet Archive, società non profit che dal 1996 si è data un obiettivo molto ambizioso, e sempre più fuori luogo nel web odierno, ovvero garantire "l’accesso universale alla conoscenza". Uno dei suoi servizi più noti è la Wayback Machine, una macchina del tempo virtuale che permette di vedere come si sono evoluti i siti internet nel corso degli anni. Basta inserire il sito desiderato nella barra di ricerca per accedere a una serie di sue versioni che sono state salvate nell’archivio.

  

Ascolta "La battaglia per Internet Archive" su Spreaker.

 

Non è cosa da poco, visto che il web non è resiliente come si direbbe, anzi: secondo un’indagine del centro di ricerche Pew, infatti, il 38% dei siti che erano online nel 2013 non sono più accessibili agli utenti. La chiamano “link rot”, marciume dei link, e in molti casi Internet Archive è l’unica testimonianza che rimane di questi contenuti perduti.

Negli ultimi anni, però, la società è stata colpita da alcune denunce che rischiano di metterla in difficoltà. Ha perso un’importante causa contro il gruppo editoriale Hachette che l’aveva denunciata per un progetto avviato dall’Archive nel 2020, quando le biblioteche furono chiuse a causa della pandemia. Per supplire alla loro mancanza, la società decise di offrire la sua collezione di libri gratuitamente agli utenti, che potevano sfogliarli online. Prima di allora il servizio era disponibile ma solo per un certo periodo di tempo, come nelle biblioteche tradizionali: durante la pandemia il limite fu rimosso per alcuni mesi – e gli editori non la presero bene.

La vittoria di Hachette deve aver ispirato la Recording Industry Association of America, o RIAA, l’associazione di categoria per l’industria musicale statunitense, che ha denunciato Internet Archive per uno dei suoi progetti musicali, il Great 78 Project, con cui ha digitalizzato e reso disponibile migliaia di brani provenienti da vecchi dischi a 78 giri (un formato di vinile arcaico). In particolare il progetto si concentrava su dischi non disponibili in catalogo o sui servizi di streaming, in modo da non incappare in problemi legali, ma la RIAA ha trovato nell’archivio anche brani che sono attualmente nel mercato. A quanto pare, l’Archive attendeva che la RIAA segnalasse quali canzoni cancellare dal sito mentre quest’ultima sostiene che Internet Archive avrebbe dovuto agire da sola. Risultato? Ne è nata una causa per la quale le case discografiche chiedono 621 milioni di dollari alla non profit, una cifra che la metterebbe in ginocchio.

Tutto questo è avvenuto in un momento cruciale per il web, che è contemporaneamente preso d’assalto dall’industria delle intelligenze artificiali, le quali sottraggono contenuti d’ogni tipo – spesso senza richieste o permesse –, mentre i suoi utenti le utilizzano per inondare siti e piattaforme di contenuti sintetici. Certo, anche aziende come OpenAI sono state bersaglio di denunce (come quella del New York Times) che rischiano di minare il loro stesso business ma è difficile non notare il doppio standard dimostrato nei confronti di Internet Archive, il cui Great 78 Project è senz’altro utile, lodevole e interessante – ma non può essere definito una minaccia per l’industria discografica.