Foto LaPresse

L'informazione del futuro

Innovazione o plagio, l'affaire Forbes-Perplexity

Pietro Minto

Perplexity AI, il sito a metà tra un chatbot e un motore di ricerca che non piace ai giornali
 

Lo scorso febbraio Kevin Roose, giornalista del New York Times, ha scritto un entusiasta articolo spiegando di aver trovato un sito – nato da appena un anno – che aveva di fatto sostituito Google nel suo quotidiano. A prima vista, Perplexity – questo il nome del servizio – somiglia parecchio a Google o a  qualsiasi altro motore di ricerca: il sito ha una pagina pressoché vuota con una grande barra di ricerca in mezzo, tutto qui.  Invece di rovistare il web per trovare link affini alle chiavi di ricerca inserite dall’utente però, Perplexity si comporta come un chatbot, alla ChatGPT e simili, e risponde alle domande generando un testo. L’utente domanda e il sito risponde, confermando di essere a metà tra un chatbot e un motore di ricerca.

Nel giro di pochi mesi attorno a Perplexity è nata una community piuttosto fedele, che come Roose dice ormai di fare a meno dei vecchi motori di ricerca. Ai primi di giugno, però, il sito ha fatto un passo in più e ha presentato Pages, un servizio che permette agli utenti di creare pagine web a partire dai loro scambi di domande e risposte con Perplexity. Le ricerche degli utenti diventano quindi pagine condivisibili online: articoli come quelli di un blog o un sito, solo che sono stati generati dall’IA.

Sono bastati pochi giorni perché alcuni giornalisti di Forbes notassero che tra i contenuti proposti su Pages, alcuni citavano testualmente degli  articoli della rivista. Perplexity aveva infatti creato una pagina web in cui comparivano ampi stralci degli articoli di Forbes e l’aveva messo online, ottenendo circa 20 mila visualizzazioni. In particolare, aveva tratto da un’inchiesta in più parti di Forbes sugli investimenti militari di Eric Schmidt, ex di Google, che aveva usato sul sito ma anche per produrre una puntata di Discover Daily, un podcast quotidiano prodotto dal sito e “letto” da un’IA. Le uniche menzioni – di Forbes e di altre fonti – erano ridotte a una serie di icone che contenenevano dei link.

Inizialmente il ceo di Perplexity AI, Aravind Srinivas, ha ammesso che il servizio aveva qualche difetto da limare per poi contrattaccare, sostenendo che il sito aveva portato molto traffico a Forbes. Quei piccoli link, insomma, venivano usati dagli utenti, che ci cliccavano e consultavano il materiale d’origine. Srinivas si è spinto fino a definire Perplexity “la seconda fonte di click per Forbes dietro solo a Wikipedia”, un fatto prontamente smentito dalla rivista, secondo cui Perplexity avrebbe portato lo 0,014 per cento del traffico totale.  

Il caso di Pages ha insomma dimostrato tutto quello che potrebbe andare storto nella relazione tra intelligenze artificiali generative e informazione, attorno al quale si stanno stringendo accordi milionari come quello tra OpenAI e alcuni editori (Axel Springer, Vox Media e News Corp., tra gli altri). In cambio di cospicue somme di denaro (250 milioni nell’arco di cinque anni per News Corp.), gli editori devono permettere ad aziende come OpenAI di utilizzare i loro contenuti sia per migliorare le prestazioni delle IA, sia per avere informazioni aggiornate.

Un patto con il diavolo, secondo alcuni; l’inizio di una nuova èra per altri. L’affaire Forbes-Perplexity sembra dare ragione ai primi e non ha aiutato nemmeno il fatto che Perplexity, una volta scoperta, abbia precisato di “essere già al lavoro per accordi di condivisione delle entrate con editori di grande qualità”. Il giornalista Casey Newton ha scritto che dietro a questi (supposti) accordi economici tra Perplexity e qualche giornale si nasconde un’azienda che si muove deliberatamente nel web e che ha paragonato a “un motore per il plagio”. 
L’aggregazione di notizie non è di certo una novità, e nemmeno il rischio che qualche testata o blog “rubi” la notizia a un’altra, sia chiaro. A rendere il caso di Perplexity così spinoso è la piena automazione del processo: la macchina estrapola senza permesso un contenuto da una testata, lo impacchetta e lo usa prima per rispondere alle domande degli utenti e poi per confezionare pagine da condividere come articoli di giornale, per poi usarlo per video e podcast, in una strategia multimediale in cui nessun essere umano ha mosso un mignolo. Tutto ciò, su vasta scala e di continuo, con il rischio che le IA divorino le notizie ma anche che, prima o poi, rimangano senza giornali a cui prenderle. 

Di più su questi argomenti: