Il vero costo dell'intelligenza artificiale per la ricerca italiana

L'AI rischia di amplificare le differenze tra gli atenei ben finanziati che compreranno l'accesso ai migliori strumenti e quelli più fragili che resteranno indietro. L'importanza di costruire una piattaforma permanente per la scienza

25 GIU 26
Immagine di Il vero costo dell'intelligenza artificiale per la ricerca italiana

Foto di freestocks su Unsplash

La discussione pubblica sull’intelligenza artificiale continua a oscillare tra fascinazione e paura, tra entusiasmo promozionale e riflesso difensivo. Nel frattempo, nei laboratori, negli uffici dei ricercatori, nei gruppi che scrivono codice, analizzano dati, progettano esperimenti, leggono migliaia di articoli scientifici e cercano relazioni invisibili dentro archivi sempre più grandi, la trasformazione è già entrata nella pratica quotidiana. L’intelligenza artificiale generativa avanzata sta diventando una componente ordinaria del lavoro scientifico. Aiuta a implementare un’idea in codice, a esplorare una letteratura, a costruire pipeline di analisi, a controllare ipotesi alternative, a generare esperimenti computazionali preliminari, a interrogare basi di dati, a ridurre tempi morti che fino a pochi anni fa assorbivano settimane di lavoro. In alcuni casi sbaglia, e quindi va controllata. In altri accelera in modo impressionante ciò che un ricercatore competente avrebbe comunque fatto. La novità sta in questo punto: non sostituisce il giudizio scientifico, ma modifica il costo temporale e lo sforzo dell’esplorazione. Rende più economico tentare, confrontare, correggere, iterare. In ricerca, questa riduzione del costo dell’iterazione cambia la velocità con cui si arriva a una buona domanda.
Ora, una tecnologia che cambia il ritmo della ricerca non può essere trattata come un abbonamento individuale, lasciato alla carta di credito del singolo docente, al budget residuo di un dipartimento, alla generosità temporanea di un progetto PNRR o al contratto commerciale stipulato da un ateneo per dodici mesi. Quando una tecnologia diventa condizione per fare ricerca competitiva – ed è ben possibile che nel caso della AI questo apparirà sempre più chiaro - essa cambia categoria e diventa infrastruttura necessaria, a una scala che non è quella del singolo utente. Lo abbiamo capito per i sincrotroni, per i grandi telescopi, per gli acceleratori di particelle, per le biobanche, per i supercomputer, per le reti di sequenziamento genomico, per le piattaforme di microscopia avanzata. Nessuno pensa che l’accesso a queste risorse possa essere risolto con soluzioni improvvisate, intermittenti, affidate alla fortuna amministrativa del singolo gruppo. Si programmano investimenti pluriennali, si costruiscono consorzi, si negoziano quote di accesso, si finanziano tecnici, manutenzione, energia, formazione, aggiornamento. Con l’intelligenza artificiale siamo ancora nella fase in cui molti decisori pubblici la considerano un “software” come altri, senza rendersi conto della rapida trasformazione in atto e della scala della sua adozione in tantissimi settori diversi.
Abbiamo in Italia un centinaio di atenei, oltre sessantacinquemila docenti e un sistema pubblico di enti di ricerca che aggiunge migliaia di ricercatori e tecnologi. Se si immagina di garantire accesso istituzionale a strumenti avanzati di intelligenza artificiale anche solo al costo minimo di venti euro al mese per utente, applicato agli iscritti e ai docenti universitari, si arriva a budget annui insostenibili, nell’ordine del mezzo miliardo di euro. È una stima volutamente bassa, perché usa una soglia da abbonamento base, non un accesso intensivo da ricerca, e perché riduce la AI agli LLM, che sono solo una componente – e forse nemmeno la più utile – dell’ecosistema che sta sorgendo. Siccome però un sistema scientifico serio deve poter usare più famiglie di modelli, confrontarle, evitare dipendenze cieche da un solo fornitore e garantire accesso a strumenti specializzati per codice, testo, dati, immagini e modellistica, l’ordine di grandezza diventa facilmente superiore al miliardo annuo. E’ chiaro che a questo punto si tratta di capire se lo Stato intenda pagare ogni anno una rendita infrastrutturale a piattaforme estere, peraltro nelle mani di pochissimi privati, senza controllare davvero il calcolo, i dati, le condizioni di accesso, la continuità del servizio e l’evoluzione tecnologica.
Chi possiede quell’infrastruttura decide prezzi, limiti, priorità, condizioni d’uso, disponibilità dei modelli più potenti, tempi di aggiornamento, trattamento dei dati, possibilità di integrare strumenti locali, accesso alle funzioni sperimentali, compatibilità con normative nazionali ed europee. Sta sorgendo una nuova dipendenza scientifica, che passa anche dalla mancanza di capacità computazionale sotto controllo pubblico o almeno sotto controllo strategico europeo.
L’Italia parte in realtà da una posizione meno debole di quanto sembri. Il Tecnopolo di Bologna, Cineca, Leonardo, EuroHPC e la nuova AI Factory italiana indicano che una base esiste. La nuova infrastruttura IT4LIA, con un investimento dell’ordine di centinaia di milioni di euro e decine di migliaia di GPU, mostra che la scala minima di un intervento pubblico è già stata compresa almeno nel campo del supercalcolo. Il punto politico consiste nel completare il passaggio successivo: trasformare la potenza di calcolo in accesso nazionale continuativo a modelli, servizi, ambienti di sviluppo, strumenti di validazione, architetture di inferenza e piattaforme usabili dalla comunità scientifica. Un supercomputer che resta confinato alla logica tradizionale delle code di calcolo e dei progetti specialistici non basta, perché si richiede un’infrastruttura che funzioni anche come servizio quotidiano per tutti, un servizio che sia sicuro, tracciabile, documentato, accessibile ai laboratori, integrabile con dati pubblici e privati, capace di ospitare modelli aperti, modelli addestrati o riaddestrati su domini specifici, strumenti per la riproducibilità, ambienti per la didattica avanzata, procedure di audit e controlli sulla qualità delle risposte.
La via puramente commerciale ha difetti strutturali. Il primo è economico. Pagare abbonamenti individuali a milioni di utenti significa comprare accesso al dettaglio a una capacità che per definizione dovrebbe essere acquistata, gestita e ottimizzata all’ingrosso. Un’infrastruttura nazionale o europea consente invece di ammortizzare il capitale, usare modelli aperti dove bastano, riservare i modelli più costosi ai compiti che li richiedono davvero, sfruttare caching, batching, specializzazione per dominio, politiche di priorità e strumenti di controllo dei consumi. In una grande comunità scientifica, tutti gli utenti potenziali non consumano calcolo massimo nello stesso momento. La gestione centralizzata della capacità, se progettata bene, costa meno dell’acquisto disordinato di licenze e API, perché elimina duplicazioni, margini commerciali ripetuti e contratti separati stipulati da centinaia di amministrazioni con scarso potere negoziale. Il secondo difetto è scientifico. La ricerca richiede stabilità e continuità. Se un modello commerciale cambia comportamento da un giorno all’altro, se una funzione viene ritirata, se un limite di contesto viene modificato, se un prezzo d’uso cambia durante un progetto, la continuità del lavoro scientifico viene esposta a decisioni che stanno fuori dalla comunità scientifica. Per molte attività questo è tollerabile, ma non per la ricerca. Una pipeline che usa un modello per classificare testi, annotare immagini, generare codice, estrarre relazioni da letteratura scientifica o assistere una revisione sistematica deve poter essere ricostruita, verificata e documentata. La ricerca può usare strumenti commerciali, ma non può dipendere soltanto da strumenti opachi, mutevoli e governati da interessi che legittimamente rispondono agli azionisti, non alla robustezza epistemica del sistema pubblico della conoscenza.
Il terzo difetto è strategico. I dati della ricerca italiana comprendono informazioni biomediche, industriali, ambientali, amministrative, cliniche, genetiche, territoriali, culturali. Molti di questi dati non possono essere consegnati a piattaforme estere con la stessa disinvoltura con cui si carica un testo generico in una chat. Anche quando i contratti promettono protezioni adeguate, resta un punto di sovranità tecnologica: un paese che non controlla nessuna parte essenziale della propria infrastruttura cognitiva accetta che la propria capacità di ricerca sia regolata da infrastrutture altrui. Questa scelta può apparire comoda nel breve periodo, ma la storia delle infrastrutture scientifiche insegna che chi dipende sempre dalle macchine degli altri partecipa alla ricerca altrui, mentre chi costruisce le proprie macchine definisce anche le domande che diventeranno possibili.
Certo, si richiedono investimenti massicci, ma bisogna considerare la differenza tra comprare strumenti e costruire capacità. Nel primo caso il paese resta cliente, e, alla fine, paga di più non solo economicamente, ma in termini di dipendenza strategica. Nel secondo diventa parte dell’architettura che produce conoscenza. La ricerca italiana ha già pagato abbastanza la frammentazione delle infrastrutture, la lentezza degli acquisti, la dipendenza dai bandi temporanei, la discontinuità delle politiche pubbliche. L’intelligenza artificiale rischia di amplificare questi difetti. I gruppi forti, ben finanziati, internazionalizzati, compreranno accesso ai migliori strumenti. I gruppi più fragili resteranno indietro. Gli atenei più ricchi costruiranno contratti migliori. Gli altri useranno versioni limitate, discontinue, inadatte ai carichi reali di ricerca. La distanza tra chi può esplorare mille ipotesi e chi può permettersene dieci diventerà una nuova forma di diseguaglianza scientifica. Per questo la risposta deve essere nazionale, e insieme europea. L’Italia dovrebbe entrare in questa partita con un obiettivo concreto: non distribuire qualche accesso premium ai ricercatori, ma costruire una piattaforma permanente per la scienza assistita da intelligenza artificiale, con quote garantite per università ed enti pubblici di ricerca, accesso graduato per studenti, ambienti sicuri per dati sensibili, supporto tecnico, formazione, modelli documentati, procedure di validazione e una governance sottratta alla durata breve dei cicli elettorali.
La scienza moderna è sempre stata legata alle sue macchine. Il microscopio ha aperto il mondo cellulare, il sequenziamento ha trasformato la biologia, i grandi rivelatori hanno reso visibile l’infinitamente piccolo, i satelliti hanno cambiato la climatologia, i supercomputer hanno modificato la fisica, la meteorologia, la chimica computazionale, l’ingegneria. L’intelligenza artificiale aggiunge una macchina diversa, meno appariscente e più pervasiva: una macchina per accelerare connessioni, ipotesi, simulazioni, letture, confronti, correzioni. Lasciarla interamente nelle mani di fornitori esterni significherebbe affidare una parte crescente del metabolismo della ricerca a infrastrutture che il paese non controlla. L’Italia può scegliere di trattarla come un costo accessorio, distribuito in piccoli abbonamenti e contratti separati. Oppure può riconoscerla per ciò che è diventata: una nuova infrastruttura della conoscenza. Solo la seconda scelta permette di ridurre i costi nel tempo, difendere autonomia scientifica, proteggere i dati, rendere l’accesso equo e dare alla ricerca italiana la possibilità di restare dentro la frontiera, anziché guardarla da un’interfaccia concessa in licenza.