(foto di Andrea De Santis su Unsplash)

L'AI mirata. C'è spazio per gli Small Language Model

Marco Gambaro

Un motore più piccolo affinato attentamente su dati di settore e aziendali può avere prestazioni paragonabili ai grandi modelli e soprattutto non sempre inferiori. Questo riapre lo spazio per operatori europei e italiani e per quei vantaggi di differenziazione ottenuti allenando i modelli su lingue e competenze specifiche

Da quando nel novembre 2022 è stato presentato ChatGPT c’è stato un rincorrersi di innovazioni e di prestazioni dei Large Language Model, con numeri di parametri, richieste di processori grafici, consumo di energia e tempi di training crescenti. Questa dinamica ha interagito con una grande attenzione dei media che hanno enfatizzato i modelli di volta in volta di punta come in una gara sportiva. In effetti si tratta di una tipica corsa all’innovazione, come lo sono state l’invenzione del telefono o dell’elettricità, dopo che il mercato delle piattaforme digitali si è sviluppato secondo una logica che ha visto emergere un solo leader per ogni settore.

 

Il mercato dell’intelligenza artificiale sembra avere delle grandi prospettive anche se è solo agli inizi e viene utilizzata in modo sostanziale da meno del 50 per cento delle aziende, che viene considerata la soglia per innescare trasformazioni di sistema per le General Purpose Technology. In effetti gli ingredienti sembrerebbero puntare verso un mercato modello highlander dove ne resterà uno solo. I costi sostanziali stanno nella messa a punto del software, nel training iniziale e nella potenza di calcolo necessaria, tutti costi fissi, non collegati al numero di utilizzatori e la concorrenza si svolge a costi fissi endogeni, cioè man mano crescono le prospettive di mercato crescono gli investimenti per fare prodotti migliori. Nel 2025 le prime quattro piattaforme hanno pianificato investimenti per 300 milioni in AI in crescita del 50 per cento rispetto ai 200 dell’anno scorso.

 

Per gli inseguitori europei sembra esserci poco spazio: la tedesca Aleph Alpha e la francese Mistral sono sì unicorni, con oltre 1 miliardo di capitalizzazione, ma sono più piccole e sono in grado di effettuare minori investimenti rispetto alle grandi piattaforme. La stessa Open AI è in tensione finanziaria perché i suoi ricavi non riescono a coprire i 7-10 miliardi che spende ogni anno  e si ritrova a effettuare ripetuti  round di finanziamento.

 

Eppure secondo molti esiste uno spazio significativo per gli Small Language Model e, dal punto di vista economico, il mercato non sembra convergere verso un’unica leadership.  Microsoft con Copilot, Google con Gemini, Meta con Llama, ma anche Amazon,  offrono servizi di intelligenza artificiale sul mercato, ma soprattutto usano i risultati dei loro investimenti per migliorare la produttività delle loro attività principali. Essendo integrate verticalmente e avendo grandi business digitali molto sviluppati, si ritrovano con un mercato interno per le soluzioni di AI che costituisce una massa critica per le economie di rete e fa sì che nel breve periodo oscillazioni del successo di mercato non mettano a rischio gli investimenti di AI. Difficilmente queste aziende usciranno dal mercato dell’intelligenza artificiale perché anche il loro business principale ne sarebbe compromesso. 

 

Il lancio di DeepSeek R1 nel gennaio 2025 ha reso evidente il prezzo della differenziazione del prodotto negli LLM di punta. Il modello cinese ha 700 miliardi di parametri e ha dichiarato di non aver usato i chip di punta Nvidia A100 e soprattutto di aver speso 6 milioni per l’addestramento. Anche se stime riportate dal Guardian posizionano i costi di addestramento a 500 milioni, si tratta pur sempre di 10-30 volte di meno rispetto ai modelli concorrenti. L’impatto sulle  quotazioni degli atri protagonisti del mercato AI è stato sostanziale con cali significativi delle quotazioni azionarie. E’ come quando lo sviluppo di Ikea o Decathlon, due famose alternative discount, rendono evidente quanto costa la differenziazione dei prodotti di punta nell’arredamento o nell’abbigliamento sportivo.
Inoltre quello dell’intelligenza artificiale è un mercato molto diversificato, dove convivono servizi differenti e dove le aziende clienti hanno bisogno di servizi specifici adatti al loro settore, al loro prodotto e al loro modello di business. Quindi i grandi LLM devono poi prevedere un percorso di fine tuning, talvolta con i dati aziendali per adattarsi alle specificità dei clienti. Questa caratteristica del mercato rende probabile una pluralità di leader e allo stesso tempo apre lo spazio agli Small Language Model. Infatti non necessariamente un’azienda meccanica che adotta soluzioni basate su LLM ha bisogno di training su settori molto lontani, anzi talvolta questi favoriscono le “allucinazioni”.

 

Un motore più piccolo affinato attentamente su dati di settore e aziendali può avere, in quel contesto, prestazioni paragonabili ai grandi modelli e soprattutto non sempre inferiori. Questo riapre lo spazio per operatori europei e italiani e per quei vantaggi di differenziazione ottenuti allenando i modelli su lingue e competenze specifiche. In questo contesto anche prodotti come Minerva, un LLM sviluppato dai ricercatori della Sapienza che ha per il momento 7 miliardi di parametri, ma ha effettuato il training prevalentemente su materiale in italiano, può avere un ruolo. 
Per introdurre applicazioni vere nelle aziende occorrono operatori in grado di ragionare sui processi concreti, sul collegamento con i dati aziendali e soprattutto con la capacità di guidare le aziende nell’adottare nuovi modi di fare le cose in funzione delle possibilità offerte dall’AI, ad esempio lungo la dimensione previsione/decisione. Questa necessità potrebbe modificare in prospettiva anche l’articolazione verticale dell’offerta di intelligenza artificiale. All’inizio prevalgono i produttori del cuore, ma se in quello strato del mercato c’è concorrenza, come ha insegnato l’informatica, nel tempo il focus si sposta su chi è posizionato nell’ultimo miglio vicino ai clienti.

Di più su questi argomenti: