Con AlphaGo l'intelligenza artificiale prova a trovare forme nuove di conoscenza

Antonio Grizzuti 26 nov 2017

Il ceo di DeepMind, Demis Hassabis, ritiene che la capacità di incamerare dati e rielaborarli del software possa essere applicata potenzialmente a tutti i settori della conoscenza

Quando il gioco si fa duro quelli di DeepMind iniziano a giocare. La sussidiaria di Alphabet specializzata nel ramo dell’intelligenza artificiale investe da anni ingenti risorse nel campo dei giochi di strategia con un duplice obiettivo. Se da un lato il gioco rappresenta infatti un prezioso viatico per insegnare alle macchine a “pensare” come gli esseri umani, d’altro canto esso rappresenta una possibilità per iniziare a capire come ragionare le macchine. Il gioco giapponese del go è considerato da tempo un’ottima fucina per lo sviluppo di software basati sull’intelligenza artificiale. Originario della Cina, dove è nato ben tremila anni fa, il go spopola in Asia ma negli ultimi tempi è sbarcato anche in occidente. Due giocatori si affrontano muovendo alternativamente pedine nere e bianche su una scacchiera (goban) composta da un reticolo 19 x 19. Lo scopo è controllare una zona di goban maggiore rispetto a quella dell’avversario. Un proverbio coreano recita che nessuna partita di go è mai stata giocata due volte, eventualità verosimile dal momento che esiste un numero di combinazioni di gran lunga maggiore degli atomi presenti nel nostro universo.

La storia di AlphaGo, il software elaborato da DeepMind per competere ad alto livello, inizia nel 2015. Nel primo match ufficiale disputato contro il pluricampione europeo della disciplina Fan Hui, AlphaGo vinse cinque a zero. Era la prima volta che un computer batteva un giocatore professionista. Nel match disputato l’anno successivo, AlphaGo giocò una serie di mosse talmente inedite da rimettere in discussione centinaia di anni di strategia. Lo scorso gennaio DeepMind rivelò che dietro al nickname ‘Master’ – misterioso giocatore protagonista di una striscia di sessanta vittorie consecutive – c’era appunto AlphaGo.

Il meglio però doveva ancora venire. Fino a quel momento il software era riuscito a raggiungere livelli di abilità tali da fargli battere giocatori del calibro di Lee Sedol, diciotto volte campione del mondo, grazie a una lunga “gavetta” di incontri disputati con esseri umani. Il suo successore, AlphaGo Zero, è invece capace di imparare il gioco senza che prima gli venga fornita alcuna conoscenza preliminare (from scratch) e si allena semplicemente sfidando sé stesso. Dopo tre soli giorni, AlphaGo Zero è riuscito a superare in abilità il programma che ha battuto Sedol, dopo ventuno giorni a uguagliare Master e al quarantesimo giorno ha superato tutte le precedenti versioni di AlphaGo, diventando il miglior giocatore di go al mondo. Il tutto – ci tengono a precisare a DeepMind – senza alcun intervento umano e senza avere a disposizione la minima base dati.

Com’è stato possibile polverizzare migliaia di anni di conoscenze nell’arco di un periodo così limitato? La risposta è un mix tra biologia e ingegneria informatica. L’apprendimento per rinforzo è una tecnica mutuata dalla psicologia comportamentale e mira a realizzare algoritmi capaci di apprendere e adattarsi alle mutazioni dell’ambiente. Se l’agente (in questo caso AlphaGo Zero) realizza il suo obiettivo, nel caso specifico vincere una partita, viene ricompensato con un punteggio positivo, diversamente viene penalizzato. Un meccanismo simile a quello del cane che durante l’addestramento viene premiato con la crocchetta. Il risultato è amplificato dall’utilizzo di reti neurali, modelli matematici progettati per mimare il funzionamento dei neuroni umani.

Algoritmi per problemi complessi

Il ceo di DeepMind, Demis Hassabis, ritiene che questa modalità possa essere applicata potenzialmente a tutti i settori della conoscenza. “Vogliamo sfruttare algoritmi come questo per risolvere problemi complessi del mondo reale come il ripiegamento delle proteine o la progettazione di nuovi materiali”, ha detto.

Braden Allenby, docente di ingegneria ambientale presso l’Arizona State University ed esperto di tecnologia, dice al Foglio che “il vertiginoso incremento delle capacità cognitive ottenuto negli ultimi anni suggerisce che l’intelligenza artificiale possa trovarsi in una fase di decollo, dove i miglioramenti graduali lasciano spazio a progressi rapidi, imprevedibili e poderosi”. “AlphaGo Zero – conlcude Allenby – indica anche che l’intelligenza artificiale non è semplicemente l’amplificazione di capacità cognitive umane, ma uno strumento che potrebbe condurre verso una forma di conoscenza totalmente originale”.

Di più su questi argomenti:

Con AlphaGo l'intelligenza artificiale prova a trovare forme nuove di conoscenza

Dall'origine dei robot all'AI. Così il teatro ha rappresentato il nostro rapporto con le macchine, aiutandoci a governarlo

Un'AI che parla con i nostri genitori anziani: altro che “Black Mirror”

L'algoritmo non sa aprirsi all'inatteso. Noi umani invece, con i nostri errori… Parla Telmo Pievani