Foto di Siemens PLM Software via Flickr

Ciao ciao traduttori. Grazie all'intelligenza artificiale Google Translate sta diventando perfetto

Antonio Grizzuti

Perché l'obiettivo di colmare il divario tra la traduzione umana e quella effettuata dal software è ora stato (quasi) raggiunto

Non è certamente un caso se all’inizio del Vangelo di Giovanni si parla di Dio come logos, cioè Verbo, Parola, e se uno dei doni dello Spirito Santo è la capacità di parlare le altre lingue. Comprendere l’altro ed essere compresi dall’altro è infatti da sempre uno dei desideri dell'uomo. Un desiderio ripreso nel secolo scorso dalla fantascienza sia in letteratura che nel piccolo e grande schermo, spesso profeta di scoperte e invenzioni poi effettivamente destinate a realizzarsi. Come non pensare al traduttore universale presente a più riprese nella saga cult di Star Trek – prima come una sorta di microfono e poi sempre più simile a un palmare; oppure a Babel fish, dalle sembianze di un piccolo uccellino giallo che si infila nell’orecchio, narrato nella serie Guida galattica per gli autostoppisti di Douglas Adams.

 

In questo campo, come del resto in tanti altri, la realtà si sta velocemente approssimando all’immaginazione. Di traduttori online ne esistono a decine, ma il più gettonato di tutti è senz’altro Google Translate, che ha compiuto da poco dieci anni e che vanta 500 milioni di utenti, 103 lingue disponibili e 100 miliardi di parole tradotte al giorno. Ai più è probabilmente sfuggito che a settembre dello scorso anno il servizio di traduzione è passato dal sistema tradizionale phrase-based – nel quale il software spezzettava il periodo cercando la migliore corrispondenza con i termini presenti nel dizionario – ad un nuovo metodo chiamato Google Machine Neural Translation (GMNT) basato sull’intelligenza artificiale e capace di abbattere fino all’80 per cento gli errori commessi nella traduzione con il precedente algoritmo. Nei test di accuratezza della traduzione svolti da Google, Translate arriva a 5.43/6 (dove 6 è la perfezione) da inglese a spagnolo – il punteggio medio per i traduttori umani è 5.50 – mentre da inglese a cinese la media è 4.30 – contro i 4.60 umani. L’obiettivo che si ponevano gli sviluppatori – colmare il divario tra la traduzione umana e quella effettuata dal software – si può dire raggiunto.

 

Ma Google Translate si è spinto oltre. Un paio di mesi dopo l’introduzione del nuovo sistema i ricercatori di Google hanno pubblicato un paper nel quale si evidenzia un vantaggio inizialmente non previsto che viene definito zero-shot translation. In parole povere si è osservato che il software nel tradurre due coppie diversi di linguaggi – ad esempio Italiano-Inglese e Inglese-Spagnolo – ha tratto benefici nella traduzione Italiano-Spagnolo senza che il sistema fosse preventivamente istruito in merito (zero-shot appunto). Detto più semplicemente, se il sistema sa che cane si traduce ‘dog’ in inglese e ‘dog’ si traduce ‘perro’ in spagnolo, quando si troverà a tradurre ‘cane’ in spagnolo saprà già che la traduzione corretta è ‘perro’, utilizzando perciò il percorso logico più veloce.

La domanda che ha scatenato la curiosità tra gli esperti del campo – e non solo – è pero contenuta nel post del blog di Google a margine della pubblicazione, e riguarda il meccanismo grazie al quale questo percorso viene creato. I ricercatori si domandano infatti se così facendo il sistema non abbia fatto in realtà ricorso a ciò che viene definito interlingua, un linguaggio ponte nel quale i significati dei termini sono univoci a prescindere dalla lingua nella quale vengono espressi. Un meccanismo più vicino all’astrazione e alla formazione dell’idea e perciò strettamente legato all’ambito umano, osservano alcuni commentatori. Ovviamente non è dato sapere fin dove si spingerà la capacità di inferenza del GMNT ma il caso di Google Translate è l’ennesima dimostrazione che quando si ha a che fare con intelligenza artificiale e machine learning le sorprese non mancano mai.

Di più su questi argomenti: