09 giugno 2021

Verso il linguaggio delle macchine, con il Progetto MOUSSE l’IA passa dalle parole ai concetti

  • Di Daniela Sessa

Intervista a Roberto Navigli, informatico esperto di linguistica computazionale che con BabelNet ha fornito un dizionario multilingue alle intelligenze artificiali

Vale, almeno per Roberto Navigli, informatico dell’Università La Sapienza, la frase di Noam Chomsky “Colorless green ideas sleep furiously” (le idee verdi incolori dormono furiosamente). Ineccepibile dal punto di vista sintattico, la frase era la dimostrazione di un assurdo semantico. Sull’incompatibilità tra sintassi e semantica, Roberto Navigli ha concentrato le sue ricerche che lo hanno portato a ottenere nel 2021, per il progetto MOUSSE (Multilingual Open-text Unified Syntax-independent SEmantics) il riconoscimento dall’European Research Council (ERC) come progetto che ha trasformato la scienza. Verso la linguistica, Navigli nutre una passione a distanza “senza la necessità di doverla padroneggiare. Mi sento come il cantante rock che deve studiare il pianoforte ma non deve essere necessariamente un pianista”.

Navigli, che vanta un curriculum prestigioso nel campo della ricerca sul Word Sense Disambiguation (risoluzione dell’ambiguità delle parole) e della linguistica computazionale è riuscito a ottenere dall’ERC due finanziamenti. Con il primo grant, in seno al progetto MultiJEDI (Multilingual Joint word sensE DI sambiguation) ha sviluppato un dizionario multimediale BabelNet, con 20 milioni di voci in 500 lingue, usato dagli esseri umani, per interpretare e tradurre testi, e dalle macchine per rappresentare il linguaggio come relazione di parole. Nel 2016, con il secondo grant ha creato lo spin off Babelscape, collegando il mondo della ricerca con quello dell’impresa.

Cos’è il MOUSSE? Come avviene la creazione di un linguaggio per disambiguazione?

Da 20 anni mi occupo di Word Sense Disambiguation (la disambiguazione dell’associazione delle parole) e per questo ho creato BabelNet un inventario di tutte le lingue del mondo disponibile per le macchine. Il dizionario è servito per l’attività di disambiguazione, cioè la ricezione di una parola in un dato contesto. Il passo successivo è passare dalla parola alla frase. L’associazione, tra due lingue, di una singola parola all’interno di frase non crea il significato complessivo della frase ma solo alcuni significati relativi alla sequenza di parole. Non si ha la rappresentazione strutturata del significato di una frase: con MOUSSE, che si concluderà nel 2022, sto lavorando proprio a questo. In inglese si chiama Semantic Parsing che è un po’ l’equivalente dell’analisi logica (ossia la sintassi) con il passaggio al versante semantico, per cui i collegamenti non sono più tra le parole ma tra i concetti. Nella frase “Ho suonato il piano a Milano” suonare è una parola ambigua: significa in questo caso che ho suonato uno strumento, come ambigua è piano. Sostituendo alle parole i concetti, i collegamenti non saranno sintattici ma semantici e la rappresentazione diventerà indipendente dalla lingua. Si genera un’interlingua, una sorta di iperuranio in cui i collegamenti astraggono dal modalità espressiva della lingua. In qualche modo è la cosa più vicina che possiamo pensare a una rappresentazione mentale di una frase

Semplificando: si passa dalla grammatica alla narrazione?

Potrebbe essere, tenendo conto che il parsing semantico si può applicare anche a notizie di giornale e a qualunque tipo di testo

Una lingua computazionale utile per lo studio delle lingue straniere e per le traduzioni, ma anche collegata all’Intelligenza Artificiale e alla creazione di androidi. L’androide diventa sempre più uomo?

Certamente. Sebbene, in realtà, non vengano replicati i meccanismi biologici ma il comportamento e la comprensione degli esseri umani. Il meccanismo è differente da quello naturale: è digitale e soprattutto non implica il concetto di coscienza. Nessuno sta cercando di rifare un cervello biologico. Di più, senza la parte biologica è da escludere ogni parallelismo tra macchina e l’uomo.

Ci sarà sempre la mano umana, lo scienziato e il suo algoritmo. Gli androidi non potranno mai diventare indipendenti se non nella fantasia?

Questo è difficile predirlo. Le faccio un esempio. Prendiamo una macchina anche non particolarmente intelligente ma programmata per essere il nemico dell’uomo: se il meccanismo è potente, la macchina può prendere il sopravvento, ma mai raggiungere l’intelligenza umana. Gli androidi sono meccanismi digitali, sequenze di calcoli. Non escluderei, però, che ciò possa accadere, alla luce della velocità del progresso. In più ci sono aziende del web o Big Tech che spendono miliardi per la ricerca.

Diversamente dalla scienza, le aziende hanno solo un’etica che è solo del profitto. A cosa servono gli studi informatici sul linguaggio alle imprese che investono?

Le porto la mia esperienza personale. Ho la mentalità del ricercatore ma ho anche fondato Babelscape. L’obiettivo di un ricercatore è progredire nella conoscenza umana, superarne i limiti. In questo caso specifico vuol dire cercare di capire qual è e se esiste una sorta di linguaggio universale espresso a mediante concetti e sottostante a tutte le lingue. Dal punto di vista scientifico è chiaro che vogliamo unificare e ottenere il Sacro Graal del linguaggio, la soluzione dell’enigma del linguaggio. Dal punto di vista industriale sicuramente le aziende hanno un enorme beneficio dalla rappresentazione semantica dei contenuti. Se riesco ad astrarre da una lingua, come azienda fornisco gli stessi contenuti a tutto il mondo e riesco a moltiplicare il mio business premendo un bottone.

Quindi un software è più vantaggioso economicamente dell’oggetto androide, seppur autonomo nel linguaggio?

Prendiamo un robot. Che si muova o meno non è particolarmente importante. Ma immaginiamo che voglia farlo cucinare e che gli detti le istruzioni. Con le istruzioni in questa iperlingua, potrei commercializzare il robot in tutto il mondo: il piatto cucinato non dipenderà dalla forma in cui l’utente l’ha richiesto, in quanto la preparazione è avvenuta in una lingua che sostanzialmente non esiste.

Un linguaggio condiviso per gli androidi di tutto il mondo potrebbe diventare un problema politico a livello globale?

Potrebbe, ma non è un problema dello scienziato. E’ un po’ come Internet, buono e cattivo nello sesso tempo. Non averlo vuol dire non cadere nelle trappole della rete, averlo permette di velocizzare il progresso, di vivere e lavorare durante una pandemia. Il mezzo è neutro. Oggi abbiamo mezzi di traduzione automatica che funzionano meglio di 10/15 anni fa, ma se trovare una lingua, da utilizzare come chiave di volta di tutte le altre, possa avere conseguenze politiche, per noi ricercatori è un non problema.

Perché non ha fatto il linguista ma è diventato uno scienziato informatico?

Intanto, perché a 9 anni mi sono innamorato dell’informatica e già a 10 anni programmavo. Ho l’informatica nel DNA. La linguistica affronta lo studio della lingua in un modo completamente diverso dal mio: la linguistica cerca di modellare la lingua dall’alto con il procedimento top down, invece l’informatico procede bottom up ovvero dal niente cerca di costruire qualcosa fase per fase. Quando parlo con i linguisti, mi sento un elefante dentro una cristalleria e questa cosa mi diverte. L’informatica mi permette di essere dirompente, libero da stereotipi o imposizioni di regole.

Condividi sui Social

Ultimo numero Civilità della Macchine

La Rivista - Civiltà delle Macchine

Maggio 2021

Per ricostruire il paese serve un nuovo rapporto tra testa e mani. Per far ciò è necessario superare il gap formativo esistente tra le competenze scientifiche e quelle umanistiche. Il secondo numero del 2021 di Civiltà delle Macchine è dedicato alle prospettive che si aprirebbero con una trasformazione degli istituti tecnici in licei tecnologici, strumenti fondamentali per il perseguimento di un nuovo umanesimo digitale. Sono intervenuti, tra gli altri, Danco Singer, Marianna Madia, Barbara Frandino, Luciano Floridi, Paolo Crepet, Francesco Palmieri e Antonio Manzini.

Sistema Museale

Il Sistema Museale Integrato si presenta quale realtà unica in Italia comprendente musei, archivi storici e altre realtà espositive proprietà di Leonardo, con l’obiettivo di valorizzare e comunicare la memoria storica e tecnologica del Gruppo.

Con il patrimonio industriale che custodiscono, i Musei e gli Archivi vogliono essere un punto di riferimento culturale per rafforzare l’identità di Gruppo e promuoverla come valore all’esterno.

Il Sistema Museale intende diffondere quell’evoluzione tecnologica che è parte del presente e soprattutto del nostro futuro. Promossi da volontari e seniores, per rivolgersi in particolar modo ai giovani, i musei e gli archivi sono strumenti per la permanenza di una storia nella società, conservandone e tramandandone i valori. Come ponti immaginari da attraversare, qui si racconta quel progresso di cui, ancora oggi, Leonardo è protagonista.

Leggi Tutto
Copyright © 2019 Leonardo S.p.A. Privacy & Cookie Policy