Embible e Verbit, i sopravvissuti e i Rotoli del Mar Morto

È recente l’approvazione da parte del Parlamento europeo del regolamento dedicato alla protezione di diritti fondamentali, democrazia e sostenibilità ambientale, in un momento in cui si sta diffondendo il timore che l’Intelligenza Artificiale possa mettere gli stessi in pericolo.
Il tentativo di promuovere l’innovazione e assicurare all’Europa un ruolo di guida in merito forse ignora come l’ebraismo da tempo dibatta di temi analoghi: può essere considerata come prima antichissima fonte testuale il passo dalla letteratura rabbinica in cui si discute se l’utilizzo della voce debba essere considerato un’azione. Oggi nel mondo ebraico ci si chiede come utilizzare l’IA in maniera coerente con l’halakha, e la possibilità di sfruttare i comandi vocali è uno dei temi più caldi. Il dibattito è aperto, non ci sono veti a priori, nessuna paura, e l’intelligenza artificiale sta dando risultati importanti. In Israele, in particolare, è dal 1947, anno del loro rinvenimento, che si cerca di decifrare i Rotoli del Mar Morto, manoscritti antichi di circa 2 mila anni. Un obiettivo ritenuto impossibile. Grazie però a quattro studenti del Dipartimento di Ingegneria del Software e dei Sistemi Informativi dell’Università Ben-Gurion del Negev che hanno sviluppato un nuovo sistema di intelligenza artificiale basato sul Masked Language Modeling – parole mascherate in modo casuale – la soluzione oggi è più vicina. Lavorando sui frammenti integri per insegnare al sistema a ricavare le parole mancanti in una frase o per decifrare il testo di scritte troppo rovinate in ebraico e aramaico, Itay Asraf, Niv Fono, Eldar Karol e Harel Moshayof sono arrivati a un processo simile a quello utilizzato dall’IA per comprendere e ri-creare il linguaggio umano. A partire da modelli linguistici compatibili con l’ebraico moderno, hanno iniziato ad addestrare l’algoritmo a capire le richieste per poi creare un modello basato sull’ebraico antico. Hanno utilizzato anche i testi aramaici, più rari. La piattaforma sfrutta soprattutto le 22.144 frasi del testo biblico che sono diventate la base di Embible, definito dalla Ben Gurion University «il primo tentativo di applicare l’approccio dei modelli linguistici mascherati (MLM) alle iscrizioni danneggiate in ebraico e aramaico». Si chiama invece Verbit la start-up che utilizza l’intelligenza artificiale per trascrivere le testimonianze dei sopravvissuti alla Shoah. Per addestrare la piattaforma di riconoscimento vocale automatico è stata utilizzata una raccolta di termini pertinenti, specifici, utili soprattutto quando le registrazioni sono di sopravvissuti che utilizzano lingue e accenti diversi. La collaborazione con la Claims Conference, impegnata da decenni nei negoziati per la restituzione di proprietà sottratte dai nazisti, ha portato per ora alla trascrizione di più di 400 mila minuti di testimonianze, ma l’obiettivo è di coprire tutti gli 8 milioni di minuti registrati. Secondo Yair Amsterdam, ceo di Verbit, «è della massima importanza documentare la storia e rendere tutto accessibile, per garantire che quanto è stato non si ripeta». Le trascrizioni di 150mila minuti di registrazioni, provenienti dallo Yad Vashem, sono ora depositate alla Biblioteca Nazionale di Israele. È stato necessario sviluppare nuove tecnologie per riuscire a eliminare il rumore di fondo, che, spiega Amsterdam, «rendeva le trascrizioni con l’IA quasi impossibili, e il risultato ha portato alla creazione di un patrimonio unico, grazie al quale la Memoria della Shoah è ora al sicuro».

a.t.