LINGUAGGI Dal Talmud alle macchine parlanti

pe-bozzi I toni pacati e la voce misurata di Andrea Bozzi non nascondono la sua determinazione impressionante né la passione che lo anima. Studioso di linguistica computazionale, capace di dare lustro all’Italia con le sue ricerche, è stato docente all’Università di Pisa, consulente dei ministeri sia dell’Istruzione che dei Beni culturali, responsabile di diversi incarichi al Consiglio Nazionale delle Ricerche (Cnr) e autore di numerose pubblicazioni nonché coordinatore di ricerche internazionali, e membro della Società Dantesca Italiana. La linguistica computazionale è nata negli anni Cinquanta, con il primo scopo di utilizzare i calcolatori elettronici per la memorizzazione e per l’elaborazione di dati testuali, in modo da produrre indici di parole e di concordanze, ossia indici in cui, oltre alle singole forme linguistiche, compaiano i contesti ove ciascuna di esse è presente. L’Istituto di Linguistica Computazionale “Antonio Zampolli” (ILC), nato in seno al Cnr nel 1979, è stato diretto fino al 2013 dal professor Bozzi, ora noto per il suo ruolo nella traduzione italiana del Talmud Babilonese. Il progetto, nato da un’intesa tra Unione delle Comunità Ebraiche Italiane, Collegio Rabbinico Italiano, Presidenza del Consiglio dei Ministri, Miur e Cnr ha in Andrea Bozzi il responsabile scientifico di una parte fondamentale del lavoro: l’Istituto di Linguistica Computazionale ha sviluppato l’applicazione che supporta il lavoro di traduzione. “In pratica si tratta di un sistema web collaborativo che permette non solo di usufruire di strumenti di indicizzazione, ma anche di inserire commenti ed effettuare ricerche complesse, oltre a fornire suggerimenti alla traduzione”.

Detto così sembra una cosa semplice. Lo è stata?

No, affatto, ma non si è trattato neppure di una missione impossibile: il nostro campo di ricerca consente di indagare il testo da un’angolatura diversa da quella delle discipline linguistiche tradizionali. Lo sviluppo di software, la progettazione di sistemi di intelligenza artificiale e l’utilizzo appropriato di metodi statistici offrono la possibilità di formulare modelli teorici utili per affrontare, con nuovi strumenti di indagine, campi complessi. Negli anni Settanta i sistemi che avevamo erano in grado di comprendere solo concetti base, ora siamo in grado di lavorare sul significato di una parola e sul contesto semantico in cui è utilizzata. Si arriverà alla possibilità di tradurre in modo automatico e simultaneo da una lingua all’altra con lievissimi margini di errore.

I traduttori diventeranno superflui?

Al contrario, il nostro lavoro è impossibile senza i traduttori. Prendiamo il caso del Talmud: si tratta del primo modello di questo genere in Italia, diventato una vera e propria infrastruttura per la traduzione di testi di particolare difficoltà interpretativa. È un sistema che deve essere formato, possiamo dire che sono i traduttori a dovergli insegnare a lavorare. È un sistema che apprende dagli errori e per diventare più preciso, necessita di un periodo di apprendimento. Che possiamo dire sia stato sostanzialmente completato.

Quale è stato il problema principale?

Quando cinquanta persone – traduttori esperti, traduttori in formazione, istruttori, redattori e curatori – si trovano a lavorare su un testo vasto e complesso come il Talmud si rischia di avere una notevole disomogeneità interpretativa di passi simili, o addirittura identici. È necessario ovviare a questo problema, ma anche rendere più snello tutto il processo: il sistema memorizza le traduzioni che vengono via via registrate dai diversi traduttori, cosicché quando una stessa espressione è presente in un altro passo, il traduttore che vi sta lavorando in quel momento visualizzerà quanto già inserito.

Può dirsi soddisfatto?

Sono molto colpito dall’accoglienza che ha avuto il trattato di Rosh Ha- Shanà pubblicato da Giuntina, andato esaurito in pochissimo tempo e già ristampato più volte. Sono in lavorazione molti volumi, e alcuni trattati sono davvero a buon punto, penso entrambe le cose siano testimonianze della qualità del lavoro fatto.

La grande esperienza che avete accumulato negli anni vi ha certamente aiutati, o no?

Nel 2003 abbiamo finanziato, con fondi europei, il primo convegno internazionale sulle applicazioni della filologia computazionale, ma già nel triennio 1994-97 eravamo il primo partner italiano nell’ambito del terzo Programma quadro della Commissione europea nel settore delle applicazioni computazionali informatiche alle biblioteche e archivi, col progetto BAMBI, ossia “Better Access to Manuscripts and Browsing of Images”, per l’utilizzo accademico dei documenti digitali. Poi è venuta la partecipazione al progetto francese PLAO, “poste de lecture assiste par l’ordinateur”, ma bocciarono il BAMBI2 perchè il nostro istituto stava prendendo una miriade di progetti nel language engineering.

Language engineering?

Sì, l’ingegneria delle lingue è uno sbocco per chi si è laureato e poi addottorato in linguistica computazionale, che può andare a lavorare in ambito industriale. Gli strumenti che agevolano lo scambio di informazioni nel mondo digitale mediante il linguaggio – che è sempre stato e resta lo strumento principe della comunicazione umana – sono anche in grado di semplificare la comunicazione fra uomini e macchine.

Esistono applicazioni concrete?

Sono settori ormai diffusissimi, a partire, per esempio, dalla robotica intelligente: la linguistica computazionale serve a far sì che un robot che riceve un’istruzione sappia analizzare e quindi comprendere la voce umana, la cosiddetta lingua naturale. Per trasformare in algoritmi le regole linguistiche oltre ovviamente ai linguisti servono ingegneri e informatici, e spesso si tratta di strumenti multilingue, basati su dizionari o elementi di pattern sintattici in grado di riconoscere l’equivalenza sintattica di una frase fra lingue diverse. Il problema del multilinguismo è considerato superato ma non siamo ancora arrivati a una situazione stabile anche se i progressi sono sicuramente molto avanzati.

Gli italiani sono i più bravi?

Negli Stati Uniti sono soprattutto le grandi industrie, come Google, che stanno portando avanti il lavoro con tecniche innovative, che uniscono a statistica e analisi stocastica delle frasi. Hanno loro la leadership, e hanno bilanci talmente elevati che possono permettersi di assoldare persone che noi negli enti pubblici di ricerca non possiamo neppure sognarci. E da loro i linguisti riescono a continuare le ricerche su cui si sono formati. Ma in Italia abbiamo dei centri di altissima specializzazione.

Che lavorano bene, quindi.

Purtroppo c’è stata una grande contrazione dei finanziamenti, mentre altrove sanno cosa vuol dire investire nella ricerca! Per esempio in Germania un singolo istituto, d’eccellenza, riceve un finanziamento superiore a quello che il ministero riesca a dare alla totalità delle università italiane. E lì uno studioso può ottenere di continuare la propria attività di ricerca solo se è valida, ed è valida solo per merito, il lavoro viene giudicato da altri scienziati. Se la valutazione è positiva si ottiene un laboratorio, costruito apposta, mezzi per assoldare persone utili per gli sviluppi della ricerca. In Italia abbiamo personealtrettanto competenti, ma non hanno le opportunità che hanno all’estero.

Mancano i soldi, in sostanza?

La linguistica e la filologia computazionale applicata sono poco permeabili all’industria privata, ci sono pochi guadagni, un’utenza ridotta. La robotica è diventata un mercato, ma se un uomo di cultura volesse eseguire una traduzione moderna o una traduzione critica moderna non andrà dall’industria, che può mettergli a disposizione gli applicativi, ma verrà dagli studiosi.

Cioè da lei?

Non necessariamente, ma siamo pochi: io in particolare mi sono cercato un argomento di nicchia, per scelta, di cui ci occupiamo in pochi, in tutto il mondo. Interessantissimo all’ILC è anche il lavoro del laboratorio di Fisiologia della comunicazione, nel quale le ricerche utilizzano il computer come se fosse un cervello artificiale. Lo studio in questo caso si concentra sulle facoltà linguistiche e comunicative umane, e sull’interazione tra lingua e funzionamento del cervello e delle sue componenti. Sembrano campi molto specialistici, ma i risultati delle ricerche hanno ricadute sulla vita di tutti.

Un lavoro molto specialistico.

Certo, come si può vedere nella raccolta di studi che ho curato (Digital Texts, Transalation, Lexicons in a Multi-Modular Web Application) i progetti che seguiamo sono sicuramente di nicchia, ma lavorare sulla traduzione araba di Plotino, per / P5 www.moked.it esempio, permette di ragionare sullo sforzo necessario a tradurre i principi astratti in una lingua e in una cultura totalmente differente, molto successiva. Guido Mensching, che è filologo romanzo e linguista raffinatissimo, ha lavorato sulla necessità di comprendere lo sforzo interpretativo: il filosofo arabo è stato costretto a introdurre nella traduzione una varietà notevole di frasi aggiuntive. In pratica è stata la lingua che aveva a disposizione a modificare il suo approccio.

Ossia le lingue sono capaci di condizionare il modo di pensare?

Assolutamente. Nei testi italiani antichi la scelta di varianti tramandate da codici diversi potrebbe essere stata fatta sull’analisi sintattica più che lessicale o morfologica. È come se la sintassi mi aiutasse a scegliere fra più lezioni. Spesso siamo veramente schiavi delle strutture linguistiche: uno sviluppo diacronico lungo talvolta secoli, come il passaggio dal latino all’italiano per esempio, può aver determinato degli elementi strutturali non solo dal punto di vista semantico, ma anche una deriva sintattica che poi obbliga a valutare attentamente sia quando che come e perché si traduce, che come si traduce.

La lingua che parliamo condiziona il nostro modo di pensare?

Esatto: la lingua è un condizionamento fortissimo. I filosofi del linguaggio sostengono da tempo che noi pensiamo in relazione alla lingua che adoperiamo. È come se fosse la lingua che ci obbliga a pensare in un determinato modo, cosa che sostengono anche i neurologi, e gli sviluppi della neurolinguistica. Lo diceva già il filosofo Josè Ortega y Gasset, che specificava che le lingue sono sostanzialmente intraducibili, ognuno è schiavo dei significati che la propria lingua veicola.

E per il Talmud?

Il problema è lo stesso: se andiamo a prendere il volume pubblicato da Giuntina e leggiamo solo le parti in neretto abbiamo un testo di difficilissima comprensione, a meno che il lettore sia uno studioso del Talmud, e possegga quel codice linguistico che si è sviluppato nel corso di secoli. Da quando qualcuno si è messo a decodificare le tavole della legge, ha tramandato e trascritto osservazioni, e iniziato a elaborare principi, e leggi, per arrivare a quei commenti che sono poi un grandioso ipertesto che dura da migliaia di anni. Nelle pagine si entra nel dettaglio di quelle osservazioni e discussioni tra persone che sostanzialmente rappresentavano accademie talmudiche. È un ambiente accademico anche quello. È vero che la legge doveva valere per tutti, ma in effetti chi andava a discutere una legge o chi commentava Rashi doveva avere gli strumenti per farlo, doveva avere un codice.

Una sorta di linguaggio comune che permette la lettura del Talmud?

Sì. Ma questo è tipico anche del linguaggio della poesia. Chi non ha dimestichezza nel leggere poesie farà fatica a leggere per esempio Zanzotto, ma anche Montale, o Nuzzi. Io per esempio leggo tanta saggistica, romanzi, ma poca poesia… ed è grande la fatica che faccio per godere di un testo poetico che non sia quello che ho studiato al liceo. La poesia ha un suo codice, un linguaggio specifico, perché non dovrebbe averne uno anche il Talmud? Ha una sua ragione d’essere: se metto in discussione il testo devo essere uno specialista, devo possedere il codice. Conoscere la cultura ebraica, conoscerne i meccanismi, le regole che sottostanno al testo. E proprio qui sta l’importanza dei traduttori, che devono essere esperti, e che hanno dovuto inserire delle parti aggiuntive. Continuando così una sorta di dialogo lungo secoli.

Quindi capire è possibile, anche se si affronta il Talmud?

Bisogna abituare il cervello, allenarlo. Se uno non legge mai altro che fumetti, per esempio, i mediatori linguistici più bravi possono dargli una grande traduzione del Talmud, ma è difficile che la possa gustare davvero. Non perché i fumetti necessitino di un codice necessariamente più semplice, ma perché è un codice differente. Quando la mediazione linguistica è ben fatta, una persona curiosa può superare le difficoltà. Se poi si sono studiate le lingue classiche si parte avvantaggiati, è quella una ginnastica culturale utile per affrontare qualunque tipo di lettura, che offre strumenti interpretativi anche per comprendere altre cose. Basta tornare a Dante: “Fatti non foste per vivere come bruti, ma per seguir virtute e conoscenza”.

Ada Treves, Pagine Ebraiche, ottobre 2016