lunedì 30 settembre 2013

le lingue salvate dai bit


Luca Dello Jacovo

Nòva - Il Sole 24 Ore, 29 settembre 2013

Poteva sembrare un esempio illustrativo: Amit Singhal, senior vice president di Google, aveva raccontato a un giornalista di Slate che Star Trek era una fonte d'ispirazione nei progetti di ricerca dell'azienda californiana. Le intuizioni del telefilm di fantascienza hanno plasmato l'immaginario di generazioni. E hanno alimentato idee come il traduttore universale che abilita discussioni in qualsiasi lingua e in tempo reale. 
È una frontiera che non sembra così distante. Anzi. Già Peter Norvig, director of research di Google, aveva dimostrato che le metodologie analitiche rese accessibili attraverso le infrastrutture informatiche del colosso hi-tech erano in grado di elaborare traduzioni veloci e affidabili. L'impegno dei data scientist è stato decisivo nei progressi raggiunti.
Franz Josef Och guida il team di Google dedicato alla machine translation: ha dichiarato in una recente intervista con Der Spiegel di avere ottenuto un "salto quantistico". A fare la differenza ha contribuito anche il web con il suo immenso archivio di documenti che permettono agli algoritmi di apprendere e migliorare. Sono 60-70 le lingue che Google Traduttore può convertire nella sua pagina online oppure attraverso app. È un frammento dei territori esplorati dai data scientist del gigante di Mountain View accanto agli algoritmi di deep learning delle reti neurali sviluppati da Geoffrey Hinton e alle indagini sull'intelligenza artificiale di Ray Kurzweil.
Non resta un traguardo racchiuso tra le mura dei laboratori di ricerca. Sui dispositivi mobili sono già accessibili molte applicazioni software come Vocre e Jibbigo per traduzioni vocali di brevi frasi: è sufficiente parlare nella propria lingua e ascoltare successivamente la pronuncia in un altro idioma. Word Lens converte in tempo reale un testo visualizzato dalla fotocamera di uno smartphone o di un tablet. Sono app utilizzate per esempio durante viaggi all'estero e dai turisti. Duolingo invece ha coinvolto una vasta community dedicata all'apprendimento mediante le traduzioni dai siti web e i suggerimenti di altri iscritti più esperti.
Ethnologue ha censito 7.105 lingue vive: 906 risultano in via di estinzione e 1.481 sono in difficoltà. Tutte fanno parte dell'enorme "language cloud" dell'umanità che abbraccia migliaia di visioni del mondo condensate in parole. Da quando la rete internet è stata aperta ai cittadini ha viaggiato di pari passo con la globalizzazione. Nei primi anni Novanta era diffusa la convinzione che avrebbe generato un appiattimento delle culture. Anni dopo sappiamo che non è stato così.
I social media hanno dimostrato di essere un luogo di memoria attiva. Indigenous Tweets (http://indigenoustweets.com) raccoglie i messaggi su Twitter condivisi dalle minoranze: rivela che piccole comunità linguistiche non superiori a poche decine o centinaia di persone coltivano la pratica delle loro parole grazie al web. Nel tempo hanno elaborato scaffali digitali che sono visibili al pubblico online frammentati in una scia di micropost. È un'agorà di conversazione dove sperimentare l'equilibrio delle identità locali con lo spazio aperto di internet.
La diffusione di laptop, smartphone e tablet alimenta una biblioteca online accessibile a chiunque con video, immagini e audio. YouTube è una miniera di informazioni per trovare testimonianze altrimenti difficili da acquisire: sono registrate da ricercatori e documentaristi. Contribuiscono inoltre blogger e citizen journalist. Quella di Global Voices (http://globalvoicesonline.org) è una comunità globale per discussioni che include dialoghi in swahili e malese. Il crowdsourcing incoraggia l'ampliamento di testi e video in lingue meno diffuse grazie alla partecipazione di volontari come avviene nella community di Ted mediante l'Open Translation Project. E le nuvole digitali del cloud computing sono costellate di arche destinate a preservare i saperi e a renderli vivi. 
Anche i big data portano alla luce una straordinaria complessità. MyMemory è un'Api (application programming interface) progettata dall'italiana Translated.net che ha collaborato con molti giganti dell'hi-tech: semplifica le traduzioni di testi e ha standard elevati di qualità. Nella vetrina di Mashape è la prima all'interno della classifica di Api della sua categoria. Le opportunità che derivano dall'incontro di data scientist e umanisti sono appena intraviste. Il traduttore universale è più vicino che mai.

Nessun commento:

Posta un commento