Artificial intelligence for translations

Among the best-known online software there is Google Translate, which for 14 years (it was launched in 2006) has shown that “machines” are not yet able to perform translations from one language to another, like a real-life translator.
Nothing to be surprised about: providing an automatic system with the grammatical rules of some languages and the vocabulary needed to translate words from one to another is not enough to correctly recreate the nuances, subtleties, context that characterize something as complex and creative as human language.

Since their creation, machines have replaced the work of man when it came to performing complex calculations (because the parameters imposed were stringent) but they go into crisis when they are challenged with something that involves creativity.

Recently, this has started to change.
With the advent of deep learning (the system today has become almost synonymous with artificial intelligence) we have witnessed not only incredible achievements in areas that have very little to do with mathematics (from image recognition to the creation of pictures), but also artificial intelligences that successfully compete in even more complex areas, including language.
The forerunner in this field, only three years ago, was Google Translate, which in November 2016 began to exploit deep learning and immediately made an impressive qualitative leap.

To explain in detail how this qualitative leap took place would be too long.
In a nutshell, we can say that – thanks to deep learning – Google Translate stopped strictly applying the rules and vocabulary of the languages it was trying to translate (without any success) and began to analyze what was the correct translation of a word or phrase based also on the context. Or rather, on a statistical evaluation of what is the correct translation of a word based on the other words that appear nearby (based on the huge database available).

Once the extraordinary progress made by Translate was assessed, even creative and intellectual work such as the translator was inevitably included in the lists of “endangered works”.
And it is from here that, in a long article published by Hofstadter (professor of Cognitive Sciences and Comparative Literature), he sets out to develop a fierce criticism aimed at those who confuse language with a code to be cracked and believe that machines can really understand written texts and replace human translators.

Machines, of course, can’t really understand a text.
As Hofstadter notes, machines can, if anything, bypass or evade the true understanding of a text. In a nutshell, they must correctly reproduce a text in another language (with all its nuances, ambiguities and idioms) even though they cannot understand its meaning.

Artificial intelligence literally reproduces idioms, making them lose all meaning, or wraps itself in complex periods producing sentences that simply make no sense.


Hofstadter can thus sing victory: “We humans know everything about relationships, households, personal possessions, pride, rivalry, jealousy, privacy and many other abstract concepts that lead to oddities like married couples who have towels embroidered ‘his’ and ‘hers’ on them. Google Translate is not familiar with these situations.
Google Translate is not familiar with these situations, period”.

Put to the test by Hofstadter even with excerpts from German and Chinese novels, the machine continues to fail, failing to reproduce words correctly when they take on meanings other than the most common ones or recreating entire periods in a confusing if not incomprehensible way (especially from Chinese to English).

The conclusion is clear: the statistical (and probabilistic) approach of artificial intelligence, although based on an immense amount of data, cannot compete with man’s ability to understand the nuances of one language and recreate them in the most respectful way in another.
But this is not a surprise: what should we expect from a machine that is dealing with something as incredibly complex as human language?
The real surprise is that, in many other cases, Google Translate manages to get around the need to really understand a text and still return an accurate translation.
In the cases brought by Hofstadter this has rarely happened.
The really important point is therefore one: should we be surprised that an artificial intelligence often mistranslates complex narrative works, or should we be surprised that in many other cases it manages to translate almost correctly?
And so, will translators really disappear from circulation?
The most likely answer to this second question is: it depends.

If we’re talking about translators working on scientific texts (like a school chemistry manual) or even instruction manuals, it’s very likely that artificial intelligence algorithms will soon be able to handle themselves (with some supervision, they already are).
But if we are talking about translating a poet like Pushkin (a work in which Hofstadter himself has tried his hand), we can rest assured: only the human being is able to translate such complex works, which inevitably require human intellect, creativity and understanding.
Even if, with that piece by Dostoevsky, Google Translate did just fine.


To find out more about the Babel Jumper project and the sale of BBJT Tokens, visit our website and our Social channels.

Libraries in the past, present and future

Libraries have for millennia been the cultural institutions responsible for the preservation and enjoyment of the permanent collective memory, better known as writing, the documentary heritage of humanity. Since ancient times they represented the “databases” of our culture, allowing the classics of Greek, Latin and medieval literature to reach us. The important historical and cultural function of the library as an institution, in this instance that of a Cistercian abbey, was well described in Umberto Eco’s novel “Il Nome della Rosa”.

Even today, every year in Europe 1.2 million citizens benefit from the services offered by approximately 70,000 European libraries.  With the advent of digital technologies, however, these historic roles have been undermined.

Today, most of our libraries appear to be in difficulty with the needs of the public. The truth is that, on the one hand, technological progress has created a series of services that threaten the very function of the library and that, on the other hand, our library system was not (and is not) ready for the challenges that this swirling evolution presented.

Is it possible to imagine a world without libraries? Certainly not.

Libraries are a place where the enjoyment of “books” must continue to play a fundamental role. But at a time when people who read do so on poor quality material, it is also true that it is necessary to start new paths to stimulate reading. In an Italy that is concerned about fake news, we should look at the fact that functional illiteracy rates are growing exponentially. If libraries want to curb this phenomenon then they will have to put in place a path of renewal.

In other words, it is necessary that they learn the languages of the present, that they adapt to a world that is perhaps not the best of all possible worlds, but that certainly presents them with the opportunity to reinvent themselves and become a reference point for the entire community.

It seems therefore necessary to relaunch the service, which can take place thanks to new information technologies, in fact today it is essential to digitize documents so that users can search and consult them more easily and quickly.

The digitization to be done will cover various aspects: from the provisioning of documents (digital and non-digital) to the backoffice, from the development of a new metadata theory to the library translation of machine learning models for the management of big data in the sector, from the integration of digital in the physical library to the cooperation between libraries, from the optimization of purchasing processes to the creation of cooperative and automated development logic of collections.

The work to be done is so much and complex, if libraries still intend to exist and survive then they will have to innovate as soon as possible, otherwise their place will be taken by new experiences and phenomena already in place that will not let this possibility slip because man will never be able to quench his “hunger for knowledge”.

To find out more about the Babel Jumper project and the sale of BBJT Tokens, visit our website and our Social channels.

L’intelligenza artificiale nelle traduzioni

Tra i software online più conosciuti c’è Google Translate che da ben 14 anni anni (è stato lanciato nel 2006) ha dimostrato che le “macchine” non sono ancora in grado di eseguire traduzioni da una lingua ad un altra, come un traduttore in carne ed ossa.
Niente di cui stupirsi: fornire a un sistema automatico le regole grammaticali di alcune lingue e il vocabolario necessario a tradurre le parole da una all’altra non è sufficiente per ricreare correttamente le sfumature, le sottigliezze, il contesto che caratterizzano qualcosa di complesso e creativo come il linguaggio umano.

Dalla loro creazione le macchine hanno sostituito l’operato dell’uomo quando si trattava di eseguire calcoli complessi (perché i parametri imposti erano stringenti) ma vanno in crisi quando non appena  vengono messe alla prova con qualcosa che riguarda con la creatività.

Recentemente, tutto ciò ha iniziato a cambiare.
Con l’avvento del deep learning (il sistema oggi diventato quasi sinonimo di intelligenza artificiale) si è assistito non solo a incredibili conquiste in ambiti che con la matematica c’entrano ben poco (dal riconoscimento immagini fino alla creazione di quadri), ma anche a intelligenze artificiali che si cimentano con successo in settori ancora più complessi, tra cui il linguaggio.
A fare da apripista in questo campo, solo tre anni fa, fu proprio Google Translate, che nel novembre 2016 iniziò a sfruttare il deep learning e fece subito un impressionante salto qualitativo.

Spiegare dettagliatamente come questo salto avvenne sarebbe troppo lungo.
In estrema sintesi, si può dire che – grazie al deep learning – Google Translate smise di applicare rigidamente le regole e il vocabolario delle lingue che cercava di tradurre (senza alcun successo) e iniziò ad analizzare quale fosse la traduzione corretta di una parola o di una frase basandosi anche sul contesto. O meglio, su una valutazione statistica di quale sia la corretta traduzione di una parola sulla base delle altre parole che compaiono nelle vicinanze (basandosi sull’immenso database a sua disposizione).

Una volta accertati gli straordinari progressi compiuti da Translate, anche un lavoro creativo e intellettuale come il traduttore venne inevitabilmente inserito nelle liste dei “lavori in via di estinzione”.
Ed è proprio da qui che, in un lungo articolo pubblicato da Hofstadter (docente di Scienze Cognitive e di Letteratura Comparata) parte per mettere a punto una critica feroce rivolta a chi confonde il linguaggio con un codice da decifrare e ritiene che le macchine possano davvero capire i testi scritti e sostituire i traduttori umani.

Le macchine, ovviamente, non possono davvero comprendere un testo.
Come acutamente nota Hofstadter, le macchine possono semmai aggirare o eludere la vera comprensione di un testo. In poche parole, devono riprodurre correttamente un testo in un’altra lingua (con tutte le sue sfumature, ambiguità e modi di dire) nonostante non siano in grado di capirne il significato.

L’intelligenza artificiale riproduce letteralmente dei modi di dire, facendo perdere loro qualunque significato, o si incarta in periodi complessi producendo frasi che, semplicemente, non hanno senso.
Hofstadter può così cantare vittoria: “Noi umani conosciamo tutto ciò che riguarda le coppie, le case, i possedimenti personali, l’orgoglio, la rivalità, la gelosia, la privacy e tantissimi altri concetti astratti che portano a bizzarrie come le coppie sposate che hanno asciugamani con sopra ricamato ‘suo’ e ‘sua’. Google Translate non ha dimestichezza con queste situazioni.
Google Translate non ha dimestichezza con le situazioni, punto”.

Messa alla prova da Hofstadter anche con brani tratti da romanzi tedeschi e cinesi, la macchina continua a fallire, non riuscendo a riprodurre correttamente le parole quando assumono significati diversi da quelli più comuni o ricreando interi periodi in maniera confusa se non addirittura incomprensibile (soprattutto dal cinese all’inglese).

Ma questa non è una sorpresa: cosa ci dovremmo aspettare da una macchina che si cimenta con qualcosa di incredibilmente complesso come il linguaggio umano?
La vera sorpresa è che, in molti altri casi, Google Translate riesce ad aggirare la necessità di comprendere davvero un testo restituendo comunque una traduzione accurata.
Nei casi portati da Hofstadter questo è avvenuto raramente.
Il punto davvero importante è quindi uno: dovremmo stupirci del fatto che un’intelligenza artificiale sbagli spesso a tradurre opere narrative complesse, o meravigliarci che in molti altri casi riesca nell’incredibile impresa di tradurre quasi correttamente?
E quindi, davvero i traduttori scompariranno dalla circolazione?
La risposta più probabile a questa seconda domanda è: dipende.

Se parliamo di traduttori che lavorano su testi scientifici (come può essere un manuale scolastico di chimica) o addirittura sui libretti per le istruzioni, è molto probabile che a breve gli algoritmi di intelligenza artificiale saranno in grado di cavarsela da soli (con un po’ di supervisione, lo sono già adesso).
Ma se invece parliamo di tradurre un poeta come Pushkin (lavoro in cui si è cimentato lo stesso Hofstadter), si può stare tranquilli: solo l’essere umano è in grado di tradurre opere così complesse, che richiedono inevitabilmente l’intelletto, la creatività e la comprensione umana.
Anche se, con quel brano di Dostoevskij, Google Translate se l’è cavata proprio bene. 


Per saperne di più sul progetto Babel Jumper e sulla vendita di token BBJT, visitate il nostro sito web e i nostri canali Social.

Le biblioteche tra passato, presente e futuro

Le biblioteche per millenni sono state le istituzioni culturali deputate alla conservazione e alla fruizione della memoria collettiva permanente, meglio nota come scrittura, il patrimonio documentale dell’umanità. Sin dall’antichità sono state le “banche dati” della nostra cultura, permettendo che arrivassero fino a noi i classici della letteratura greca, latina e medievale. L’importante funzione storica e culturale della biblioteca come istituzione, in questo caso quella di un’abbazia cistercense, è stata ben descritta nel romanzo di Umberto Eco “Il Nome della Rosa”.

Anche oggi, ogni anno in Europa 1,2 milioni di cittadini usufruiscono dei servizi offerti dalle circa 70.000 biblioteche europee.  Con l’avvento delle tecnologie digitali però  questi storici compiti sono venuti meno.

Oggi la maggior parte delle nostre biblioteche appare senza dubbio in difficoltà rispetto alle esigenze dei cittadini. La verità è che da un lato il progresso tecnologico ha creato una serie di servizi che minano la funzione stessa della biblioteca e che, dall’altro, il nostro sistema bibliotecario non era (e non è) pronto alle sfide che questa evoluzione vorticosa presentava.

È possibile immaginare un mondo senza biblioteche? Sicuramente no.

Le biblioteche sono un luogo in cui la fruizione di “libri” deve pur continuare ad avere un ruolo fondamentale. Ma in un periodo in cui la gente che legge lo fa su materiale di scarsa qualità, è anche vero che è necessario avviare nuovi percorsi di stimolo alla lettura. In un’Italia che si preoccupa delle fake news, bisognerebbe guardare al fatto che i tassi di analfabetismo funzionale crescono in maniera esponenziale. Se le biblioteche vogliono arginare questo fenomeno allora dovranno mettere in essere un percorso di rinnovamento.

In altri termini, è necessario che imparino i linguaggi del presente, che si adattino a un mondo che forse non è il migliore dei mondi possibili, ma che sicuramente presenta loro l’opportunità di reinventarsi e tornare a essere un punto di riferimento per l’intera collettività.

Appare quindi doveroso il rilancio del servizio, che può avvenire grazie alle nuove tecnologie informatiche, infatti oggigiorno è essenziale la digitalizzazione dei documenti affinché gli utenti possano ricercarli e consultarli con più  facilità e velocità.

La digitalizzazione da fare riguarderà vari aspetti: dal 

 dei documenti (digitali e non) al backoffice, dallo sviluppo di una nuova teoria dei metadati alla traduzione bibliotecaria dei modelli di machine learning per la gestione dei big data di settore, dall’integrazione del digitale nella biblioteca fisica alla cooperazione tra biblioteche, dall’ottimizzazione dei processi di acquisto alla creazione di logiche di sviluppo cooperativo e automatizzato delle collezioni.

Il lavoro da fare è tanto e complesso, se le biblioteche hanno ancora intenzione di esistere e sopravvivere allora dovranno innovarsi quanto prima possibile, altrimenti il loro posto verrà preso da nuove esperienze e fenomeni già in essere che non si lasceranno sfuggire questa possibilità in quanto l’uomo non riuscirà  mai a placare la propria “fame di conoscenza”.

Per saperne di più sul progetto Babel Jumper e sulla vendita di Token BBJT, visitate il nostro sito web e i nostri canali Social.