De techniek werkt met een geavanceerde vorm van kunstmatige intelligentie, zo schrijven de onderzoekers van Google in een blog. Het systeem analyseert het geluid en zet dit om in taal die vertaald kan worden. Volgens de onderzoekers is Translatotron het eerste stuk techniek dat spraak direct kan vertalen in een andere taal.

Het is al mogelijk om ingesproken teksten te vertalen en weer uit te laten spreken in een andere taal, maar daarbij wordt de spraak eerst omgezet in tekst, die vervolgens wordt vertaald en wéér omgezet in spraak. Dat is ook de manier waarop Google Translate nu werkt.

Stemgeluid

Door spraak direct te vertalen, zonder er eerst tekst van te maken, kan ook het stemgeluid van de spreker behouden worden volgens Google. Daarvoor wordt een optionele speaker encoder gebruikt, die ervoor moet zorgen dat de kenmerken van de vertaalde spraak behouden blijven.

Of en wanneer Translatotron ingezet zal worden in de praktijk, is nog niet bekend. Het volledige onderzoek is te lezen op de onderzoekswebsite van Cornell University.