Google Translatotron: novo tradutor mantém os atributos vocais dos usuários

Google translate
Translatotron utiliza tecnologia inédita que se diferencia dos programas atuais e preserva as características vocais

Os tradutores já fazem parte do dia a dia de todos nós. Seja para entender um texto ou se comunicar com alguém de outro país. Com o nova ferramenta do Google, Translatotron, é possível realizar traduções de áudio mantendo as características da voz do orador, de forma mais rápida e tornando todo o processo mais natural. É também uma alternativa para quem procura aprender um outro idioma de forma mais dinâmica.

Anunciado recentemente, a nova ferramenta se distancia do modelo “cascata” dos programas atuais. Hoje os tradutores transcrevem os áudios no idioma original, traduzem para a língua selecionada e só depois fornecem o diálogo traduzido. O problema é que realizar todas essas etapas pode abrir diversas brechas para erros.

Em 2017, o Google já estudava uma forma de redefinir traduções deixando o modo cascata de lado e investindo no end-to-end (de ponta-a-ponta, em uma tradução livre).

Como funciona o Translatotron

Foi com o Translatotron que o Google conseguiu realizar todo esse processo sem intermediários, de forma direta. Utilizando o modelo de rede ponta-a-ponta, a nova ferramenta processa a voz em formato de espectrograma – uma representação visual das frequências – gerando outro no idioma escolhido pelo usuário. O resultado é uma tradução mais rápida e com menos probabilidade de erros ou palavras perdidas durante o processo.

Translatotron desenvolvido pela Google AI
Divisão de Inteligência Artificial do Google é responsável pelo desenvolvimento do Translatotron

Utilizando o algoritmo BLEU (usado na avaliação de textos traduzidos por IAs), foi possível comprovar a viabilidade do novo sistema em comparação com o atual. Ao escutar os exemplos, podemos notar que a tradução ficou menos robótica, conseguindo copiar expressões de maneira um pouco mais natural. Os exemplos foram disponibilizados pela própria empresa e estão na página da pesquisa. Confira alguns a seguir:

(Voz feminina) Áudio em Espanhol: ¿Sabes? Cuando no conoces la ciencia, no ves el cuadro completo.

(Voz feminina) Tradução para o inglês: You know, when you do not know the science, you do not see the whole picture.

(Voz masculina) Áudio em espanhol: Larry me preguntó cómo me sentía y creo que es cuando empecé a llorar.

(Voz masculina) tradução para o inglês: Larry asked me how I felt and I think that is when I started to cry.

Outro diferencial é um componente opcional que mantém as características vocais, reconhecendo vozes masculinas e femininas. Esse codificador é baseado nos sistemas de verificação e reconhecimento por voz, sendo capaz de codificar e criar espectrogramas em diferentes idiomas, mas com atributos similares.

Um passo para o futuro

Google Translatotron: novo tradutor mantém os atributos vocais dos usuários 6
Em 2015, o Google também inovou com o tradutor que utiliza a câmera dos smartphones

Mesmo estando em fase experimental, o Translatotron representa um avanço nas tecnologias de inteligência artificial que, futuramente, diminuirão ainda mais as barreiras de idiomas. Vale lembrar que o Google é uma das empresas que mais investe em tecnologias de tradução, como a atualização que traduz placas e letreiros com a câmera do celular. Em alguns países, o Google Translate até imita sotaques regionais.

Adicionar Comentário

Clique aqui para postar um comentário

Deixe uma resposta

Receba Notícias por E-mail:

Receba notícias no seu e-mail
Holler Box