Como funciona o Tradutor do Skype
Índice:
- A tecnologia que torna isso possível
- De um idioma falado para outro em poucos segundos
- O programa de teste como ponto de partida
A ficção científica está repleta de referências a aparelhos tecnologicamente avançados cujo funcionamento, parafraseando a expressão mítica, é indistinguível da magia. Surgindo da mente criativa de seus autores, é difícil imaginar quando tais invenções poderão estar em nossas mãos e acabamos aceitando que sua existência não fará parte de nosso ciclo de vida. Mas de vez em quando um deles se esgueira em nossas vidas prematuramente. É o caso de a tradução em tempo real que a Microsoft e o Skype estão prestes a tornar possível
"A tarefa é tudo menos simples.Envolve a capacidade de videoconferência do Skype, a vasta rede de servidores em nuvem do Microsoft Azure, as inovações tecnológicas da Microsoft Research e os avanços recentes em várias áreas, como estatística e aprendizado de máquina. Tudo isso colocado a sua disposição para que, assim que você pronunciar uma frase em seu idioma, o sistema reconheça o que você diz, traduza e transmita ao seu contato em outro idioma. Como é possível?"
A tecnologia que torna isso possível
Skype Translator, nome pelo qual a nova funcionalidade é conhecida, não é um flash na panela, nem mesmo em um ano . O Skype Translator é o resultado de décadas de pesquisa em técnicas de reconhecimento de fala, tradução automática e aprendizado de máquina. Em todas essas áreas está a operação de um sistema que não teria sido possível sem os últimos avanços nelas.
O Skype Translator é o resultado de décadas de pesquisa em reconhecimento de fala, tradução automática e técnicas de aprendizado de máquina.Começando com Speech Recognition, uma tecnologia que está sob investigação há algum tempo, mas cuja adoção sempre foi afetada pelo grande número de erros e sensibilidade excessiva dos sistemas existentes. Um segundo de dúvida, pequenas variações no sotaque, ou um mínimo ruído era suficiente para confundir o computador e fazê-lo entender o que queria. Foi assim até que explodiu o desenvolvimento de técnicas de 'aprendizagem profunda' e a criação de redes neurais artificiais, das quais a Microsoft Research sabe alguma coisa. Graças a eles, foi possível reduzir consideravelmente a taxa de erros e melhorar a confiabilidade e robustez do reconhecimento de fala, um primeiro passo necessário para que o Skype Translator funcione.
tradução automática é o outro pilar óbvio sobre o qual o Skype Translator se baseia. Aqui, a Microsoft mais uma vez usa tecnologia interna e usa o mecanismo de tradução Bing para traduzir texto de um idioma para outro.Seu sistema usa uma combinação de técnicas de reconhecimento de sintaxe e modelos estatísticos para refinar o resultado. Além disso, nesta ocasião, o motor foi especialmente treinado para reconhecer o tipo de linguagem que ocorre nas conversas faladas, longe da correção e clareza que normalmente se assume na escrita. Assim, o sistema Skype Translator combina a vasta base de conhecimento de idiomas do Bing Translator com uma extensa camada de palavras e frases comumente usadas em linguagem coloquial.
Mas fala e idiomas são terrenos complicados. Eles mudam constantemente, têm vários sabores e variedades, cada pessoa tem seu estilo particular, etc. O Skype Translator tem que acompanhar tudo isso, exigindo constante treinamento e otimização tanto do reconhecimento de fala quanto da tradução automática. Para fazer isso o sistema foi construído em uma plataforma robusta de 'machine learning', um ramo da inteligência artificial que visa desenvolver técnicas que permitem que máquinas e algoritmos aprendam treinando com dados de amostra.A utilização destas técnicas, comuns na área da estatística, permite melhorar o serviço à medida que é utilizado, aproveitando os dados gerados ao utilizá-lo para refinar ainda mais o reconhecimento de voz e a tradução automática.
Alguns desses dados de teste são gerados automaticamente a partir de uma ampla variedade de fontes, incluindo redes sociais como o Facebook, páginas da web traduzidas, vídeos com legendas ou até conversas criadas para esse fim e transcritas e traduzidas manualmente . Mas outra parte dos dados vem de conversas reais realizadas por meio do serviço. Isso é importante porque, como a Microsoft avisa a cada chamada, você deve saber que Skype Translator pode gravar conversas, mantendo-as anônimas, para que possam ser posteriormente analisadas por seus algoritmos e introduzidos no processo de treinamento de seus modelos estatísticos.
O Skype Translator só pode funcionar corretamente se for capaz de aprender por meio de um processo baseado em seu uso em conversas humanas reais
"O sistema não poderia funcionar sem este processo de aprendizagem. Enquanto os humanos falam, pausamos e repetimos coisas, cometemos erros e mudamos nosso pensamento à medida que avançamos, apresentando ahs, ehms, uhms>somente aprendendo sobre seu uso real pode torná-lo melhor "
De um idioma falado para outro em poucos segundos
Apoiado por todos esses avanços, o segredo é que o Skype Translator é capaz de executar todo o processo de reconhecimento e tradução de forma rápida e transparente para o usuário Cada vez que falamos, o sistema deve reconhecer o que estamos dizendo, traduzi-lo para o idioma do destinatário e comunicá-lo de uma forma que permaneça fiel ao que tentamos comunicar inicialmente.Quanto menos notarmos as etapas intermediárias, melhor.
Assim que o sistema detecta que estamos falando ele começa a gravar o que falamos e inicia o processo de reconhecimento de fala Isso não é trata-se não só de reconhecer cada palavra que pronunciamos, mas também de eliminar tudo o que é supérfluo, eliminando expressões sem sentido e ruídos, detectando a divisão do texto em frases, com a inclusão de sinais de pontuação e letras maiúsculas, e dotando-o de um contexto que ajuda a sua interpretação. Quando você pensa um pouco sobre isso, percebe como é difícil determinar tudo isso a partir da linguagem falada.
O Skype Translator precisa que o reconhecimento de fala seja o mais preciso possível, pois o que se segue é preparar as informações coletadas para compará-las com os modelos estatísticos que vêm se aprimorando por meio de seu sistema de 'aprendizado de máquina'.Aqui o processo consiste em encontrar semelhanças entre o que o sistema entendeu que estávamos dizendo e as palavras e contextos contidos nos modelos, para posteriormente aplicar transformações previamente aprendidas que irão converter o áudio em texto e traduzi-lo para a língua estrangeira.
Na etapa final, o Skype preparou um par de bots, com vozes femininas e masculinas, que atuam como intérpretes na chamada Uma vez selecionado pelo usuário, ele se encarregará de comunicar nossa mensagem traduzida ao destinatário, para que não só as transcrições e traduções escritas apareçam na tela, mas também possa ouvi-las em voz alta como se um terceiro humano estivesse intermediando entre nós. . Esses bots são capazes de comunicar rapidamente a mensagem, para que quem estiver ouvindo do outro lado da tela receba a mensagem alguns segundos depois de pronunciá-la.
O programa de teste como ponto de partida
Precisamente a presença de bots como interlocutores terceiros na conversa é um dos detalhes que ainda f alta polir. A Microsoft reconhece que a adaptação a eles é fácil para pessoas acostumadas a falar por meio de um intérprete, mas para outras exige um período de aprendizado. E é que a Microsoft e o Skype podem estar determinados a criar a melhor experiência de tradução em tempo real que existe, mas para isso eles precisam que aprendamos tanto a nós mesmos quanto às máquinasA visualização do Skype Translator é apenas mais uma etapa desse processo.
O programa de teste foi lançado em meados de dezembro, introduzindo tradução falada entre dois idiomas: inglês e espanhol, e tradução escrita em mais de 40 Para acessá-lo é necessário um convite, que podemos solicitar cadastrando-se no site do programa. Se formos agraciados com isso, podemos experimentar o Skype Translator nos aplicativos do Skype para Windows 8.1 ou Windows 10 Technical Preview. Caso contrário, teremos que esperar que o serviço seja estendido e tornado público oficialmente.
"De qualquer forma, Skype Translator começou quando estamos prestes a nos despedir de 2014. Antes de terminar, pare aqui um segundo e pense no ano que você acabou de ler: dois mil e quatorze>"
Via | Blogs do Skype I, II