Escritório

Como funciona o Tradutor do Skype

Índice:

Anonim

A ficção científica está repleta de referências a aparelhos tecnologicamente avançados cujo funcionamento, parafraseando a expressão mítica, é indistinguível da magia. Surgindo da mente criativa de seus autores, é difícil imaginar quando tais invenções poderão estar em nossas mãos e acabamos aceitando que sua existência não fará parte de nosso ciclo de vida. Mas de vez em quando um deles se esgueira em nossas vidas prematuramente. É o caso de a tradução em tempo real que a Microsoft e o Skype estão prestes a tornar possível

"A tarefa é tudo menos simples.Envolve a capacidade de videoconferência do Skype, a vasta rede de servidores em nuvem do Microsoft Azure, as inovações tecnológicas da Microsoft Research e os avanços recentes em várias áreas, como estatística e aprendizado de máquina. Tudo isso colocado a sua disposição para que, assim que você pronunciar uma frase em seu idioma, o sistema reconheça o que você diz, traduza e transmita ao seu contato em outro idioma. Como é possível?"

A tecnologia que torna isso possível

Skype Translator, nome pelo qual a nova funcionalidade é conhecida, não é um flash na panela, nem mesmo em um ano . O Skype Translator é o resultado de décadas de pesquisa em técnicas de reconhecimento de fala, tradução automática e aprendizado de máquina. Em todas essas áreas está a operação de um sistema que não teria sido possível sem os últimos avanços nelas.

O Skype Translator é o resultado de décadas de pesquisa em reconhecimento de fala, tradução automática e técnicas de aprendizado de máquina.

Começando com Speech Recognition, uma tecnologia que está sob investigação há algum tempo, mas cuja adoção sempre foi afetada pelo grande número de erros e sensibilidade excessiva dos sistemas existentes. Um segundo de dúvida, pequenas variações no sotaque, ou um mínimo ruído era suficiente para confundir o computador e fazê-lo entender o que queria. Foi assim até que explodiu o desenvolvimento de técnicas de 'aprendizagem profunda' e a criação de redes neurais artificiais, das quais a Microsoft Research sabe alguma coisa. Graças a eles, foi possível reduzir consideravelmente a taxa de erros e melhorar a confiabilidade e robustez do reconhecimento de fala, um primeiro passo necessário para que o Skype Translator funcione.

tradução automática é o outro pilar óbvio sobre o qual o Skype Translator se baseia. Aqui, a Microsoft mais uma vez usa tecnologia interna e usa o mecanismo de tradução Bing para traduzir texto de um idioma para outro.Seu sistema usa uma combinação de técnicas de reconhecimento de sintaxe e modelos estatísticos para refinar o resultado. Além disso, nesta ocasião, o motor foi especialmente treinado para reconhecer o tipo de linguagem que ocorre nas conversas faladas, longe da correção e clareza que normalmente se assume na escrita. Assim, o sistema Skype Translator combina a vasta base de conhecimento de idiomas do Bing Translator com uma extensa camada de palavras e frases comumente usadas em linguagem coloquial.

Mas fala e idiomas são terrenos complicados. Eles mudam constantemente, têm vários sabores e variedades, cada pessoa tem seu estilo particular, etc. O Skype Translator tem que acompanhar tudo isso, exigindo constante treinamento e otimização tanto do reconhecimento de fala quanto da tradução automática. Para fazer isso o sistema foi construído em uma plataforma robusta de 'machine learning', um ramo da inteligência artificial que visa desenvolver técnicas que permitem que máquinas e algoritmos aprendam treinando com dados de amostra.A utilização destas técnicas, comuns na área da estatística, permite melhorar o serviço à medida que é utilizado, aproveitando os dados gerados ao utilizá-lo para refinar ainda mais o reconhecimento de voz e a tradução automática.

Alguns desses dados de teste são gerados automaticamente a partir de uma ampla variedade de fontes, incluindo redes sociais como o Facebook, páginas da web traduzidas, vídeos com legendas ou até conversas criadas para esse fim e transcritas e traduzidas manualmente . Mas outra parte dos dados vem de conversas reais realizadas por meio do serviço. Isso é importante porque, como a Microsoft avisa a cada chamada, você deve saber que Skype Translator pode gravar conversas, mantendo-as anônimas, para que possam ser posteriormente analisadas por seus algoritmos e introduzidos no processo de treinamento de seus modelos estatísticos.

O Skype Translator só pode funcionar corretamente se for capaz de aprender por meio de um processo baseado em seu uso em conversas humanas reais

"

O sistema não poderia funcionar sem este processo de aprendizagem. Enquanto os humanos falam, pausamos e repetimos coisas, cometemos erros e mudamos nosso pensamento à medida que avançamos, apresentando ahs, ehms, uhms>somente aprendendo sobre seu uso real pode torná-lo melhor "

De um idioma falado para outro em poucos segundos

Apoiado por todos esses avanços, o segredo é que o Skype Translator é capaz de executar todo o processo de reconhecimento e tradução de forma rápida e transparente para o usuário Cada vez que falamos, o sistema deve reconhecer o que estamos dizendo, traduzi-lo para o idioma do destinatário e comunicá-lo de uma forma que permaneça fiel ao que tentamos comunicar inicialmente.Quanto menos notarmos as etapas intermediárias, melhor.

Assim que o sistema detecta que estamos falando ele começa a gravar o que falamos e inicia o processo de reconhecimento de fala Isso não é trata-se não só de reconhecer cada palavra que pronunciamos, mas também de eliminar tudo o que é supérfluo, eliminando expressões sem sentido e ruídos, detectando a divisão do texto em frases, com a inclusão de sinais de pontuação e letras maiúsculas, e dotando-o de um contexto que ajuda a sua interpretação. Quando você pensa um pouco sobre isso, percebe como é difícil determinar tudo isso a partir da linguagem falada.

O Skype Translator precisa que o reconhecimento de fala seja o mais preciso possível, pois o que se segue é preparar as informações coletadas para compará-las com os modelos estatísticos que vêm se aprimorando por meio de seu sistema de 'aprendizado de máquina'.Aqui o processo consiste em encontrar semelhanças entre o que o sistema entendeu que estávamos dizendo e as palavras e contextos contidos nos modelos, para posteriormente aplicar transformações previamente aprendidas que irão converter o áudio em texto e traduzi-lo para a língua estrangeira.

Na etapa final, o Skype preparou um par de bots, com vozes femininas e masculinas, que atuam como intérpretes na chamada Uma vez selecionado pelo usuário, ele se encarregará de comunicar nossa mensagem traduzida ao destinatário, para que não só as transcrições e traduções escritas apareçam na tela, mas também possa ouvi-las em voz alta como se um terceiro humano estivesse intermediando entre nós. . Esses bots são capazes de comunicar rapidamente a mensagem, para que quem estiver ouvindo do outro lado da tela receba a mensagem alguns segundos depois de pronunciá-la.

O programa de teste como ponto de partida

Precisamente a presença de bots como interlocutores terceiros na conversa é um dos detalhes que ainda f alta polir. A Microsoft reconhece que a adaptação a eles é fácil para pessoas acostumadas a falar por meio de um intérprete, mas para outras exige um período de aprendizado. E é que a Microsoft e o Skype podem estar determinados a criar a melhor experiência de tradução em tempo real que existe, mas para isso eles precisam que aprendamos tanto a nós mesmos quanto às máquinasA visualização do Skype Translator é apenas mais uma etapa desse processo.

O programa de teste foi lançado em meados de dezembro, introduzindo tradução falada entre dois idiomas: inglês e espanhol, e tradução escrita em mais de 40 Para acessá-lo é necessário um convite, que podemos solicitar cadastrando-se no site do programa. Se formos agraciados com isso, podemos experimentar o Skype Translator nos aplicativos do Skype para Windows 8.1 ou Windows 10 Technical Preview. Caso contrário, teremos que esperar que o serviço seja estendido e tornado público oficialmente.

"

De qualquer forma, Skype Translator começou quando estamos prestes a nos despedir de 2014. Antes de terminar, pare aqui um segundo e pense no ano que você acabou de ler: dois mil e quatorze>"

Via | Blogs do Skype I, II

Escritório

Escolha dos editores

Back to top button