A evolução do Kinect e a real importância da Microsoft Research

Índice:
Que Kinect é importante para a Microsoft é quase um truísmo. O dispositivo de captura Redmond vai muito além de um simples método de controle de seu console de videogame e se tornou um importante elemento de sua estratégia e uma referência para muitos de seus produtos. Mas é também uma amostra tangível do que pode nascer da união de um departamento da empresa com o laboratório de ideias Microsoft Research.
O primeiro Kinect já era um exemplo disso. Três anos depois, é essa mesma união que permitiu que o dispositivo evoluísse a limites insuspeitados para acompanhar o lançamento do Xbox One.Em todas as suas seções Kinect 2.0 representa uma melhoria significativa em relação ao seu antecessor e durante esta semana a Microsoft aproveitou para explicar como tem feito parte do processo de desenvolvimento do gadget que está a caminho de se tornar peça fundamental na interação entre humanos e máquinas.
Kinect 1.0
Quando a Microsoft apresentou o Project Natal na E3 em junho de 2009, muitos viram nele uma resposta simples de Redmond ao sucesso indiscutível que a Nintendo estava obtendo com o Wii e seu sistema de controle. Mas sob aquele projeto com nome de cidade brasileira escondia-se o Kinect, aparelho que acabou se tornando um best-seller inquestionável e com o tempo acabou se tornando muito mais do que o esperado.
Embora a tecnologia por trás do primeiro Kinect tenha nascido dos desenvolvimentos de software do estúdio Rare e da tecnologia de captura de imagem da empresa israelense PrimeSense, será a combinação de a equipe do Xbox com as investigações da Microsoft Research que possibilitam chegar ao mercado
O dispositivo em forma de bastão utilizava um projetor infravermelho e uma câmera que escaneava a cena e enviava as informações para um microchip especialmente preparado para captar o movimento de objetos e pessoas em três dimensões. A eles se juntou uma fileira de microfones capazes de reconhecer a voz do usuário. Todos esses elementos juntos permitiram a captura de movimento 3D junto com o reconhecimento facial, de gestos e de voz.
Para tal tarefa, as especificações do Kinect não eram nada de especial. A câmera tinha resolução VGA e operava em 640x480 por padrão, embora fosse capaz de trabalhar em 1280x1024 pixels ao custo de uma taxa de atualização menor. O microchip incluído apenas efetuou parte do trabalho de processamento da informação, deixando boa parte da tarefa para a própria consola.
Uma das chaves de todo o sistema residia no software criado pela Microsoft para interpretar todas as informações coletadas pelos sensores do Kinect.É aqui que Microsoft Research desempenhou e continua desempenhando um papel importante, investigando os mais diversos usos para o Kinect e colaborando no SDK que a Microsoft disponibilizou online desde 2011 para que qualquer desenvolvedor o integre em seus produtos ou serviços.
Kinect 2.0
A grande diferença entre o novo Kinect e seu antecessor está na nova câmera principal. A segunda geração do dispositivo de captura de movimento incorpora uma câmera de tempo de voo (TOF) de alta resolução que permite que o próximo Xbox One Kinect capture mais detalhes com alta precisão e maior resolução. O novo modo de profundidade fornecido por esta câmera TOF permite reproduzir uma cena com três vezes mais fidelidade do que o primeiro Kinect.
Essa não é a única vantagem de usar esse tipo de câmera.Com ele, também é alcançado um campo de visão 60% maior, o que permite registrar um espaço maior e possibilitar o registro de mais pessoas ao mesmo tempo e a uma distância menor do aparelho. Com a nova consola, até 6 pessoas podem subir ao palco, reconhecendo e distinguindo todos os seus movimentos. É um avanço significativo em relação ao seu antecessor, que só era capaz de registrar o movimento de 2.
A segunda grande mudança na nova geração do Kinect vem da mão do novo sensor infravermelho que consegue reconhecer objetos e pessoas em condições de luz muito baixa. O sensor agora é tão poderoso que pode identificar itens em uma sala completamente escura. A precisão é tanta que consegue reconhecer pessoas e registrar corpos mesmo sem nenhuma luz visível ao olho humano. Com pouca luz, reconhece a pose da mão até quatro metros de distância, distinguindo cada um dos dedos com precisão.
Kinect 2.0 distingue o esqueleto completo do usuário, a orientação de seus membros, os músculos do corpo e até mesmo a batida de seu coração.
A combinação dos novos elementos possibilita registrar não apenas a silhueta do usuário, mas também distinguir seu esqueleto completo, a orientação de seus membros, os músculos do corpo com a distribuição de força e peso exercida sobre eles, e até mesmo os batimentos cardíacos. O reconhecimento facial também é bastante aprimorado, detectando até os menores detalhes e gestos e permitindo uma identificação mais precisa. Para ter uma ideia do que tudo isso significa, basta dar uma olhada no vídeo a seguir.
Toda esta nova tecnologia conta ainda com uma melhoria no processador Kinect que lhe permite fazer face à enorme quantidade de informação que todos os novos sensores obtêm. Até 2 gigabits de dados por segundo são coletados pelo dispositivo para ler o ambienteToda esta informação tem de ser processada e interpretada rapidamente e para isso foi necessária uma óbvia melhoria nas especificações da máquina.
Mas mudar os componentes não foi suficiente. O poderoso scanner que o Kinect se tornou requer um software capaz de interpretar tudo o que vê, e para isso foi necessário realizar uma importante evolução no código que o executa. É aqui que a experiência e o conhecimento da Microsoft Research se tornaram mais importantes do que nunca, ajudando a equipe do Xbox onde surgiram problemas e fornecendo as soluções certas em tempo hábil. rápido e eficiente. O Kinect 2.0 tornou-se assim o produto de uma colaboração cuja história demonstra o potencial que a Microsoft esconde no seu laboratório de ideias.
O processo de evolução
A evolução do Kinect é a história de como uma equipe de engenheiros tentou trazer uma câmera TOF para o Xbox One.Esses tipos de câmeras emitem sinais de luz que refletem em objetos e são coletados de volta medindo o tempo que leva para percorrer a distância. Para que funcionem corretamente, distinguindo os reflexos dos objetos em uma sala e de seu ambiente, é necessária uma precisão de até 1/10 bilhão de segundos. Tal nível de precisão é a única maneira de fornecer informações suficientes para permitir que as formas e contornos dos objetos sejam calculados adequadamente.
Parece complicado, e o problema é que atingir esses níveis com um produto de consumo é tão difícil quanto parece. Durante o processo de desenvolvimento do novo Kinect, todos os tipos de problemas tiveram que ser resolvidos em um tempo limitado. Kinect 2.0 deve estar pronto para acompanhar o lançamento do Xbox One, previsto para o final de 2013.
É nessas circunstâncias que a Microsoft tem um ás na manga: Microsoft Research, seu think tankA equipa por detrás do Kinect utilizou o vasto conhecimento e experiência técnica dos membros da Microsoft Research para resolver os vários problemas que iam surgindo com a nova tecnologia integrada no dispositivo. É aqui que os anos de investimento em investigação e desenvolvimento começaram a dar frutos graças à colaboração entre os diferentes departamentos da empresa.
O desafio não foi fácil. Diferenciar objetos de primeiro plano de fundo e minimizar o desfoque da câmera é uma tarefa assustadora. Para o primeiro, pequenos objetos tiveram que ser medidos com precisão em todos os tipos de cenários e com todos os tipos de condições de luz. Era preciso trabalhar até que fosse possível diferenciar os dedos das mãos, evitando que se confundissem com o ambiente. Como resultado desse trabalho o novo Kinect é capaz de detectar objetos de até 2,5 centímetros, em comparação com os 7,5 centímetros de seu antecessor. O problema do desfoque exigia um pouco mais de trabalho e otimização de software, mas, com o tempo, os engenheiros da Microsoft conseguiram reduzir o desfoque de movimento de 65 milissegundos no Kinect original para 14 milissegundos em seu sucessor.
Todas essas tarefas exigem o processamento de uma grande quantidade de informações. Os dados capturados pelas câmeras Kinect são por pixel, o que significa que cada um dos 220.000 pixels suportados pelo sensor Kinect coleta dados independentementeA isso devemos adicionar muito mais informações coletadas pelo restante dos sensores. O complicado é conseguir identificar e interpretar toda essa informação, separando os elementos e a profundidade em que se encontram e eliminando o ruído da imagem.
Com o Kinect, o Xbox One precisa processar 6,5 milhões de pixels por segundo
"Xbox One precisa processar 6,5 milhões de pixels por segundo e apenas uma pequena parte do poder de computação do console pode ser dedicada à tarefa de interpretar as informações, já que a maior parte do poder deve ser reservada para jogos, esqueleto rastreamento ou reconhecimento facial ou de áudio. Muito pouca computação foi necessária por pixel, exigindo limpeza>Sem a ajuda inestimável da Microsoft Research, a equipe do Kinect nunca teria alcançado seu objetivo no prazo"
A importância efetiva do Microsoft Research
O trabalho combinado da equipe do Kinect com o pessoal da Microsoft Research não tem sido um relacionamento puramente consultivo. Os pesquisadores da Microsoft assumiram grande parte do trabalho e construíram toda uma infraestrutura e software para resolver os problemas envolvidos na evolução do dispositivo. O conhecimento das duas equipes em suas respectivas áreas permitiu avançar mais rápido do que separadamente.
A chave foi a velocidade com que se integraram e a capacidade de fornecer soluções em um curto período de tempo. Mas todo esse trabalho não se limita a colocar um produto à venda. O benefício adicional é que os avanços feitos pelos engenheiros de Redmond estão disponíveis para os desenvolvedores, permitindo mais modos de visualização para trabalhar e dados muito mais limpos.
Kinect revela todo o potencial que a Microsoft esconde como empresa e que se revela quando seus departamentos trabalham de forma integrada.Vários pesquisadores da Microsoft Research estiveram ativos no desenvolvimento do Kinect 2.0, trabalhando em um projeto que terá impacto imediato no mercado. Para aqueles de nós que têm exigido uma maior participação da Microsoft Research nos produtos de Redmond, esta é uma boa notícia.
Kinect é também a demonstração tangível de que a Microsoft Research é muito mais que um laboratório de ideias, é um capital fundamental para o futuro da Microsoft .
Via | O blog oficial da Microsoft | TechCrunch