Microsoft Research cria um sistema capaz de gerar legendas "inteligentes" automaticamente
Índice:
Com certeza você já se deparou com uma legenda confusa, incorreta ou que fala pouco sobre a imagem a que se refere; e é até possível que, se você se dedica a publicar seus próprios artigos, ache mais tedioso preencher esta seção. Bem, o pessoal de Redmond criou uma ferramenta que visa facilitar as coisas para você.
Trabalho publicado pela Microsoft Research que se descreve como um “sistema de geração de legendas” capaz de imitar as características narrativas da linguagem humana, ou seja, uma tecnologia que pode descrever screenshots como se fosse sobre um de nós, com seu contexto correspondente.Algo em que empresas como Facebook, Microsoft e Google vêm trabalhando há algum tempo, mas desta vez supera as expectativas.
Em que consiste
Ele teve um bom momento
Dessa forma, o sistema tem a capacidade de contar até mesmo uma história completa a partir de várias imagens, descrevendo-a e contando-a como se fosse um livro. Um utilitário que, segundo especialistas, pode acabar se tornando um recurso que dá um toque mais humano a determinados aplicativos, aplicativos de reconhecimento de voz, geração automática de descrições em outras áreas e muito mais.
E o fato é que a ferramenta não se limita a dizer, resumidamente, o que ela “vê”, mas dá uma visão mais ampla contexto da situação que se reflete na imagem, conseguindo um “contexto narrativo e um estilo único de narração”, explicou Frank Ferraro, um dos autores desta obra.Para nos colocarmos em uma situação, ele nos dá um exemplo
Sua mãe estava orgulhosa deleDessa forma, propomos o seguinte caso: “Vamos imaginar que temos um álbum de fotos de alguns amigos que fizeram aniversário em um Bar. Algumas das primeiras imagens mostram pessoas pedindo cerveja e bebendo, enquanto as últimas mostram alguém dormindo em um sofá”, comenta.
Um sistema convencional “poderia simplesmente apontar para algo como uma pessoa deitada em um sofá, enquanto nosso sistema poderia incluir que provavelmente ela está nessa situação porque está bêbada depois de tomar alguns drinques” . Um acréscimo que proporciona compreensão e uma certa carga emocional que também se reflete nas imagens e legendas das fotos incluídas neste artigo.
Via | Revisão de Tecnologia do MIT
No Xataka Windows | Microsoft lança aplicativo que determina a raça do seu cão