Notícia

O Dropbox incorpora a pesquisa de texto em documentos e imagens em pdf

Índice:

Anonim

Pela segunda vez em apenas dois meses, o Dropbox aprimorou seu sistema de pesquisa para que agora seja possível pesquisar texto em documentos PDF e até arquivos de imagem como PNG ou JPG.

Dropbox: encontre o que você quer onde quiser

Parece que essa é a premissa do Dropbox, a popular plataforma de armazenamento em nuvem que nos últimos meses se concentrou em melhorar seu sistema de busca. No mês passado, a empresa lançou um novo mecanismo de pesquisa baseado em aprendizado de máquina e agora anuncia que está aprimorando os recursos de reconhecimento óptico de caracteres (OCR) que permitem aos usuários pesquisar texto em arquivos PDF e de imagem.

“Os formatos de imagem (como JPEG, PNG ou GIF) geralmente não são indexáveis ​​porque não possuem conteúdo de texto, enquanto os formatos de documento baseados em texto (como TXT, DOCX ou HTML) são geralmente indexáveis. Os arquivos PDF são deixados no meio, pois podem conter uma mistura de conteúdo de texto e imagem. O reconhecimento automático de texto da imagem é capaz de distinguir inteligentemente entre todos esses documentos para categorizar os dados que ela contém.

Apesar das boas notícias, no momento essa nova melhoria é limitada em dois aspectos. Por um lado, parece estar limitado ao idioma inglês:

Portanto, agora, quando um usuário realiza uma pesquisa de texto em inglês que aparece em um desses arquivos, ela aparece nos resultados da pesquisa.

Por outro lado, como Jon Porter coleta no The Verge, a função é limitada aos níveis de assinatura mais caros.

O novo recurso já está disponível para usuários do Dropbox Business Advanced e Enterprise e deve estar disponível para assinantes profissionais do Dropbox nos próximos meses.

A operação é semelhante à tecnologia já implementada no aplicativo móvel Dropbox no ano passado: usar o aplicativo para fotografar um documento, mas executar o OCR ao mesmo tempo para extrair o texto. No entanto, isso funcionou apenas com um pequeno subconjunto dos documentos.

Ao implementar os recursos de OCR diretamente no mecanismo de pesquisa, o Dropbox agora pode pesquisar texto em todos os seus arquivos e imagens PDF, independentemente de como eles foram digitalizados ou fotografados.

Fonte do DropboxThe Verge

Notícia

Escolha dos editores

Back to top button