Pesquisadores da Universidade de East Anglia, no
Reino Unido, desenvolveram um sistema que consegue interpretar as palavras
ditas por um ser humano por meio da leitura labial.
A tecnologia usa o
aprendizado de máquina para classificar o aspecto visual de sons produzidos na
fala.
Em testes, mesmo sem conhecer o contexto das frases, o sistema se mostrou
capaz de entender com maior grau de precisão até que os leitores de lábios
humanos.
O principal desafio para as técnicas de leitura
labial é que existem, pelo menos para o olho humano, menos dicas visuais do que
sonoras, em palavras com P, B e M, por exemplo, o que normalmente causa
dificuldades na tarefa.
No entanto, os novos sistemas são capazes de distinguir
pequenas variações entre as pronúncias, algo que as pessoas não conseguem
perceber.
Aplicações
Por enquanto, o sistema está em fase de testes,
mas, segundo os pesquisadores, existem dezenas de aplicações para a tecnologia,
como ajudar deficientes auditivos, melhorar o entendimento de vídeos de câmeras
de segurança sem áudio e até automatização de legendas.
Via TechCrunch
Nenhum comentário:
Postar um comentário