vlibras-widget-ocr: A JavaScript repository from diegofrr

Versão BETA

Feature para reconhecimento de caracteres em imagens e tradução em Libras utilizando o VLibras Widget

⚠️ IMPORTANTE ⚠️
Devido ao novo layout implementado no VLibras Widget, esta solução pode apresentar problemas.
Brevemente, correções necessárias serão implementadas.

📝 Sobre

VLibras Widget

Entre o conjunto de ferramentas que fazem parte da família Suíte VLibras, faz-se relevante o VLibras Widget, este, ao ser integrado em um site, fica responsável por torná-lo acessível para pessoas surdas, possibilitando que estas realizem a tradução dos textos incorporados na página para Língua Brasileira de Sinais (Libras) utilizando um personagem 3D animado.

Motivação

O VLibras Widget continua envoluindo com o tempo tornando o acesso à informação ainda mais amplo, contudo, apesar da ótima solução que se tornou, existe uma limitação importante nesta ferramenta, que é a impossibilidade de traduzir textos contidos em imagens, como fotos, gráficos e logotipos, o que cria uma barreira para o acesso à informação para usuários surdos e deficientes auditivos, visto que não é possível realizar a tradução das informações presentes em imagens nos sites. Diante desta limitação, o objetivo geral deste trabalho é desenvolver uma expansão para a ferramenta que torne também possível a tradução de textos originários de imagens utilizando o reconhecimento óptico de caracteres (OCR, em inglês), tornando o acesso à informação mais completo e inclusivo aos surdos.

🧪 Como testar

Copie o script da feature já "buildado" em /dist/bundle.js;
Vá até um site que tenha o VLibras Widget. Ex. de sites do governo: Portal da Legislação, Ministério da Defesa, Ministério da Saúde e etc. (veja outros sites em: /sites-list.txt);
Abra o devtools do seu navegador com F12 ou Ctrl + Shift + C, cole e execute o script do bundle.js;
Inicie o VLibras Widget: clique no botão flutuante das mãozinhas ao lado direito da página;
Utilize a funcionalidade selecionando uma imagem do site que contenha texto.

⚠️ Existe a possiblidade de alguns sites ficarem mal formatados e/ou quebrados após a implementação, retornando ao normal ao fechar o Widget ou, em casos super isolados, sendo necessário atualizar a página.

🚀 Roadmap

Ferramenta

Aplicar escala de cinza nas imagens antes de enviar para reconhecimento de caracteres;
Atualização para as versões mais atuais das bibliotecas Tesseract.js e Cropper.js;
Configurar ESlint + Prettier;
Tratamento específico para imagens com background transparente;
Implementar pré-processador CSS ao invés de CSS puro;

Outros

Pesquisa de experiência de utilização junto a um grupo de deficientes auditivos;
Transformar em função padrão do VLibras Widget.

🛠️ Stack

JavaScript
HTML
CSS
Webpack
Tesseract.js
Cropperjs
Feather Icons

📷 Screenshots

Modal que é aberto ao clicar em uma imagem. Aqui o usuário faz a seleção de uma área da imagem para extração e tradução do texto em Libras. A utilização deste passo (levando em consideração que o usuário faça a seleção adequada de uma área da imagem com textos) aumenta a chance de acerto do algorítimo que realiza o reconhecimento de caracteres, o que não seria possível se a imagem completa fosse passada diretamente.

Imagens filhas de tags âncoras/links que, ao serem clicadas, fazem o redirecionamento do usuário, têm o redirecionamento do seu pai removido e é adicionado o tooltip "Acessar link" próximo ao seu bottom, assim, possibilitando o usuário clicar na imagem sem ser redirecionado pelo site e, caso queira acessar o link, pode clicar no tooltip.

diegofrr/vlibras-widget-ocr

📝 Sobre

🧪 Como testar

🚀 Roadmap

🛠️ Stack

📷 Screenshots