>> Tecnologia eletrônica >  >> Lar inteligente >> Vida Inteligente

As desvantagens do OCR


O Serviço Postal dos EUA usa a tecnologia de reconhecimento óptico de caracteres (OCR) para ler os endereços em correspondências. Para que o correio possa ser lido por um classificador de correio OCR, no entanto, os endereços e as fontes precisam ser formatados de uma determinada maneira. O software OCR é útil para converter imagens digitalizadas de documentos digitados ou manuscritos em texto eletrônico pesquisável, mas tem desvantagens que limitam suas aplicações.

Documentos limitados


OCR funciona melhor com documentos digitados de boa qualidade. Documentos manuscritos não podem ser lidos facilmente pelo software OCR. Da mesma forma, fontes digitadas que se assemelham a escrita à mão - assim como fontes não latinas - criam muitos erros durante o processo de OCR. Se o documento tiver pouco contraste, estiver amassado ou sujo, ou o texto e o fundo forem semelhantes na escuridão, o OCR pode não funcionar bem. OCR tem dificuldade com documentos que possuem imagens e texto. As planilhas também produzirão mais erros.

Precisão


Nenhum software OCR é 100% preciso. O número de erros depende da qualidade e do tipo de documento, incluindo a fonte usada. Os erros que ocorrem durante o OCR incluem letras incorretas, pular letras ilegíveis ou misturar texto de colunas adjacentes ou legendas de imagens. Se for necessária alta precisão - como na conversão de livros digitais para formato eletrônico -, será necessária uma limpeza do texto eletrônico.

Soluções alternativas


O OCR tem dificuldade em diferenciar entre caracteres, como o número zero e um "O" maiúsculo. Para contornar isso, uma fonte OCR especial pode ser usada, como escrever zero. No entanto, isso funciona apenas para documentos criados com OCR em mente, como questionários. Ao criar questionários que serão escritos à mão, os pesquisadores também usam caixas para cada letra.

Trabalho Adicional


Mesmo que a imagem digitalizada do documento original seja de alta qualidade, etapas adicionais devem ocorrer para limpar o texto OCR. É muito trabalhoso corrigir os erros criados pelo OCR. Uma pessoa tem que comparar manualmente o documento original e o texto eletrônico. As pessoas também cometem erros ao digitar o texto de um documento, mas às vezes é mais rápido pular a etapa de OCR.