>> Tecnologia eletrônica >  >> Lar inteligente >> Vida Inteligente

Como converter PDF para OCR


Quando um documento impresso é digitalizado e salvo no formato PDF, o computador não sabe a diferença entre a página de texto digitalizada e uma fotografia. Assim, você não pode pesquisar ou selecionar qualquer texto na página para copiar e colar. Se você quiser pesquisar ou selecionar texto, deverá executar o reconhecimento óptico de caracteres (OCR) no documento. O Adobe Acrobat Professional fornece essa funcionalidade, mas a versão gratuita do Adobe Acrobat não. Se você não tiver o Acrobat Professional, observe que existe um software diferente do Acrobat Professional para executar o OCR em um documento PDF e pode ser encontrado pesquisando na web.

Etapa 1


Carregue o Adobe Acrobat Professional. O recurso OCR do Acrobat Professional não está disponível por meio do plug-in do navegador da Web, portanto, é necessário carregar o programa real.

Etapa 2


Carregue um documento PDF com texto que você não pode selecionar para copiar e colar. Esses documentos geralmente são produzidos digitalizando um documento e salvando o documento no formato Adobe Acrobat PDF. (Consulte Recursos para obter um documento de amostra, se desejar praticar com um.)

Etapa 3


Execute o OCR no documento. No Adobe Acrobat Professional, clique no menu "Documento", selecione "Reconhecimento de texto OCR" e clique em "Reconhecer texto usando OCR".

Etapa 4


Escolha as opções de OCR aplicáveis. Depois de clicar em "Reconhecer texto usando OCR", uma nova janela aparecerá solicitando que você selecione o intervalo de páginas no qual deseja executar o OCR. Você pode executar o OCR em todo o arquivo PDF ou restringir o reconhecimento de OCR a apenas algumas páginas. Depois de escolher quantas páginas você deseja executar o OCR, clique em “OK”. O Acrobat Professional agora começará a reconhecer o texto nas páginas do documento.

Etapa 5


Pesquise texto, assim que o OCR estiver completo, e copie e cole o texto da mesma forma que você faria com um PDF destilado do Microsoft Word. Observe, no entanto, que a tecnologia OCR não é perfeita. O OCR pode não reconhecer corretamente certas palavras e pode perder algum texto completamente. O OCR funciona melhor com imagens perfeitamente claras do texto, algo que nem sempre é possível com documentos digitalizados.