sábado, 19 de janeiro de 2008

OCR, o salva-livros

A maioria das impressoras modernas vêm já equipadas com função de digitalização e fotocópia. São as chamadas impressoras multifunções e estão ao acesso de (quase) todos. Permitem, por isso, transformar um livro em papel num livro electrónico com bastante comodidade.

Coloca-se o livro em papel na impressora / digitalizador, carrega-se num botão, vão-se virando as páginas e, por magia, estas vão surgindo no ecrã do computador, como se de fotografias se tratassem.

Basta depois correr um programa de OCR, de reconhecimento óptico de caracteres (ou, em Inglês, Optical Characters Recognition).

Esse programa irá observar informaticamente essas fotografias e interpretar todos os borrões de tinta. Determinará se estes correspondem a alguma letra ou sinal de pontuação. No final, será gerado um ficheiro de texto, editável, por exemplo, no Word da Microsoft.

Este tipo de programas tem uma enorme utilidade para cientistas e investigadores. Basta-lhes digitalizar e reconhecer as páginas dos livros que pretendem citar, copiar e colar os excertos nas suas teses.

Mudar o tipo de letra, a cor do texto, colocar o livro a gosto ou transportá-lo num CD são apenas algumas das possibilidades.

Outra, eventualmente a mais benemérita, é passar para formato electrónico livros antigos isentos de direitos autorais e colocá-los à disposição do público na Internet.

Dentro dos mais populares programas de OCR encontram-se o Abby Finereader e o Omnipage.

O utilizador lusófono deve sempre certificar-se que o programa inclui um pacote para o Português.

E está pronto para pegar nos Machado de Assis que tem na biblioteca da sua avó e guardá-los no seu computador ou partilhá-los, digitalmente, com os seus colegas.



(Ver: PergFreq do Projecto Gutenberg sobre digitalizadores e OCR.)

2 comentários:

Kalim disse...

recive mis saudades, en portuñol, de un lector de gutvol-d-request@lists.pglaf.org. avante!
Larry Gates

J. S. Fernandes disse...

Achei o ABBYY mais atual e disponibilizo na rede! Instalem e curtam! jsfernandes.webnode.com/news/converter-imagens-em-texto-com-abbyy-finereader-ocr-reconhecimento-optico-de-caracteres-/