Componente OCR

09/09/2009 - 12:27 por alskare | Informe spam

Hola a todos:

Ando buscando algún componente para realizar lecturas OCR, es igual que sea
de pago o Free. Explico el problema, no vaya a ser que me haya encegado y no
vea otra solución.

Me llegan unos ficheros PDF con varias hojas. Cada página representa un
formulario estándar (tengo de antemano las coordenadas del área que necesito
leer). Cada página deberá almacenarse como fichero PDF con el nombre que he
leido, mediante OCR, en el área antes mencionada. Luego tengo que subirlo a
Ftp, pero eso ya lo tengo.

Os explico el procedimiento seguido hasta ahora:

1) Recuperación del fichero PDF
2) Separación de las páginas del fichero (usando la librería PDFSharp)
3) Pasar cada página a un formato gráfico (no lo tengo hecho, pero recuerdo
haber hecho alguna prueba, es cuestión de buscarlo bien)
4) Con las librerías MODI de Office 2007, consigo hacer un OCR de un
gráfico, que es el área leida del gráfico (aquí me lo estoy pasando bien
cuando no se lee a la primera por tener el documento torcido o con mala
calidad... Había pensado hacer un "selector de área de imagen" pero creo que
en la primera versión saldrá para que el usuario escriba el texto a mano,
que me está dando mucho por saco el tema de los gráficos en pantalla
trabajando con Zooms)
5) Una vez tenga el nombre del fichero, me tocará hacer la inversa del paso
3, es decir, un TiffToPDF.

Si alguien ha tenido el mismo problema o tiene alguna idea mejor, siempre
será bienvenida.

Gracias por anticipado

Siga el debate

1 respuesta

Tengo una respuesta

Preguntas similare

Mostrar todos los temas similares

Leer las respuestas

#1 alskare

04/10/2009 - 11:31 | Informe spam

Bueno, al final he conseguido una solución parcial. Todavía me falta el tema
del OCR, pero como soy muy cabezota, al final conseguiré mi propósito.

Explico un poco los procedimientos por si puede servirle a alguien:

1) Recuperación del fichero del PDF: La librería PDFSharp me permite el
tratamiento del documento original, leyendo la información de cada página
(le asigno nombre y leo el tamaño de la página)
2) Tratamiento, por parte del usuario de las páginas del fichero PDF: Las
librerías Pdf2Image me permiten crear un objeto Image de la página que
seleccione. A partir de aquí es sencillo hacer una vista previa de la página
en un objeto PictureBox, gracias al tamaño leido en el paso 1. (De hecho, he
creado un grid en el que el usuario puede cambiar el nombre del fichero.
Ahora se hace a mano, pero supongo que lo suyo sería poder hacer uso de
algún OCR para que obtenga automáticamente un nombre de fichero en base a un
área del documento y que sólo se tenga que retocar aquellos ficheros con una
"mala lectura").
3) Una vez tengo los nombres correctos, de nuevo la clase PDFSharp me
permite el desglose del documento original en pdf en páginas. Un poco de
DotNet ya me permite seleccionar si quiere guardarse los resultados en una
carpeta o subirlos directamente a un servidor FTP.

Bueno; de momento, con esto tiro... Me queda el tema del OCR, así que sigo
con el tema y en el momento que consiga algo más o menos coherente, os digo
cómo ha ido el tema.

"alskare" escribió en el mensaje
news:

Hola a todos:

Ando buscando algún componente para realizar lecturas OCR, es igual que
sea de pago o Free. Explico el problema, no vaya a ser que me haya
encegado y no vea otra solución.

Me llegan unos ficheros PDF con varias hojas. Cada página representa un
formulario estándar (tengo de antemano las coordenadas del área que
necesito leer). Cada página deberá almacenarse como fichero PDF con el
nombre que he leido, mediante OCR, en el área antes mencionada. Luego
tengo que subirlo a Ftp, pero eso ya lo tengo.

Os explico el procedimiento seguido hasta ahora:

1) Recuperación del fichero PDF
2) Separación de las páginas del fichero (usando la librería PDFSharp)
3) Pasar cada página a un formato gráfico (no lo tengo hecho, pero
recuerdo haber hecho alguna prueba, es cuestión de buscarlo bien)
4) Con las librerías MODI de Office 2007, consigo hacer un OCR de un
gráfico, que es el área leida del gráfico (aquí me lo estoy pasando bien
cuando no se lee a la primera por tener el documento torcido o con mala
calidad... Había pensado hacer un "selector de área de imagen" pero creo
que en la primera versión saldrá para que el usuario escriba el texto a
mano, que me está dando mucho por saco el tema de los gráficos en pantalla
trabajando con Zooms)
5) Una vez tenga el nombre del fichero, me tocará hacer la inversa del
paso 3, es decir, un TiffToPDF.

Si alguien ha tenido el mismo problema o tiene alguna idea mejor, siempre
será bienvenida.

Gracias por anticipado

Siga el debate Respuesta

Responder a este mensaje

Ads by Google

Hacer una pregunta

Tengo una respuesta

Busqueda sugerida