Hola a todos:
Ando buscando algún componente para realizar lecturas OCR, es igual que sea
de pago o Free. Explico el problema, no vaya a ser que me haya encegado y no
vea otra solución.
Me llegan unos ficheros PDF con varias hojas. Cada página representa un
formulario estándar (tengo de antemano las coordenadas del área que necesito
leer). Cada página deberá almacenarse como fichero PDF con el nombre que he
leido, mediante OCR, en el área antes mencionada. Luego tengo que subirlo a
Ftp, pero eso ya lo tengo.
Os explico el procedimiento seguido hasta ahora:
1) Recuperación del fichero PDF
2) Separación de las páginas del fichero (usando la librería PDFSharp)
3) Pasar cada página a un formato gráfico (no lo tengo hecho, pero recuerdo
haber hecho alguna prueba, es cuestión de buscarlo bien)
4) Con las librerías MODI de Office 2007, consigo hacer un OCR de un
gráfico, que es el área leida del gráfico (aquí me lo estoy pasando bien
cuando no se lee a la primera por tener el documento torcido o con mala
calidad... Había pensado hacer un "selector de área de imagen" pero creo que
en la primera versión saldrá para que el usuario escriba el texto a mano,
que me está dando mucho por saco el tema de los gráficos en pantalla
trabajando con Zooms)
5) Una vez tenga el nombre del fichero, me tocará hacer la inversa del paso
3, es decir, un TiffToPDF.
Si alguien ha tenido el mismo problema o tiene alguna idea mejor, siempre
será bienvenida.
Gracias por anticipado
Leer las respuestas