.JPG pasarlo a WORD

09/06/2009 - 22:47 por Yuver | Informe spam
Buen día,

Tengo un archivo de imágen llamado: "Texto .JPG", aunque es una imágen
contiene solo texto, lo abro con el "Visor de imágenes y fax de Windows",
desde allí lo grabo en el formato TIFF como: "Texto.TIF", luego tomo ese
archivo, lo abro con "Microsoft Office Document Imaging", lo proceso con la
opción: "Enviar texto a Word", se hace el proceso con el OCR y cuando termina
guardo el documento como: "Texto.doc". Así convierto el contenido de una
imágen .JPG en formato .doc.

La pregunta es: ¿Como hago esto de forma automática? No quiero hacerlo con
los pasos anteriores, quiero que sea de forma automática, algo así como
usando parámetros en una línea de comandos. ¿Es eso posible? (Uso lenguaje de
programación VFP)

Gracias de antemano.

Preguntas similare

Leer las respuestas

#11 Yuver
18/06/2009 - 14:18 | Informe spam
Bien, muchas gracias.

No mas haga las pruebas hago comentarios.



"zopita" wrote:

Las macros que crea Macro Scheduler (otras no sé, que de programación no
tengo ni idea) son posibles mientras todo el proceso puedas hacerlo a golpe
de tecla. Y el proceso, claro está, tiene que estar bien organizado, como tú
tenías el tuyo: para pasar de JPG a DOC pasas por una fase intermedia que es
la conversión a TIFF. Y así:

JPG (visor de imágenes) TIFF (Document Imaging) DOC.
Vamos, que se trata de buscar las herramientas que te permitan dar esos
saltos a base de teclas. El visor de imágenes no lo permite, así que hay que
descartarlo y buscar otra herramienta: Paint.

Y en lo que preguntas ahora, la cosa es igual: buscar una herramienta que

- convierta directamente el PDF en texto plano o texto con formato DOC
(software tipo OmniPage)

- convierta el PDF a JPG, con lo que irías al principio del proceso del que
hablábamos antes

- convierta el PDF a TIFF, que nos lleva a donde nos llevaba antes el Paint.

Photoshop puede convertirte un PDF en un archivo de imagen, JPG o TIFF entre
ellos, así que el problema está resuelto. Únicamente tendrías que ver qué
pasos tienes que dar en Photoshop para hacerlo, lo mismo que antes se hacía
con Paint.

Sugerencia: en Photoshop puedes abrir un PDF por el método pedestre del
Archivo/Abrir pero tiene un pequeño problema: si el PDF tiene más de una
página te pregunta cuál de esas páginas quieres abrir, lo que supone ir
seleccionando 1, 2, 3, etc. Pero en Archivo/Automatizar tienes la opción "PDF
multipágina a PSD", con lo que te abre todas las páginas de forma individual
y luego ya las conviertes en TIFF. Este proceso, en el interior de Photoshop,
lo puedes automatizar creando una Acción (que no es sino una macro de
Photoshop) y asignándole un atajo de teclado. Imagínate que este atajo es,
pongamos por caso, "Alt+\". En tu macro Scheduler, que al fin y al cabo es la
que controla todo el cotarro, en las líneas correspondientes tendrían que
estar las órdenes "activa la ventana Photoshop - pulsa Alt - pulsa \ " (aquí
se produciría la conversión en masa de los pdf a tif), y a partir de ahí
continuar con el resto del procedimiento. ¿Vale?

Pues venga, ya tienes deberes para hacer, que tampoco es cuestión de
masticártelo toíto :)

Saludos cordiales.

"Yuver" escribió:

> Excelente Zopita, seguiré todas tus instrucciones y te comento los
> resultados. Ahora me surge una pregunta ¿Este método también sirve para pasar
> información de un .PDF (no imágen sino texto) a word o a texto?
>
> Quedo en espera de tu respuesta.
>
> "zopita" wrote:
>
> > Yuver, yo también soy partidaria de compartir la información. Mi reserva
> > venía sencillamente de que hablar aquí de un producto no-Microsoft pudiera
> > incomodar. Si se me nota el entusiasmo que siento hacia el creador de macros
> > Macro Scheduler no es porque tenga comisión (jajajaja) sino porque me ha
> > ahorrado miles, sí, miles de horas de trabajo escasamente creativo. Ponte
> > cómodo que allá va el rollo.
> >
> > Se crea un archivo Word con una tabla de dos columnas, en la izquierda con
> > los nombres originales de los jpg y en la derecha el nombre con el que se
> > quieran guardar los archivos docs finales, pero con extensión tif.
> > 1.jpg "hecho_1.tif"
> > 2.jpg hecho_2.tif
> > 3.jpg hecho_3.tif
> >
> > (Hay utilidades para sacar una lista de los archivos de un directorio, y
> > otras utilidades para renombrar archivos de forma masiva, como el NameWiz)
> >
> > Si no se quiere cambiar el nombre, en la segunda columna se repiten los
> > valores de la primera pero con extensión TIF (1.tif, 2.tif, 3.tif...)
> >
> > Se inician Paint y Document Imaging además del Word anterior.
> > Hacer activa la ventana Word y seleccionar "1.jpg". A partir de aquí empieza
> > la función. La secuencia de teclas para procesar este archivo sería:
> >
> >
> > Ctrl+X corta y pone en el portapapeles el texto 1.jpg
> >
> > *************Hacer activa la ventana Paint
> >
> > Alt+A (menú archivo)
> > A (ventana Abrir Archivo)
> > Ctrl+V (pega el nombre del archivo 1.jpg)
> > Intro (se abre el archivo 1.jpg)
> > Hacer activa la ventana Word
> > Tab (selecciona el nombre final del archivo "hecho_1.tif")
> > Ctrl+X (corta ese nombre y lo pone en el portapapeles)
> > Tab (selecciona el nombre del segundo jpg (2.jpg) y queda listo para el
> > siguiente bucle)
> >
> > *************Hacer activa la ventana Paint
> > Alt+A (Menú Archivo)
> > M (guardar como)
> > Ctrl+V (pega el nombre final del archivo "hecho_1.tif")
> > Alt+O (salta a "Tipo de archivo")
> > T (Selecciona el formato TIF)
> > Intro (confirmar)
> > El archivo queda guardado con formato TIF
> >
> > *************Hacer activa la ventana Document Imaging
> > Alt+A (Menú Archivo)
> > A (abrir archivo)
> > Ctrl+V (pega el nombre del archivo "hecho_1.tif")
> > Intro (se abre el tif)
> > Alt+H (menú herramientas)
> > E (enviar texto a Word)
> > Intro (confirma las opciones de la ventana)
> > Intro (da la orden de empezar el OCR); una vez hecho se abre una ventana
> > de word con el título "hecho_1.htm"
> >
> > *************En esta ventana de Word
> > Alt+A (menú Archivo)
> > U (Guardar como)
> > Alt+T (tipo de archivo)
> > Tecla Inicio (salta al primero de la lista, que es el formato doc)
> > Intro (se confirma ese tipo de archivo)
> > Intro (el archivo queda guardado)
> > Alt+A menú Archivo
> > S (cierra esta ventana de Word; si no se hiciera así, con cada
> > archivo abriría una ventana nueva)
> >
> > *************Hacer activa la ventana Document Imaging
> > Alt+A (menú Archivo)
> > C (cerrar)
> > Alt+S o Alt+N, según se quiera o no guardar los cambios en el tif (el
> > escaneo OCR)
> >
> >
> > *************Hacer activa la ventana Word donde está la tabla con los
> > nombres de archivo. Ya está seleccionado el siguiente JPG (2.jpg) y por tanto
> > todo listo para empezar de nuevo el proceso.
> >
> > ********************************************************
> >
> > Este tipo de trabajos lo hago con un programa de macros que se llama Macro
> > Scheduler que llevo usando un montón de años. En la página del fabricante
> > (http://www.mjtnet.com/) puedes descargar una versión de prueba completa,
> > funcional durante 30 días.
> > El manejo es muy sencillo: basta con pedir que grabe una nueva macro y se
> > van pulsando las teclas que he puesto más arriba (lo he hecho a todo correr,
> > no te extrañes si hay alguna metedura de pata). Se asigna a la macro una Hot
> > Key y al pulsarla se pone en marcha todo el proceso. Es importante que este
> > proceso se haga a golpe de tecla, no picando los menús con el ratón (el
> > cambio de ventana es lo único que se puede hacer con clic, si mal no
> > recuerdo).
> >
> > Para crear una macro que automatice tareas de este tipo yo suelo hacer lo
> > siguiente:
> >
> > 1. Hago todo el proceso manualmente y voy anotando las pulsaciones de las
> > teclas, desechando las de seleccionar las carpetas donde tiene que buscar los
> > archivos para abrir y donde debe guardarlos
> >
> > 2. Grabo la macro siguiendo las pulsaciones anotadas, y así veo si he puesto
> > alguna cosa mal.
> >
> > 3. Si es correcto, ejecuto la macro y veo qué tal va.
> >
> > 4. Si la macro funciona correctamente, añado al principio una etiqueta
> > "label>empezar" y al final un "GoTo>empezar" para que se repita el bucle.
> >
> > Otra cosa importante es borrar los resultados de estas pruebas (archivos
> > TIF, HTM y DOC) porque si no, cuando la macro guarde el nuevo archivo
> > aparecerá la ventanita de "Este archivo ya existe, ¿desea reemplazarlo?", que
> > es una novedad para la macro y que se quedaría ahí parada.
> >
> > Y otra cosa importante: la primera transformación hay que hacerla de forma
> > artesanal para que al abrir un archivo y al guardarlo queden fijados los
> > directorios de trabajo. Luego ya se puede ejecutar la macro.
> >
> > Otra cosa maja que tiene Macro Scheduler es que cuando un proceso (como el
> > OCR) tiene una duración variable, se mete un comando muy simplote que ordena
> > a la macro esperar hasta que la ventanita que marca el proceso de ese OCR se
> > cierre. Y una multitud más de comandos, que si tienes conocimientos de
> > programación los pillarás en un plis-plas.
> >
> > No sé si me dejo algo. Como suele ocurrir, explicar una cosa es 100 veces
> > más largo que hacerla y me he quedado con la lengua seca.
> >
> > Espero que todo esto te sea de utilidad. Valor y al toro :)
> >
> >
> >
> > "Yuver" escribió:
> >
> > > Gracias por tu colaboración, mi correo es: , aunque he
> > > aprendido en estos foros que es mejor dejar las respuestas aquí, ya que otras
> > > personas pueden tener la misma necesidad y ellos también se benefician.
> > > Gracias.
> > >
> > > "zopita" wrote:
> > >
> > > > Yuver, ya tengo todo organizado en la cabeza -me encantan estos retos- y creo
> > > > que la solución de tu problema es muy fácil siempre que utilices un programa
> > > > creador de macros. El que yo utilizo no es de Microsoft así que igual es
> > > > preferible no dar el nombre aquí y hacerlo por correo privado, ¿qué te parece?
> > > >
> > > > El proceso viene a ser exactamente el que tú sigues (abro por aquí, guardo
> > > > como, vuelvo a abrir por allá, ejecuto el OCR...) pero automatizado, claro.
> > > > Si me das una forma de contacto te paso los detalles, mayormente porque poco
> > > > tiene que ver con el tema de este foro.
> > > >
> > > > Sólo te aclaro dos cosas que te han dejado un poco mosca. Te preguntaba por
> > > > el Photoshop porque si tienes un montón de archivos para tratar, photoshop te
> > > > los pasa de jpg a tif en menos que pía un pollo, y eso que llevas ganado.
> > > >
> > > > Y lo del Paint en lugar del visor. Con vistas a las macros, Paint tiene la
> > > > opción Archivo/Abrir y Archivo/Guardar accesibles desde el teclado, y por
> > > > tanto con una secuencia de teclas. Document Imaging no te da esa posibilidad,
> > > > lo que quiere decir que tendrías que seguir haciéndolo a manopla. En el que
> > > > tengo no funciona ni la combinación Ctrl+G por mucho que el "bocadillo" del
> > > > icono Guardar lo diga.
> > > >
> > > > Pues lo dicho. Si me dices cómo podemos contactar -no sé cómo funcionan
> > > > estos foros- te doy todos los detalles.
> > > >
> > > > Saludos cordiales.
> > > >
> > > >
> > > >
> > > > "Yuver" escribió:
> > > >
> > > > > Si tengo el photoshop.
> > > > >
> > > > > "zopita" wrote:
> > > > >
> > > > > > Pues alguna cosa tengo en mente, a ver si consigo afinarla. Si tuvieras el
> > > > > > Photoshop (yo no tengo otro programa de retoque de imagen) la cosa se
> > > > > > simplificaría un montón. Esta tarde le dedico otro ratillo, a ver qué sale :)
> > > > > >
> > > > > > Ah, dime si tienes el Photoshop, por favor.
> > > > > >
> > > > > >
> > > > > >
> > > > > > "Yuver" escribió:
> > > > > >
> > > > > > > Si, se puede abrir en Paint sin que la calidad de la imagen del texto se
> > > > > > > reduzca.¿?
> > > > > > >
> > > > > > > "zopita" wrote:
> > > > > > >
> > > > > > > > Yuver, una pregunta.
> > > > > > > >
> > > > > > > > En lugar de abrirlo en el Visor de Imágenes, ¿puedes hacerlo con Paint sin
> > > > > > > > que la calidad del OCR se reduzca?
> > > > > > > >
> > > > > > > >
> > > > > > > >
> > > > > > > > "Yuver" escribió:
> > > > > > > >
> > > > > > > > > Buen día,
> > > > > > > > >
> > > > > > > > > Tengo un archivo de imágen llamado: "Texto .JPG", aunque es una imágen
> > > > > > > > > contiene solo texto, lo abro con el "Visor de imágenes y fax de Windows",
> > > > > > > > > desde allí lo grabo en el formato TIFF como: "Texto.TIF", luego tomo ese
> > > > > > > > > archivo, lo abro con "Microsoft Office Document Imaging", lo proceso con la
> > > > > > > > > opción: "Enviar texto a Word", se hace el proceso con el OCR y cuando termina
> > > > > > > > > guardo el documento como: "Texto.doc". Así convierto el contenido de una
> > > > > > > > > imágen .JPG en formato .doc.
> > > > > > > > >
> > > > > > > > > La pregunta es: ¿Como hago esto de forma automática? No quiero hacerlo con
> > > > > > > > > los pasos anteriores, quiero que sea de forma automática, algo así como
> > > > > > > > > usando parámetros en una línea de comandos. ¿Es eso posible? (Uso lenguaje de
> > > > > > > > > programación VFP)
> > > > > > > > >
> > > > > > > > > Gracias de antemano.
email Siga el debate Respuesta Responder a este mensaje
Ads by Google
Help Hacer una pregunta AnteriorRespuesta Tengo una respuesta
Search Busqueda sugerida