¿Cómo extraer datos de una página web?

28/02/2006 - 22:14 por XTV | Informe spam
Hola a tod@s;

necesito crear un programa que sea capaz de extraer a una base de datos
los movimientos bancarios que se muestran en diferentes servicios de banca
por internet. La idea es poder leer la fecha de los movimientos junto con su
descripción y el valor del moviento.

El problema es que cada banco usa un formato concreto y diferente al
resto, tal vez necesite hacer un parser diferente para cada banco; lo que
pasa es que no sé cómo hacerlo.

¿Se le ocurre a alguien cómo hacerlo, o alguna otra solución?

Muchas gracias
 

Leer las respuestas

#1 A.Poblacion
28/02/2006 - 22:29 | Informe spam
"XTV" wrote in message
news:
necesito crear un programa que sea capaz de extraer a una base de datos
los movimientos bancarios que se muestran en diferentes servicios de banca
por internet. La idea es poder leer la fecha de los movimientos junto con
su descripción y el valor del moviento.

El problema es que cada banco usa un formato concreto y diferente al
resto, tal vez necesite hacer un parser diferente para cada banco; lo que
pasa es que no sé cómo hacerlo.

¿Se le ocurre a alguien cómo hacerlo, o alguna otra solución?



Eso se denomina "screen-scraping" ("rascado de pantalla") y hay varias
técnicas para conseguirlo, casi todas basadas en el empleo de expresiones
regulares (clase RegEx en .Net). Cambiando la expresión regular se puede
conseguir extraer los datos deseados de distintas páginas web sin modificar
el programa. Tienes código de ejemplo en este artículo:

http://msdn2.microsoft.com/en-us/li...90407.aspx

Preguntas similares