[OFF-TOPIC] Comparación de Palabras

09/06/2005 - 18:31 por JOSE DAVID GALVIZ M | Informe spam
Amigos, antes que nada perdón por el off topic.

La idea es la siguiente, tengo en una base de datos almacenado en una tabla,
una gran cantidad de texto, el contenido de cada registro de la tabla es un
parrafo de un libro.

Lo que necesito, es que dado un parrafo escrito por el usuario, buscar en la
base de datos los parrafos parecidos a este (Pueden varias por letras,
faltar alguna palabra, tener algunas palabras de mas, modificar el orden en
algunas palabras)

Tienen idea de que herramienta o algun algortimo que me permita hacer esto.




JOSE DAVID GALVIZ MUÑOZ
MCAD - DCE 5 Estrella

Preguntas similare

Leer las respuestas

#11 Ricardo Passians
11/06/2005 - 02:57 | Informe spam
No te serviría contar todas las palabras (o las raíces) coincidentes ?
Eliminando los artículos, claro.


"JOSE DAVID GALVIZ M" wrote in message
news:u8Ey$
Amigos, antes que nada perdón por el off topic.

La idea es la siguiente, tengo en una base de datos almacenado en una


tabla,
una gran cantidad de texto, el contenido de cada registro de la tabla es


un
parrafo de un libro.

Lo que necesito, es que dado un parrafo escrito por el usuario, buscar en


la
base de datos los parrafos parecidos a este (Pueden varias por letras,
faltar alguna palabra, tener algunas palabras de mas, modificar el orden


en
algunas palabras)

Tienen idea de que herramienta o algun algortimo que me permita hacer


esto.




JOSE DAVID GALVIZ MUÑOZ
MCAD - DCE 5 Estrella



Respuesta Responder a este mensaje
#12 Ricardo Passians
11/06/2005 - 02:57 | Informe spam
No te serviría contar todas las palabras (o las raíces) coincidentes ?
Eliminando los artículos, claro.


"JOSE DAVID GALVIZ M" wrote in message
news:u8Ey$
Amigos, antes que nada perdón por el off topic.

La idea es la siguiente, tengo en una base de datos almacenado en una


tabla,
una gran cantidad de texto, el contenido de cada registro de la tabla es


un
parrafo de un libro.

Lo que necesito, es que dado un parrafo escrito por el usuario, buscar en


la
base de datos los parrafos parecidos a este (Pueden varias por letras,
faltar alguna palabra, tener algunas palabras de mas, modificar el orden


en
algunas palabras)

Tienen idea de que herramienta o algun algortimo que me permita hacer


esto.




JOSE DAVID GALVIZ MUÑOZ
MCAD - DCE 5 Estrella



Respuesta Responder a este mensaje
#13 JOSE DAVID GALVIZ M
11/06/2005 - 21:55 | Informe spam
Bueno Ricardo, esta podria ser una de las soluciones, que se asemeja a lo
que enuncia Kraver, ya tengo un algoritmo que me proporciona las diferencias
entre los dos parrafos y eso me proporciona un porcentaje de modificacion.

El problema ahora radica en que debo hacer aproximadamente un millón de
comparaciones y esto tarda demasiado tiempo.

Para solventar esto, estoy a la busqueda de algún algoritmo, que en algo se
parezca a la generación de hash o crc32, pero que no sea tan disperso en sus
resultados, es decir, que si los textos son similares, el resultado del
algoritmo sea cercano, preferiblemente que sea un numero, así al final solo
deberia filtrar en mi base por este valor, para obtener los parrafos
similares, si alguien sabe de algo así, le agradezco.




JOSE DAVID GALVIZ MUÑOZ
MCAD - DCE 5 Estrella


"Ricardo Passians" escribió en el mensaje
news:
No te serviría contar todas las palabras (o las raíces) coincidentes ?
Eliminando los artículos, claro.


"JOSE DAVID GALVIZ M" wrote in message
news:u8Ey$
Amigos, antes que nada perdón por el off topic.

La idea es la siguiente, tengo en una base de datos almacenado en una


tabla,
una gran cantidad de texto, el contenido de cada registro de la tabla es


un
parrafo de un libro.

Lo que necesito, es que dado un parrafo escrito por el usuario, buscar en


la
base de datos los parrafos parecidos a este (Pueden varias por letras,
faltar alguna palabra, tener algunas palabras de mas, modificar el orden


en
algunas palabras)

Tienen idea de que herramienta o algun algortimo que me permita hacer


esto.




JOSE DAVID GALVIZ MUÑOZ
MCAD - DCE 5 Estrella



Respuesta Responder a este mensaje
#14 JOSE DAVID GALVIZ M
11/06/2005 - 21:55 | Informe spam
Bueno Ricardo, esta podria ser una de las soluciones, que se asemeja a lo
que enuncia Kraver, ya tengo un algoritmo que me proporciona las diferencias
entre los dos parrafos y eso me proporciona un porcentaje de modificacion.

El problema ahora radica en que debo hacer aproximadamente un millón de
comparaciones y esto tarda demasiado tiempo.

Para solventar esto, estoy a la busqueda de algún algoritmo, que en algo se
parezca a la generación de hash o crc32, pero que no sea tan disperso en sus
resultados, es decir, que si los textos son similares, el resultado del
algoritmo sea cercano, preferiblemente que sea un numero, así al final solo
deberia filtrar en mi base por este valor, para obtener los parrafos
similares, si alguien sabe de algo así, le agradezco.




JOSE DAVID GALVIZ MUÑOZ
MCAD - DCE 5 Estrella


"Ricardo Passians" escribió en el mensaje
news:
No te serviría contar todas las palabras (o las raíces) coincidentes ?
Eliminando los artículos, claro.


"JOSE DAVID GALVIZ M" wrote in message
news:u8Ey$
Amigos, antes que nada perdón por el off topic.

La idea es la siguiente, tengo en una base de datos almacenado en una


tabla,
una gran cantidad de texto, el contenido de cada registro de la tabla es


un
parrafo de un libro.

Lo que necesito, es que dado un parrafo escrito por el usuario, buscar en


la
base de datos los parrafos parecidos a este (Pueden varias por letras,
faltar alguna palabra, tener algunas palabras de mas, modificar el orden


en
algunas palabras)

Tienen idea de que herramienta o algun algortimo que me permita hacer


esto.




JOSE DAVID GALVIZ MUÑOZ
MCAD - DCE 5 Estrella



Respuesta Responder a este mensaje
#15 Víctor Rafael Bocanegra Arias
14/06/2005 - 00:14 | Informe spam
José podrias comentarme que algoritmo utilizas para la determinar la
diferencia entre parrafos o textos. Yo tambien estoy en la busqueda de hacer
algo similiar en MSSQL.

Salu2

Victor Rafael Bocanegra Arias
Lima Peru




"JOSE DAVID GALVIZ M" escribió en el mensaje
news:u$
Bueno Ricardo, esta podria ser una de las soluciones, que se asemeja a lo
que enuncia Kraver, ya tengo un algoritmo que me proporciona las
diferencias
entre los dos parrafos y eso me proporciona un porcentaje de modificacion.

El problema ahora radica en que debo hacer aproximadamente un millón de
comparaciones y esto tarda demasiado tiempo.

Para solventar esto, estoy a la busqueda de algún algoritmo, que en algo
se
parezca a la generación de hash o crc32, pero que no sea tan disperso en
sus
resultados, es decir, que si los textos son similares, el resultado del
algoritmo sea cercano, preferiblemente que sea un numero, así al final
solo
deberia filtrar en mi base por este valor, para obtener los parrafos
similares, si alguien sabe de algo así, le agradezco.




JOSE DAVID GALVIZ MUÑOZ
MCAD - DCE 5 Estrella


"Ricardo Passians" escribió en el mensaje
news:
No te serviría contar todas las palabras (o las raíces) coincidentes ?
Eliminando los artículos, claro.


"JOSE DAVID GALVIZ M" wrote in message
news:u8Ey$
Amigos, antes que nada perdón por el off topic.

La idea es la siguiente, tengo en una base de datos almacenado en una


tabla,
una gran cantidad de texto, el contenido de cada registro de la tabla es


un
parrafo de un libro.

Lo que necesito, es que dado un parrafo escrito por el usuario, buscar en


la
base de datos los parrafos parecidos a este (Pueden varias por letras,
faltar alguna palabra, tener algunas palabras de mas, modificar el orden


en
algunas palabras)

Tienen idea de que herramienta o algun algortimo que me permita hacer


esto.




JOSE DAVID GALVIZ MUÑOZ
MCAD - DCE 5 Estrella








Respuesta Responder a este mensaje
Ads by Google
Help Hacer una preguntaSiguiente AnteriorRespuesta Tengo una respuesta
Search Busqueda sugerida