Sobre la indexación en Sharepoint

20/12/2005 - 21:37 por lboleda | Informe spam
Hola a todos, llevo algún timepo desaparecido de Sharepoint, porque me
movieron de proyecto, pero ahora vuelvo a mis dolores de cabeza con él. El
asunto que me trae ahora es que necesito tener una idea de cómo funciona
la indexación en Sharepoint, si se indexan los documentos accediéndolos
por HTTP o directamente en la DB. Les explico mi situación: tengo unos
documentos almacenados en Sharepoint, pero quiero moverlos de ahí y dejar
solo una "huella" de que esos ficheros existen, es decir, imaginen un
documento de 150Mb en Sharepoint, yo quiero quitarlo de Sharepoint
(sacarlo de la DB) y ponerlo en otro lugar (un folder por ejemplo) y en la
DB sustituir el contenido de ese fichero por un fichero pequeño que
contenga sólo la información de cómo accesar el fichero real, pero
conservando el nombre y extensión del fichero original, de forma tal que
los usuarios vean toda la información del fichero original, pero no esté
el contenido en la DB (esto se logra muy fácil cambiando directamente la
DB)... y cuando algún usuario cliquee sobre el fichero para acceder a él,
a través de un filtro, yo intercepto la llamada y en vez de cargar el
fichero de la DB, busco el fichero original del lugar donde lo tengo
ubicado... esto también es muy fácil de implementar y ya lo tengo hecho
utilizando un Filtro. Pero el problema que tengo ahora es que el índice
(cuando vaya a indizar el contenido del Portal) no me va a encontrar el
fichero real, sino la "huella" que yo dejé en la DB, así que no va a poder
hacer una indexación correcta del fichero, por eso es que necesito
información de cómo trabaja la indexación en Sharepoint, si utiliza HTTP
para acceder a los ficheros (como cuando se hace click, y por lo tanto
puedo interceptar la orden de indexación y suministrar el fichero real
ante la request) o trabaja directamente sobre la DB y en ese caso, estoy
perdido porque no tengo idea de cómo interceptar esa llamada)

De mas está decir que agradezco enormemente, y de antemano, cualquier
ayuda que me puedan prestar, y el tiempo que le han dedicado a leer sobre
mi problemática.

Saludos a todos
Luis
 

Leer las respuestas

#1 Gustavo
21/12/2005 - 09:52 | Informe spam
Hola Luis,
Que pasa si solamente haces una indexacion incremental, de tal forma que el
gatherer "piense" que el documento no ha cambiado? Si funciona, primero
tienes que colocar el documento completo en el sistema, hacerlo indexar,
luego dejar tu "huella" y configurar la indexacion de forma incremental...

Es muy poca la informacion que existe sobre como funciona la maquina de
busqueda (e indexes) de Microsoft; esta informacion es en los tiempos
modernos crucial para una empresa como MS en su competencia con otros
sistemas de busqueda (Google, Yahoo). De hecho, la maquina de indexacion
tiene dos gatheres:

- uno para contenido externo (otros sitios, por ejemplo, fuera de
SharePoint) que es un crawler "normal" que va de sitio en sitio, haciendo
clicks en cada vinculo, y haciendo un index de todo lo que encuentra

- otro que funciona directamente dentro de la Base de Datos de SQL, utiliza
la funcionalidad de SQL de Full Text Index y IFilters para leer la
informacion y hacer los indexes (este es que estarias utilizando en tu caso).

Otra cosa es que recuerda que meterle la mano a la Base de Datos de SPS es
bien peligroso, y, si alguna vez necesitas soporte de Microsoft, te van a
pedir que devuelvas todos los cambios que has hecho a su estado original,
antes de que se tomen la molestia de ni siquiera contestar el telefono.
Suerte,
Gustavo
http://www.gavd.net/servers/default.aspx


"Luis Boleda" escribió:

Hola a todos, llevo algún timepo desaparecido de Sharepoint, porque me
movieron de proyecto, pero ahora vuelvo a mis dolores de cabeza con él. El
asunto que me trae ahora es que necesito tener una idea de cómo funciona
la indexación en Sharepoint, si se indexan los documentos accediéndolos
por HTTP o directamente en la DB. Les explico mi situación: tengo unos
documentos almacenados en Sharepoint, pero quiero moverlos de ahí y dejar
solo una "huella" de que esos ficheros existen, es decir, imaginen un
documento de 150Mb en Sharepoint, yo quiero quitarlo de Sharepoint
(sacarlo de la DB) y ponerlo en otro lugar (un folder por ejemplo) y en la
DB sustituir el contenido de ese fichero por un fichero pequeño que
contenga sólo la información de cómo accesar el fichero real, pero
conservando el nombre y extensión del fichero original, de forma tal que
los usuarios vean toda la información del fichero original, pero no esté
el contenido en la DB (esto se logra muy fácil cambiando directamente la
DB)... y cuando algún usuario cliquee sobre el fichero para acceder a él,
a través de un filtro, yo intercepto la llamada y en vez de cargar el
fichero de la DB, busco el fichero original del lugar donde lo tengo
ubicado... esto también es muy fácil de implementar y ya lo tengo hecho
utilizando un Filtro. Pero el problema que tengo ahora es que el índice
(cuando vaya a indizar el contenido del Portal) no me va a encontrar el
fichero real, sino la "huella" que yo dejé en la DB, así que no va a poder
hacer una indexación correcta del fichero, por eso es que necesito
información de cómo trabaja la indexación en Sharepoint, si utiliza HTTP
para acceder a los ficheros (como cuando se hace click, y por lo tanto
puedo interceptar la orden de indexación y suministrar el fichero real
ante la request) o trabaja directamente sobre la DB y en ese caso, estoy
perdido porque no tengo idea de cómo interceptar esa llamada)

De mas está decir que agradezco enormemente, y de antemano, cualquier
ayuda que me puedan prestar, y el tiempo que le han dedicado a leer sobre
mi problemática.

Saludos a todos
Luis


Preguntas similares