Home
Temas
Preguntas
Webs Amigas

Tecnología y Cultura
Sexo y Religión


Derechos Animales
Fotos Naturaleza
Ecología y Filosofía

Copyleft
Licencia de Creative Commons
Preguntas
¿Qué es un Spider o Crawler?

(Recuperación de Información) Estoy haciendo una traducción sobre optimización de máquinas de búsqueda y quiero saber qué es lo que hace un spider.

Alojamiento Web

Respuesta

Encontraste a la persona adecuada :-) Hice mi Tesis de doctorado en Web Crawling.

Un Web Crawler (también llamado Web Spider) es un programa diseñado para explorar páginas Web en forma automática. La operación normal es que se le da al programa un grupo de direcciones iniciales, el crawler descarga estas direcciones, analiza las páginas y busca enlaces a páginas nuevas. Luego descarga estas páginas nuevas, analiza sus enlaces, y así sucesivamente ad nauseam.

Los crawlers se pueden usar para varias cosas, lo más común es que se usen para:

  • Crear el índice de una máquina de búsqueda.
  • Analizar los enlaces de un sitio para buscar links rotos.
  • Recolectar información de un cierto tipo, como precios de productos para armar un catálogo.
  • etc.

Un resumen sobre el tema está en la página de la Wikipedia sobre Web Crawling, que es un extracto de mi tesis.

La traducción al castellano que yo uso más corrientemente es "recolector de páginas web" o simplemente "recolector".

Buscar

Ej.: "publicar internet", "hojas estilo", "php", "flash", "parser xml", etc.
ChaTo = Carlos Castillo, Ph.D.  :::  Acerca de este Sitio ChaTo = Carlos Castillo, Ph.D. ::: Acerca de este Sitio