Buscadores o motores de búsqueda:
Utilizan tipos de software especiales que localizan e indexan, en forma automática, las páginas Web y además todos los documentos referenciados en ellas.
Está compuesto por cuatro componentes básicos
- un robot,
- un motor de indexación,
- los índices
- un motor de búsqueda.
El robot, también llamado spider, es un programa que se encarga de recorrer la Web obteniendo información relevante, de cada una de las páginas que visita.
Una vez obtenida la información de la página, debe ser analizada y condensada, para su organización y su posterior presentación a los usuarios. Esta tarea la realiza el denominado motor de indexación.
La indexación puede efectuarse por palabras claves, que es la forma más común, o por conceptos. En el caso de hacerlo por palabras claves, algunos buscadores indexan todo el texto del documento, a excepción de los artículos, preposiciones y otros términos denominados “palabras vacías”.
Otros motores de búsqueda se limitan a incluir en la indexación a las palabras que más se repiten, o priorizan los términos que se encuentran en el título, la URL, las cabeceras, los enlaces, los primeros párrafos y además, las palabras claves incluidas en las etiquetas o tags.
Para facilitar la búsqueda, en la información recolectada, se utilizan estructuras de datos denominadas "índices o ficheros inversos", mediante los cuales se asocia una palabra a una lista de documentos relacionados con ella.
El motor de búsqueda es el encargado de procesar las consultas recibidas por los usuarios, recorre los índices inversos buscando los términos relacionados con la consulta y obteniendo los identificadores de los documentos. Finalmente los ordena jerárquicamente y presenta al usuario los resultados obtenidos.
Este tipo de herramienta, realiza sus búsquedas en sus propios índices, no lo hace directamente sobre la Web. Esto implica, que los buscadores, solo pueden recuperar una muy pequeña parte de todo lo que realmente hay en Internet.
Es importante señalar que los motores de búsqueda se diferencian entre sí por diferentes características como: el volumen y la frecuencia de indexación y el ordenamiento que hacen de la información encontrada para su presentación.
Metabuscadores:
Son “buscadores en buscadores”, es decir, son servidores web que realizan búsquedas en los índices de un gran número de buscadores y/o directorios, eliminan las duplicaciones y nos presentan un resumen de los resultados obtenidos, ordenados por relevancia y, en algunos casos, nos indican cuál ha sido el buscador de origen de dicha información. Cada uno de los motores de búsqueda de los metabuscadores funciona de una manera distinta, aunque existe un proceso interno común a todos ellos.
Los pasos en el funcionamiento de un metabuscador son los siguientes:
- El usuario realiza su petición al metabuscador.
- El metabuscador da formato a dicha petición de acuerdo a la interfaz de cada uno de los buscadores y les pasa la solicitud.
- Los buscadores realizan la búsqueda utilizando sus medios habituales a partir de los sitios web en Internet.
- Éstos devuelven la información obtenida al metabuscador, el cual analiza los datos.
- El metabuscador organiza la información de acuerdo a los criterios del mismo y se la muestra al usuario.
- Podría decirse entonces que el metabuscador aporta resultados seleccionados y ordenados mediante puntos de vista distintos y su ventaja principal es que amplía el ámbito de las búsquedas que realizamos.
- Tengamos en cuenta que cada buscador utiliza su propia estrategia a la hora de recoger la información y ordenar los resultados de las búsquedas, por lo que las páginas de mayor relevancia en un buscador no tienen por qué coincidir con las del resto.
Directorios:
También denominados buscadores temáticos, organizan la información por medio de categorías y sub-categorías que registran las direcciones (URL) y una pequeña descripción de los diferentes sitios que han sido indexados.
Son organizados en forma manual a partir del registro de sitios por parte de sus autores, y de un proceso posterior de selección y categorización jerarquizada por parte de los editores.
Guías Temáticas:
Están conformadas por páginas de recursos web organizadas por áreas del dominio de diversos especialistas y entidades académicas que asumen la tarea de elaborarlas. Por lo general incluyen algún mecanismo de búsqueda en sus páginas o en el sitio en general. Estos directorios anotados suelen ser de gran calidad ya que la selección de recursos, es muy cuidadosa y su actualización, frecuente. Software especializado: Estos agentes auxiliares se instalan en nuestra PC y operan junto a los navegadores añadiéndoles ciertas funcionalidades, como el manejo de conceptos para la recuperación de la información. Un agente de búsqueda es un programa que, imitando el comportamiento de una persona y actuando de forma autónoma, recorre automáticamente internet aprovechando la estructura de enlaces de la web. Un agente de búsqueda puede recuperar un documento en particular, o utilizar algún algoritmo de búsqueda que permita recuperar distintos documentos de la web a los que se hace referencia en un documento fuente u origen, o conforme a unos criterios predefinidos anteriormente por sus usuarios.