Herramientas de búsqueda francisco javier cervigon ruckauer

Page 1

Las mejores herramientas

E

xisten diferentes tipos de herramientas de búsqueda de información en Internet. Cada una de ellas funciona de una manera diferente y tiene su propio propósito y su alcance. Aquí nos referiremos a: buscadores, metabuscadores, directorios, guías y software especializado.

 Buscadores: Los buscadores o motores de búsqueda utilizan tipos de software especiales que localizan e indexan, en forma automática, las páginas Web y además todos los documentos referenciados en ellas. Un buscador está compuesto por cuatro componentes básicos:    

un robot, un motor de indexación, los índices un motor de búsqueda.

El robot, también llamado spider, es un programa que se encarga de recorrer la Web obteniendo información relevante, de cada una de las páginas que visita. Una vez obtenida la información de la página, debe ser analizada y condensada, para su organización y su posterior presentación a los usuarios. Esta tarea la realiza el denominado motor de indexación. La indexación puede efectuarse por palabras claves, que es la forma más común, o por conceptos. En el caso de hacerlo por palabras claves, algunos buscadores indexan todo el texto del documento, a excepción de los artículos, preposiciones y otros términos denominados “palabras vacías”. Otros motores de búsqueda se limitan a incluir en la indexación a las palabras que más se repiten, o priorizan los términos que se encuentran en el título, la URL, las cabeceras, los enlaces, los primeros párrafos y además, las palabras claves incluidas en las etiquetas o tags. Para facilitar la búsqueda, en la información recolectada, se utilizan estructuras de datos denominadas "índices o ficheros inversos", mediante los cuales se asocia una palabra a una lista de documentos relacionados con ella. El motor de búsqueda es el encargado de procesar las consultas recibidas por los usuarios, para lo cual recorre los índices inversos buscando los términos relacionados con la consulta y obteniendo


los identificadores de los documentos. Finalmente los ordena jerárquicamente y presenta al usuario los resultados obtenidos. Este tipo de herramienta, realiza sus búsquedas en sus propios índices, no lo hace directamente sobre la Web. Esto implica, que los buscadores, solo pueden recuperar una muy pequeña parte de todo lo que realmente hay en Internet. Es importante señalar que los motores de búsqueda se diferencian entre sí por diferentes características como: el volumen y la frecuencia de indexación y el ordenamiento que hacen de la información encontrada para su presentación. Entre los buscadores más importantes se encuentran:  Google (http://www.google.com.ar): el más utilizado.  Lycos (http://www.lycos.com/): un portal web que incluye un buscador que surgió como un proyecto de desarrollo de un motor de búsqueda.  Bing (http://www.bing.com/): anteriormente Live Search, Windows Live Search y MSN Search, es un buscador Web de Microsoft. Otros buscadores:  DuckduckGo (https://duckduckgo.com/): un motor de búsqueda establecido en Valley Forge, Pensilvania, USA, que utiliza la información de sitios de origen público con el objetivo de aumentar los resultados tradicionales y mejorar la relevancia. Se promociona como un motor de búsqueda con mucha privacidad (no almacena nuestros datos de registro) y que nos muestra los mejores resultados descartando todo el spam y el ruido informativo.  Yahoo buscador (https://es.search.yahoo.com/) Actividad sugerida: Realiza la misma búsqueda en los distintos buscadores sugeridos y compara los resultados obtenidos.

Metabuscadores Los metabuscadores son “buscadores en buscadores”, es decir, son servidores web que realizan búsquedas en los índices de un gran número de buscadores y/o directorios, eliminan las duplicaciones y nos presentan un resumen de los resultados obtenidos, ordenados por relevancia y, en algunos casos, nos indican cuál ha sido el buscador de origen de dicha información. Cada uno de los motores de búsqueda de los metabuscadores funciona de una manera distinta, aunque existe un proceso interno común a todos ellos.


Los pasos en el funcionamiento de un metabuscador son los siguientes:  El usuario realiza su petición al metabuscador.  El metabuscador da formato a dicha petición de acuerdo a la interfaz de cada uno de los buscadores y les pasa la solicitud.  Los buscadores realizan la búsqueda utilizando sus medios habituales a partir de los sitios web en Internet.  Éstos devuelven la información obtenida al metabuscador, el cual analiza los datos.  El metabuscador organiza la información de acuerdo a los criterios del mismo y se la muestra al usuario.

Podría decirse entonces que el metabuscador aporta resultados seleccionados y ordenados mediante puntos de vista distintos y su ventaja principal es que amplía el ámbito de las búsquedas que realizamos. Tengamos en cuenta que cada buscador utiliza su propia estrategia a la hora de recoger la información y ordenar los resultados de las búsquedas, por lo que las páginas de mayor relevancia en un buscador no tienen por qué coincidir con las del resto. Entre los metabuscadores más importantes se encuentran:  Metacrawler (http://www.metacrawler.com/) / Zoo (http://www.zoo.com/) Metacrawler fue uno de los primeros metabuscadores disponibles para los usuarios. La empresa denominada Go2Net dueña de su franquicia fue comprada por InfoSpace o Blucora y desde marzo redirecciona a http://www.zoo.com/(nuevo nombre e imagen del metabuscador). Pero si se siente nostalgia todavía es posible acceder al original en el Reino Unido: http://www.metacrawler.co.uk/  iBoogie (http://www.iboogie.com/) Realiza búsquedas organizadas en “cluster” (conjuntos o conglomerados de ordenadores unidos entre sí normalmente por una red de alta velocidad y que se comportan como si fuesen una única computadora) y tiene un motor muy potente. Además, permite añadir pestañas solicitando buscar en bases de datos concretas que tienen a disposición del usuario y posee una búsqueda avanzada (http://iboogie.com/advanced_web.asp)  Ixquick (http://www.ixquick.com/esp/) El primer metabuscador que se ocupó de proteger la privacidad de los usuarios sin


registrar su proceso de búsqueda y su dirección de IP.  Dogpile (http://www.dogpile.com/) Es un metabuscador que retorna las búsquedas desde los motores About, Ask.com, FinWhat, Google, LookSmart, MSN Search, Teoma, Yahoo!, Bing y otros buscadores populares, incluyendo de audio y video.

Actividad sugerida: Realiza la misma búsqueda en los distintos metabuscadores sugeridos y compara los resultados obtenidos.

 Directorios Los directorios, también denominados buscadores temáticos, organizan la información por medio de categorías y sub-categorías que registran las direcciones (URL) y una pequeña descripción de los diferentes sitios que han sido indexados. Son organizados en forma manual a partir del registro de sitios por parte de sus autores, y de un proceso posterior de selección y categorización jerarquizada por parte de los editores. Entre los directorios más importantes se encuentran:

 Yahoo (http://ar.search.yahoo.com/) El equipo de Yahoo! se encargan de visitar, analizar y evaluar los sitios web y organizarlos según su contenido en categorías y/o subcategorías, como por ejemplo Educación y Formación, Salud, Gastronomía, Viajes, etc... como si de una gran biblioteca virtual se tratase. Las categorías del Directorio van de lo general a lo más específico.

 DMOZ (http://www.dmoz.org/World/Español/) El Open Directory Project (ODP), también conocido como DMoz (por directory.mozilla.org su nombre de dominio original) es un proyecto colaborativo multilingüe, en el que editores voluntarios listan y categorizan enlaces a páginas web. Cualquier persona puede sugerir un enlace en una categoría determinada, que luego ha de ser aprobada por un editor El proyecto está dividido en varias ramas según el idioma, y las categorías de páginas se organizan jerárquicamente dentro de cada una de las ramas.  Portal SEO (http://www.portal-seo.com/directorio- web.php) Dedicado al SEO (Search Engine Optimization) es decir al posicionamiento en buscadores u

optimización en motores de búsqueda, un proceso que busca mejorar la visibilidad de un sitio web en los resultados orgánicos de los diferentes buscadores.


 Excite (http://www.excite.com/) Es una colección de sitios y servicios web, lanzado en diciembre de 1995. Ofrece una gran variedad de contenido, incluyendo un portal de Internet que muestra noticias y el tiempo, etc., incluye además un motor de búsqueda, un servicio de correo electrónico basado en la web, mensajería instantánea, cotizaciones de bolsa, y una página de inicio personalizable por el usuario.

Muchos buscadores incluyen además un sistema de navegación en forma de directorio y por otra parte, algunos directorios complementan sus resultados con los de una búsqueda en un buscador. Pero es importante realizar una distinción entre estos dos tipos de herramientas de búsqueda de información, ya que, se organizan y funcionan de diferente manera. Actividad sugerida: Realiza búsquedas temáticas empleando diferentes directorios.

 Guías Las guías temáticas están conformadas por páginas de recursos web organizadas por áreas del dominio de diversos especialistas y entidades académicas que asumen la tarea de elaborarlas. Por lo general incluyen algún mecanismo de búsqueda en sus páginas o en el sitio en general. Estos directorios anotados suelen ser de gran calidad ya que la selección de recursos, es muy cuidadosa y su actualización, frecuente. Visualiza la siguiente presentación para ampliar la información: Guías temáticas http://goo.gl/8tDn1i

Algunas guías son desarrolladas por Universidades y Bibliotecas, como por ejemplo:  Universidad de Almería. Biblioteca Nicolás Salmerón: Guías Temáticas http://goo.gl/F4AlNa "Las guías temáticas recogen los recursos de información disponibles en la Biblioteca agrupados en diferentes categorías: bases de datos, revistas electrónicas, revistas en papel, libros impresos, e-books, tesis y proyectos."  Universidad Carlos III de Madrid. Biblioteca: Guías de recursos http://goo.gl/vht1rP "En estas guías encontrarás fuentes y recursos de información, tanto de la Biblioteca como una selección de recursos externos de interés."


 Universidad de Sevilla. Biblioteca. Guías: Herramientas y guías para encontrar y gestionar la información: Guías de la BUS http://goo.gl/nSt3JJ "...podrás encontrar consejos para elaborar trabajos académicos, estrategias y formas de localizar libros, patentes, películas..., recursos de información clasificados por temas, instrucciones para el manejo de gestores bibliográficos, y mucho más."  Universidad de Alicante. Biblioteca: Guías temáticas http://goo.gl/OyScXJ  En ciertas ocasiones, varias instituciones se asocian para la elaboración cooperativa de estas guías. Un ejemplo es la “Biblioteca Virtual WWW” (The WWW Virtual Library) http://vlib.org/ Actividad sugerida: Realiza búsquedas en algunas de las guías sugeridas.  Software especializado Para mejorar las búsquedas en la Web puede utilizarse software especializado. Estos agentes auxiliares se instalan en nuestra PC y operan junto a los navegadores añadiéndoles ciertas funcionalidades, como el manejo de conceptos para la recuperación de la información. Un agente de búsqueda es un programa que, imitando el comportamiento de una persona y actuando de forma autónoma, recorre automáticamente internet aprovechando la estructura de enlaces de la web. Un agente de búsqueda puede recuperar un documento en particular, o utilizar algún algoritmo de búsqueda que permita recuperar distintos documentos de la web a los que se hace referencia en un documento fuente u origen, o conforme a unos criterios predefinidos anteriormente por sus usuarios. Un agente de búsqueda puede realizar diversas funciones como: -

Realizar consultas con una velocidad y en un conjunto de fuentes mucho mayor que el posible para un usuario humano. Informar de las actualizaciones que se producen en los sitios web que son de interés. Agilizar las descargas que se realizan de internet. Eliminación de correo basura o spam Búsqueda de noticias conforme a las preferencias.

Un ejemplo es “Copernic Agent”, una herramienta realmente útil que permite la búsqueda selectiva en múltiples fuentes y la clasificación mediante potentes herramientas de análisis. Que si bien aún está disponible para su descarga, ya no brinda soporte a los usuarios desde su sitio.


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.