COMPUTACIÓN E INFORMÁTICA APLICADA

Procesadores de Texto | Planilla de Cálculo | Programas de Presentación
Internet | Buscadores | Evaluación de Resultados| Intranet
subglobal3 link | subglobal3 link | subglobal3 link | subglobal3 link | subglobal3 link | subglobal3 link | subglobal3 link
subglobal4 link | subglobal4 link | subglobal4 link | subglobal4 link | subglobal4 link | subglobal4 link | subglobal4 link
subglobal5 link | subglobal5 link | subglobal5 link | subglobal5 link | subglobal5 link | subglobal5 link | subglobal5 link
subglobal6 link | subglobal6 link | subglobal6 link | subglobal6 link | subglobal6 link | subglobal6 link | subglobal6 link
subglobal7 link | subglobal7 link | subglobal7 link | subglobal7 link | subglobal7 link | subglobal7 link | subglobal7 link
subglobal8 link | subglobal8 link | subglobal8 link | subglobal8 link | subglobal8 link | subglobal8 link | subglobal8 link

Internet

 

Buscadores:

Hasta ahora, los buscadores de Internet se han dividido en dos grandes grupos. De una parte los robots de búsqueda que, como Altavista, rastrean automáticamente la Red y generan bases de datos enormes pero, como contrapartida, obligan al usuario a dominar opciones avanzadas de búsqueda si no desea encontrarse con listados de 50.000 páginas plagadas, además, de información-basura y desfasada. En el polo opuesto se encuentran los directorios como Yahoo!, cuyas páginas están clasificadas por personas, lo que garantiza información de calidad pero, por desgracia, limitada en cantidad y, cada vez más, servida en función de criterios comerciales: hay empresas que pagan por aparecer las primeras de la lista en los portales.

Google! es el primer buscador que se sitúa en medio de estos dos extremos. Mantiene todas las ventajas de un robot de búsqueda automática, pues consigue rastreos muy amplios, pero elimina el problema de la información de baja calidad y atrasada. Este avance lo logra gracias a que Google! aplica como criterio principal para ordenar los resultados el número deenlaces que se dirigen desde los millones de páginas rastreadas haciaotras webs y no, como el resto de los buscadores automáticos, el número de veces que una palabra clave se repite en una página. Esto, en definitiva, consigue que sean los propios usuarios de Internet, mediante sus particulares selecciones de páginas favoritas en cada momento, quienes determinen el orden en el que aparecerán los resultados al realizar una búsqueda en Google! En teoría, los resultados de este buscador son siempre de calidad y actuales.

Para ordenar documentos (decidir su importancia respecto de una consulta) Google utiliza un algoritmo propio denominado PageRank. El algoritmo de PageRank está basado en el grafo de enlaces de la web que como tal es un recurso sumamente importante y largamente ignorado en la mayoría de los buscadores. Google dispone de tablas con miles de millones de enlaces de la forma (docID desde-docID hasta), lo cual constituye una buena representación de la web como un grafo de enlaces.

El concepto básico del algoritmo PageRank es que una página es más importante en la medida en que mas páginas apuntan hacia ella. El algoritmo de PageRank extiende este concepto computando no solamente la cantidad de enlaces, sino también normalizando de acuerdo a la cantidad de enlaces en una página, y propagando infinitamente de forma tal que la importancia de una página depende de: (1) cuantas páginas apuntan a ella, (2) la cantidad de enlaces en estas páginas, y (3) cuantas y cuan importantes son las páginas que apuntan a las que apuntan a la página.

Google esta diseñado para ser una herramienta de búsqueda escalable eficiente y con un sistema altamente avanzado de ranking de páginas. El uso del algoritmo de PageRank le da una gran calidad a los resultados de búsquedas “comunes”, la enorme cantidad de datos, de lejos la colección mas grande de páginas web del mundo, le permiten resolver eficazmente búsquedas “difíciles” mientras que el repositorio de páginas asegura que los resultados devueltos pueden ser accedidos y consultados por el usuario siendo a su vez de enorme valor como una colección histórica de los documentos en la web.


About Us | Site Map | Privacy Policy | Contact Us | ©2004 Hermann E. Rathkamp S.