martes, 31 de mayo de 2011

Busqueda de informacion

Búsqueda de Información
Internet no es sólo una red, sino una red de redes que engloba bajo su extenso manto una inmensa cantidad de información referente a cualquier tema que podamos imaginarnos. Para buscar en esta inmensidad no existen archivos ni servidores centrales, sino que la información esta dispersa en el ciberespacio infinito. Por este motivo, la búsqueda de información puede
resultar una tarea ardua y frustrante. Para paliar dicho problema se presentan a continuación las herramientas y servicios que facilitan la tarea de búsquedas en Internet.
                                                                                                            1. Herramientas de búsqueda
                                                                                                        Entre las herramientas de búsqueda se encuentran: Gopher, Archie, Verónica, WAIS y sobre todo WWW que esta anulando las anteriores y acaparando todas las funciones de búsqueda. Ninguna de ellas se puede decir que haya solucionado completamente el problema, pero si que han mejorado mucho las posibilidades de localizar información hasta límites que eran impensables hace algunos años. Antes de que los navegadores de Internet aparecieran, era muy difícil buscar contenidos. Por esa razón se desarrollo una herramienta muy simple, a base de menús a la que se denominó Gopher. Fue creada en 1991 en la Universidad de Minnesota como Campus Wide Information System (CWIS).
A pesar de ser una herramienta relativamente joven, Gopher ya no es adecuado para usuarios con un buen equipamiento y una conexión a Internet rápida. Aunque en su momento fue una herramienta muy útil, ya ha sido superada por el sistema de hipertexto WWW que no sólo se limita al trabajo con textos y es mucho más eficiente y fácil de usar. El WWW resulta especialmente valioso en la era multimedia actual. Casi todos los servidores Gopher ya han sido convertidos o reemplazados por un servidor WWW. Así pues, la realidad es ésta: Gopher está prácticamente extinguido. Cada vez es más difícil encontrar informaciones interesantes en el mismo. Cuando se selecciona un servidor Gopher, no es raro recibir una respuesta de recurso no disponible ya que estos servidores están desapareciendo rápidamente.
Al sistema de información Gopher puede accederse desde diferentes entornos. Puede utilizarse desde un entorno de texto, también, y de forma más cómoda, desde Windows o Xwindows, ya bien mediante un programa cliente de Gopher (El más conocido es el WSGopher) o con un navegador (Netscape, Explorer o cualquier otro). Para acceder a una dirección Gopher, tendremos que teclear su URL, es decir, por ejemplo: gopher://gopher.upv.es (Universidad Politécnica de Valencia). Una vez conectado con el servidor, podemos observar el menú y de un sólo vistazo ver los recursos que tiene disponibles. Podemos desplazarnos por él, página tras página, ahondando cada vez más en sus submenús, para explorar opciones más específicas. Luego podemos dirigirnos directamente a



Esos recursos mientras nos encontramos todavía en el sistema Gopher. Catálogos de bibliotecas, boletines de noticias, bases de datos sobre diferentes temas, listas de Gopher de todo el mundo, etc.; sólo tenemos que elegirlas y acceder a ellas mediante Gopher. Este realiza toda la operación de forma transparente. En el caso de las conexiones con Telnet, Gopher establece la conexión por nosotros, proporcionando la información de acceso que éste
necesite.

Buscadores Web.
Un Motor de búsqueda, o popularmente un Buscador, es una página Web que permite buscar otras páginas de acuerdo a una condición de búsqueda que define el usuario. Por ejemplo, con la ayuda de un buscador podemos localizar las páginas que hablan de una determinada persona o empresa, las referencias existentes a un libro o un disco, o todas las páginas que hablan sobre un acontecimiento concreto. El usuario debe introducir los términos de búsqueda y realizar la consulta. El buscador devuelve las direcciones web que estén relacionados con dichos términos. Para ello examinan la URL’s de las paginas, su título o su contenido. El resultado se muestra en una página que
contiene el titulo y una breve descripción de las paginas encontradas. Algunos buscadores incluyen además servicios de cartografía, mapas de ciudades, guías de turismo, etc.. Según la arquitectura de los buscadores se pueden distinguir varios tipos de herramientas de
búsqueda en Internet: 
                                                                                                           
 Indices
                                                                                                Buscadores que recorren la red e indexan lo que encuentran y lo almacenan en una base de datos. Como resultado, estos buscadores tienen grandes bases de datos que relacionan páginas web con claves. Buscar supone consultar la base de datos usando sus palabras clave como índices.
Son los buscadores que mantienen una organización de las páginas incluidas en su base de datos por categorías, es decir, tienen un directorio navegable de temas. Dentro de cada directorio podemos encontrar páginas relacionadas con ese tema. Para mantener esta organización, los buscadores tienen unos administradores humanos que se encargan de visitar las páginas y vigilan que todas se encuentren clasificadas en su lugar correcto. Índices típicos
son Yahoo o Excite. Para que una página quede registrada en un índice debemos mandarles la dirección a los administradores humanos de ese índice, generalmente acompañada de una serie de datos que les ayuden a clasificar la página de una forma correcta, como la descripción, temática, titulo,
lenguaje, etc. Además, si queremos que varias páginas de nuestro sitio web estén en el buscador, deberemos registrarlas todas ellas una a una.                                                                                                                   Motores de búsqueda
                                                                                                         Son buscadores que basan su recolección de páginas en un robot, denominado araña, que recorre constantemente Internet en busca de páginas nuevas que va introduciendo en su base de datos automáticamente. Los motores de búsqueda, no tienen porque tener un índice, aunque cada vez es más habitual que dispongan de uno. Motores de búsqueda típicos son Google o Altavista.
Los motores de búsqueda no necesitan que les mandemos la dirección de nuestra página para tenerla en su base de datos, puesto que el robot puede haberla encontrado previamente. De todos modos, nosotros podemos mandarles la dirección si no deseamos esperar a que el robot nos encuentre, práctica muy habitual. Para clasificar una página, los motores de búsqueda son capaces de leer el contenido de esta y encontrar aquellos datos que permitan su catalogación. Por eso, cuando registramos una página en un motor de búsqueda generalmente no nos piden información adicional, como
ocurría con los índices. Cuando un robot recorre nuestra página guarda sus datos, y luego se dirige a las distintas páginas que están enlazadas a esta. De este modo, solo hace falta registrar la página inicial de un sitio web, pues el motor de búsqueda se encargará de recorrer todo el sitio de manera
automática. Adicionalmente, estos motores o arañas, volverán a recorrer las páginas de su base de datos en busca de cambios que se hayan producido en estas, con objetivo de mantener su información lo más actualizada posible.                                      
                                                                                                 Multibuscadores
Estos últimos no tienen una base de datos propia, lo que hacen es buscar la página en varios buscadores simultáneamente y combinar los resultados de la búsqueda. Como ejemplo de multibuscador podemos citar MetaCrawler http://www.metacrawler.com/index.html   
                                                                                                                                                 Otras clasificaciones
Aparte de la clasificación anterior de los buscadores, también se pueden distinguir de otras formas. Existen múltiples métodos de búsqueda que corresponden a diferentes clasificaciones de la información por temas o categorías, a sistemas automáticos, a sistemas gráficos y a búsquedas por tipo de recurso. Según las búsquedas que permiten, hay tres tipos de buscadores:
• Buscadores automáticos: requieren los términos de búsqueda en lenguaje natural o en alguna notación determinada y a partir de dichos términos encuentra los documentos web que contengan los términos o palabras clave introducidos. De este tipo son Google, Noxtrum, Altavista, Lycos o Infoseek.
• Buscadores temáticos: tienen la base de datos de búsqueda clasificada por temas o categorías y permiten realizar búsquedas por distintos índices, yendo desde temas más generales a temas más específicos. Ejemplos de este tipo son Yahoo y Excite.
• Buscadores especializados: la búsqueda abarca un área de conocimiento específico. Estos buscadores suelen proporcionar información más detallada. Ejemplos de este tipo son Mappy.com , Infobel.com, Four11.com, Whowhere.com, etc.
• De ámbito geográfico: los hay internacionales, nacionales, incluso de regiones más pequeñas, como provincias o ciudades. Ej: VilaWeb, Cercat o AfricaOnLine. 
                                                                                                           
                                                                                                   Buscadores populares.
Actualmente, casi todos los buscadores son mixtos, incluyendo varios niveles de directorios y búsqueda general indexada. Según la búsqueda a realizar utilizaremos un tipo u otro.
de operadores:
• Operadores lógicos: AND, NOT y OR
• Operadores de proximidad: NEAR y ADJ
• Operadores de existencia: + y –
• Operadores de exactitud: * y .La sintaxis de los operadores no es única y depende del
buscador.
Yahho España yahoo.es 2 M 1.200 M/mes
Lycos lycos.es 120 M 100 M/mes
Excite excite.es 330 M 146 M/día
Altavista altavista.es 550 M 50 M/día
Google google.com 1.600 M 100 M/día
Algunos de los buscadores más importantes  
Técnicas de búsqueda
Cuando se realizan búsquedas pueden presentarse algunos problemas como:
• El buscador devuelve muchos resultados
• El buscador no devuelve ningún resultado o devuelve muy pocos.
• El buscador tarda mucho en resolver la consulta.
Para resolverlos algunos consejos útiles son:
• Utilizar un numero adecuado de palabras clave
• Utilizar la búsqueda de frases utilizando “ “
• Utilizar operadores lógicos
• Excluir palabras similares
• Utilizar los distintos campos que ofrece el buscador y las búsquedas avanzadas
Uso de operadores:
• Operadores lógicos: AND, NOT y OR
• Operadores de proximidad: NEAR y ADJ
• Operadores de existencia: + y –
• Operadores de exactitud: * y .La sintaxis de los operadores no es única y depende del
buscador.

No hay comentarios:

Publicar un comentario