jueves, 24 de abril de 2014

Caso 5

En la entrada anterior nos centramos en un aspecto eje de la asignatura que además coincide con el nombre de la misma: la búsqueda de la información. Comenté que en una red mundial como es Internet en continuo crecimiento y sin estructura es necesario servirnos de unas herramientas como son los buscadores con el fin de realizar con éxito y/o facilitar en gran medida nuestras búsquedas, satisfaciendo así las necesidades puntuales del usuario en todo momento. Basta con introducir el/los término(s) que guarden una relación directa con nuestra búsqueda, presionar la tecla "intro" (o "enter" en inglés) y en cuestión de segundos o unidades más pequeñas de segundo obtenemos un resultado de esa búsqueda en forma de conjunto de páginas web, documentos en distintos formatos (.doc, .docx, .pdf...), capítulos de libros,... basados en un sistema de ordenación (variable en algunos casos de un buscador a otro, como es el caso de Google) en el que, en la parte superior, aparecían aquellas páginas "más (posiblemente) útiles" para el usuario y conforme vamos descendiendo nos vamos encontrando aquellas que van guardando menos relación o que son "poco (probablemente) útiles". En cambio en este complejo proceso nos surge una pregunta ¿qué sucede exactamente en ese breve periodo de tiempo situado entre la introducción de la(s) palabra(s) y su posterior pulsación de la tecla "enter" y el momento en el que se nos presenta el resultado de nuestra búsqueda?. En esta entrada trataré de dar respuesta a esa cuestión, explicando con la mayor precisión posible y valiéndome del uso de un lenguaje no técnico lo que ocurre. Dicho de forma breve, nos centraremos en el otro aspecto importante en el proceso: la recuperación de la información.

La recuperación de la información se trata de un área de la ciencia y la tecnología encargada fundamentalmente de adquirir, representar, almacenar, organizar y acceder a la información que demanda un usuario en un momento concreto con la mayor rapidez y eficacia posible. Dicho de otro modo y enfocado a la práctica sería el conjunto de actividades que se llevan a cabo y que estarían orientadas a la localización de determinados datos (a partir de los que se extrae la información) y las distintas interrelaciones que éstos tienen a su vez con otros datos similares con el fin de satisfacer la necesidad de información del usuario. Este proceso, simplificado, se lleva a cabo de la siguiente manera:

  1. Ingresamos nuestra búsqueda en la barra del buscador, bien sea uno o varios términos, una frase o fragmento de texto entre comillas, título de un libro...y presionamos la tecla "intro".
  2. Esta consulta se remite al servidor web, que es un "almacén" de información, fundamentalmente en forma de documentos "escritos" en lenguaje HTML (lenguaje en el que están escritos las páginas web) además de imágenes, vídeos, audio, presentaciones, texto...que además se encarga de enviarnos a nosotros, los usuarios que ingresamos la búsqueda, estas informaciones. En pocas palabras, sería algo así como "la casa" de la información que contiene la red.
  3. Este servidor web deriva la información a una aplicación que se encarga de recibir nuestra consulta, acceder a las distintas bases de datos (recordamos que este término hace alusión a "un conjunto estructurado de datos coherentes") analizar los datos y extraer únicamente aquellos que cumplen en mayor o menor medida (pero siempre relacionados) con la demanda llevada a cabo por el usuario.
  4. La aplicación devuelve nuevamente estos resultados al servidor web que es el encargado de interpretarlos y expresarlos a través de documentos, páginas web... y por último el buscador es el encargado de organizarlos y presentárselos en forma de listado en función del grado de relevancia y/o repetición en función de la búsqueda.

Desde el punto de vista del usuario (no necesariamente avanzado) es imprescindible que tengamos en cuenta un aspecto importante una vez finaliza todo este conjunto de acciones que he expuesto con anterioridad: la evaluación de los resultados. Para ello decidimos si el proceso de búsqueda y recuperación de la información llevado a cabo es de calidad o no en base a los siguientes criterios:

  • Consistencia en la búsqueda, habiendo coordinado correctamente el sistema de clasificación de la información con el lenguaje de búsqueda.
  • Exhaustividad para recuperar los documentos que son relevantes conforme a los requerimientos establecidos por el usuario en la estrategia de búsqueda.
  • Relevancia de los documentos recuperados acorde con las necesidades de información del propio usuario.
  • Pertinencia de los documentos recuperados para adaptarse a las demandas de información realizadas por el usuario.
  • Precisión con respecto a la selección del conjunto de documentos relevantes recuperados.

En esta entrada he podido darme cuenta de la simplicidad y a la vez complejidad de un proceso que se lleva a cabo cada vez que alguno de nosotros realiza una búsqueda. Soy perfectamente consciente de que dicho proceso tiene infinidad de elementos intermedios en el que no hemos profundizado como por ejemplo el lenguaje utilizado por los ordenadores a la hora de realizar una búsqueda y su posterior recuperación (complejas ecuaciones matemáticas y algoritmos que surgen como resultado de la traducción de nuestro lenguaje al matemático), modelos de recuperación seguidos (Boleano, que mide la correspondencia entre el conjunto de elementos de la consulta con los documentos; el Vectorial, que mide el grado de divergencia vectorial que representan los elementos de la búsqueda y los documentos; el Probabilístico, que se sirve de la probabilidad para medir en qué grado el documento responde a la consulta...) el cálculo de una serie de coeficientes como la tasa de acierto, de relevancia, de pertinencia y de precisión...todo ello en cuestión de segundos o unidades más pequeñas al segundo. También me gustaría destacar la importancia de los aspectos que he puesto en última instancia ya que, normalmente, de manera inconsciente, los empleamos a la hora de evaluar dicho proceso con el fin de dictaminar si es de calidad o no lo es sin ni siquiera darnos cuenta. En definitiva y de forma conceptual me ha hecho comprender qué es todo aquello que ocurre en ese breve periodo de tiempo, la cantidad de elementos que intervienen así como la eficacia que normalmente suelen tener a la hora de responder con resultados, proporcionando al ser humano "la llave" de la puerta que esconde todo un mundo de información al alcance de todos. 


domingo, 6 de abril de 2014

Caso 4

En tan solo unos pocos años Internet, aquella red mundial de la que todos nos servimos para atender a nuestro ámbito personal, laboral, estudiantil, cotidiano...., pasó de estar "reservado para unos pocos privilegiados" a "tener acceso cualquier persona, en cualquier momento concreto". Lo que para muchos era una novedad antes de que su uso se masificara, ahora resulta algo tan común como levantarse todos los días para ir al trabajo o estudiar. En pocas palabras, ha pasado a formar parte de nuestras vidas, desarrollando en nosotros un tipo de dependencia tan grande que, cualquiera, probablemente, sufriría con la ausencia o desaparición de la misma. No obstante, muchos de nosotros nos hemos acostumbrado a utilizarla sin preguntarnos el porqué de su éxito en tan poco tiempo: la cantidad de información disponible que nos puede aportar. Como cualquier otra fuente de información posee una inmensidad de datos pero, al contrario de lo que podemos pensar, la naturaleza con la que Internet fue concebida es la de una red gigantesca desestructurada, pues es bien sabido que cualquier persona puede aportar "algo" y aumentar su contenido en cualquier momento (no deja de crecer ni por un instante). No obstante lo anterior, que puede parecer a priori una ventaja, se convierte en una dificultad al mismo tiempo para nosotros, más concretamente afectando a uno de los usos fundamentales que le damos, las búsquedas, razón por la que se crearon los buscadores.

Los buscadores o motores de búsqueda son aquellas herramientas que nos facilitan la obtención de la información dentro de la red, independientemente del tipo que sea, en base a las palabras o términos clave que introducimos en los mismos. Cuanto más concretos seamos en este aspecto, mejor será el trabajo realizado por el buscador, ya que nos dará resultados más precisos o en su defecto más útiles para lo que estamos buscando. El funcionamiento de estos es tan "simple" como que al introducir las palabras o términos de los que deseamos realizar la búsqueda, analiza todas las páginas web "leyendo" su contenido con el objetivo de crear un "índice" facilitando así su posterior localización y, finalmente, dando resultados de una forma rápida y relevante (en el mundo informático este proceso se conoce como "indexación", también es propio de las bases de datos y se realiza gracias a unos programas informáticos que incorporan los buscadores llamados "spider"). Así el buscador nos proporciona, en los primeros lugares de la búsqueda, aquellas páginas que mayor número de veces se repita(n) la(s) palabra(s) que hemos introducido, seguida de otra cuyo número de repiticiones sea inferior a la primera y así con el resto, sucesivamente.

Existen un gran número de buscadores pero en mi búsqueda he decidido comentar por encima los cinco más conocidos y más eficientes de Internet. Son:
  • Google: se trata del mejor buscador web por excelencia además del más conocido con un gran número de usuarios en la red (más del 70 %). Fue creado en 1997 y no sólo se trata de un buscador, sino que con el tiempo ha ido ampliando sus servicios.
  • Yahoo!: el principal competidor de Google. Por un tiempo fue líder en búsquedas, aunque finalmente se hizo conocido por su portal que ofrecía múltiples servicios (además del de búsqueda) como puede ser el correo, noticias, directorios... . Fue creado en 1994 y se caracteriza por dar los resultados más ajustados a tus preferencias.
  • Bing: el padre de este buscador es Microsoft y antes era conocido con el nombre de "Live Search". Aparte de la búsqueda tradicional, también permite realizar una lista de búsquedas relacionadas y personalizadas en función de tus intereses personales. 
  • Ask: orientado a la respuesta de preguntas sencillas en función a las palabras que introduces por lo que no se trata de un buscador cualquiera. También es conocido con el nombre de "Ask Jeeves".
  • AOL: depende de Google para su sistema de búsqueda y clasificación y posee una interfaz que permite realizar búsquedas con fotografías, vídeos y sonidos en tiempo real. Destaca principalmente por la búsqueda de noticias.
Llegados a este punto me pregunto lo siguiente: ¿qué distingue a Google del resto en cuanto a popularidad y eficacia?. Todo radica en el funcionamiento de Google con respecto al resto de buscadores. Uno de los fundadores de Google, Larry Page, pensó que colocando un gran número de veces una palabra o término en una web, teniendo en cuenta que aparecen por orden de repetición de los mimos, se podía llegar a "engañar" a los buscadores, de manera que creó un sistema que tiene en cuenta el vínculo entre páginas para establecer su puntuación, llamada "Page Rank" que consiste en el número de veces que hace referencia una web a otra. Dependiendo de la cantidad de referencias que se haga y de qué página web las haga (si esa web es más importante o no) esas referencias contarán más o menos (para que nos entendamos, funciona como un sistema de "votos" en el que una web recibe un voto por cada referencia que le haga otra y estos "votos" valen más si la web que hace referencia es importante). Este otro sistema, mucho más complejo de engañar pues tendrías que crear varias web que hiciesen referencia a la misma página para que su "Page Rank" fuese elevado y apareciese en los primeros resultados, resulta más eficaz a la vez para el sistema de búsqueda que, al tener en cuenta las veces que se referencia una web y la página(s) que la(s) referencia(n) la información es mucho más fiable que en cualquier otro buscador. Resumiendo, desde mi punto de vista, la principal diferencia que encontramos en Google es que, a diferencia del resto de buscadores, no sólo se centra en la cantidad (de veces que se repite la palabra e incluso información) sino que también en la calidad de la misma (número de referencias de otras web, importancia de la web que hace la referencia...) todo ello gracias al Page Rank.

También me gustaría añadir la existencia de algunos de los "trucos" existentes (al menos los más conocidos y utilizados por todos) para que las búsquedas web sean más eficientes, como por ejemplo, introducir un mayor número de términos con el fin de especificar, un fragmento o frase concreta que queramos que aparezca en la búsqueda entre comillas, utilizar la búsqueda avanzada con el fin de refinar nuestras búsqueda, poner términos clave al lado del término del que queremos encontrar información (por ejemplo: Internet definición), consultar la propuesta de páginas similares e incluso lanzar una pregunta directa cada vez que queremos averiguar algo concreto.

En relación al caso de esta semana me gustaría decir que he averiguado por qué Google es un buscador pionero y la diferencia entre buscadores genéricos como el propio Google o Yahoo! y específicos, en el caso de estos últimos como Ask, para hacer preguntas y AOL para la búsqueda de noticias. Además quiero resaltar la importancia que desempeñan estos motores de búsqueda dentro de la red y el papel que desempeñan con respecto a la accesibilidad de la información de cara al usuario en su día a día, destacando que sin la existencia de los buscadores por más información que tuviese la red nos resultaría muy costoso (por no decir imposible) encontrar la que se ajustase a nuestras búsquedas y de hacerlo la cantidad de información de la que pudiésemos disponer estaría muy limitada (no contaríamos con la posibilidad de acceder a más de una web ya que no seríamos capaz de tener una visión global de la cantidad de información existente con respecto a nuestra búsqueda). Como usuario diario de las nuevas tecnologías también me gustaría añadir que en base a mi experiencia con otros buscadores en comparación a Google, siempre he obtenido resultados bastante más ajustados a mis necesidades y por tanto mi experiencia ha resultado más satisfactoria, motivo por el cual me sirvo del mismo para cualquier búsqueda que realice, independientemente del tipo que sea, además del los distintos filtros que ofrece y que favorecen estas búsquedas, no estando todos disponibles en cualquier buscador.