En la entrada anterior nos centramos en un aspecto eje de la asignatura que además coincide con el nombre de la misma: la búsqueda de la información. Comenté que en una red mundial como es Internet en continuo crecimiento y sin estructura es necesario servirnos de unas herramientas como son los buscadores con el fin de realizar con éxito y/o facilitar en gran medida nuestras búsquedas, satisfaciendo así las necesidades puntuales del usuario en todo momento. Basta con introducir el/los término(s) que guarden una relación directa con nuestra búsqueda, presionar la tecla "intro" (o "enter" en inglés) y en cuestión de segundos o unidades más pequeñas de segundo obtenemos un resultado de esa búsqueda en forma de conjunto de páginas web, documentos en distintos formatos (.doc, .docx, .pdf...), capítulos de libros,... basados en un sistema de ordenación (variable en algunos casos de un buscador a otro, como es el caso de Google) en el que, en la parte superior, aparecían aquellas páginas "más (posiblemente) útiles" para el usuario y conforme vamos descendiendo nos vamos encontrando aquellas que van guardando menos relación o que son "poco (probablemente) útiles". En cambio en este complejo proceso nos surge una pregunta ¿qué sucede exactamente en ese breve periodo de tiempo situado entre la introducción de la(s) palabra(s) y su posterior pulsación de la tecla "enter" y el momento en el que se nos presenta el resultado de nuestra búsqueda?. En esta entrada trataré de dar respuesta a esa cuestión, explicando con la mayor precisión posible y valiéndome del uso de un lenguaje no técnico lo que ocurre. Dicho de forma breve, nos centraremos en el otro aspecto importante en el proceso: la recuperación de la información.
La recuperación de la información se trata de un área de la ciencia y la tecnología encargada fundamentalmente de adquirir, representar, almacenar, organizar y acceder a la información que demanda un usuario en un momento concreto con la mayor rapidez y eficacia posible. Dicho de otro modo y enfocado a la práctica sería el conjunto de actividades que se llevan a cabo y que estarían orientadas a la localización de determinados datos (a partir de los que se extrae la información) y las distintas interrelaciones que éstos tienen a su vez con otros datos similares con el fin de satisfacer la necesidad de información del usuario. Este proceso, simplificado, se lleva a cabo de la siguiente manera:
- Ingresamos nuestra búsqueda en la barra del buscador, bien sea uno o varios términos, una frase o fragmento de texto entre comillas, título de un libro...y presionamos la tecla "intro".
- Esta consulta se remite al servidor web, que es un "almacén" de información, fundamentalmente en forma de documentos "escritos" en lenguaje HTML (lenguaje en el que están escritos las páginas web) además de imágenes, vídeos, audio, presentaciones, texto...que además se encarga de enviarnos a nosotros, los usuarios que ingresamos la búsqueda, estas informaciones. En pocas palabras, sería algo así como "la casa" de la información que contiene la red.
- Este servidor web deriva la información a una aplicación que se encarga de recibir nuestra consulta, acceder a las distintas bases de datos (recordamos que este término hace alusión a "un conjunto estructurado de datos coherentes") analizar los datos y extraer únicamente aquellos que cumplen en mayor o menor medida (pero siempre relacionados) con la demanda llevada a cabo por el usuario.
- La aplicación devuelve nuevamente estos resultados al servidor web que es el encargado de interpretarlos y expresarlos a través de documentos, páginas web... y por último el buscador es el encargado de organizarlos y presentárselos en forma de listado en función del grado de relevancia y/o repetición en función de la búsqueda.
Desde el punto de vista del usuario (no necesariamente avanzado) es imprescindible que tengamos en cuenta un aspecto importante una vez finaliza todo este conjunto de acciones que he expuesto con anterioridad: la evaluación de los resultados. Para ello decidimos si el proceso de búsqueda y recuperación de la información llevado a cabo es de calidad o no en base a los siguientes criterios:
- Consistencia en la búsqueda, habiendo coordinado correctamente el sistema de clasificación de la información con el lenguaje de búsqueda.
- Exhaustividad para recuperar los documentos que son relevantes conforme a los requerimientos establecidos por el usuario en la estrategia de búsqueda.
- Relevancia de los documentos recuperados acorde con las necesidades de información del propio usuario.
- Pertinencia de los documentos recuperados para adaptarse a las demandas de información realizadas por el usuario.
- Precisión con respecto a la selección del conjunto de documentos relevantes recuperados.
En esta entrada he podido darme cuenta de la simplicidad y a la vez complejidad de un proceso que se lleva a cabo cada vez que alguno de nosotros realiza una búsqueda. Soy perfectamente consciente de que dicho proceso tiene infinidad de elementos intermedios en el que no hemos profundizado como por ejemplo el lenguaje utilizado por los ordenadores a la hora de realizar una búsqueda y su posterior recuperación (complejas ecuaciones matemáticas y algoritmos que surgen como resultado de la traducción de nuestro lenguaje al matemático), modelos de recuperación seguidos (Boleano, que mide la correspondencia entre el conjunto de elementos de la consulta con los documentos; el Vectorial, que mide el grado de divergencia vectorial que representan los elementos de la búsqueda y los documentos; el Probabilístico, que se sirve de la probabilidad para medir en qué grado el documento responde a la consulta...) el cálculo de una serie de coeficientes como la tasa de acierto, de relevancia, de pertinencia y de precisión...todo ello en cuestión de segundos o unidades más pequeñas al segundo. También me gustaría destacar la importancia de los aspectos que he puesto en última instancia ya que, normalmente, de manera inconsciente, los empleamos a la hora de evaluar dicho proceso con el fin de dictaminar si es de calidad o no lo es sin ni siquiera darnos cuenta. En definitiva y de forma conceptual me ha hecho comprender qué es todo aquello que ocurre en ese breve periodo de tiempo, la cantidad de elementos que intervienen así como la eficacia que normalmente suelen tener a la hora de responder con resultados, proporcionando al ser humano "la llave" de la puerta que esconde todo un mundo de información al alcance de todos.