Minería Web y Encontrabilidad

Minería Web y Encontrabilidad
 
-A +A

La Minería de la Web es una disciplina que permite generar información acerca del comportamiento de los usuarios en un Sitio Web, mediante el análisis de los datos que ellos mismos van dejando a medida que visitan los Sitios Web. Utilizando técnicas provenientes de las ciencias sociales, entre las que se cuenta la clasificación, asociación y agrupación mediante patrones, es posible caracterizar a los visitantes con el objetivo de ofrecerles productos o servicios que vayan de acuerdo a las necesidades que se asignen a los tipos de usuario que se hayan definido.

Para mejorar su efectividad, se define que la minería del web se puede hacer en tres áreas que se refieren al contenido del sitio y la estructura de navegación, más el comportamiento de los usuarios respecto de los dos primeros.

El objetivo de utilizarla en el contexto de esta Guía, es ofrecer una alternativa que permita la generación de mayor información acerca de las actividades que llevan a cabo los usuarios que visitan el Sitio Web.

Cabe señalar además que la minería web debe ir de la mano del monitoreo del Sitio Web que es apoyado desde el Decreto 100 de 2006 (en su articulo 6º), en que se plantea esta tarea como una de las prioritarias para que los administradores de los Sitios Web puedan conocer las necesidades de los usuarios y la forma en que están utilizando el Sitio Web.

Icono con el símbolo de información adicionallogs: son archivos de texto en los cuales se va registrando cada uno de los archivos que son mostrados por un servidor web, a raíz de las acciones que realiza un usuario que visita un Sitio Web mediante un browser. Su análisis permite entender lo más visitado, entre otros aspectos.

Respecto de esto es importante tener en cuenta que las acciones que realizan los usuarios son registradas anónimamente en archivos de texto también conocidos como logs (o bitácoras, en español), en los cuales se va registrando cada uno de los archivos que son mostrados por un servidor tras la petición de un cliente que visita un Sitio Web. Por lo mismo, cada visita genera decenas o centenares de líneas de información que al ser procesadas con software especializado de análisis, permiten tener información agregada acerca de visitas, zonas del sitio que son más visitadas y otros elementos básicos de información similares.

Asimismo es posible tener información acerca de las palabras ingresadas en los buscadores externos e internos del Sitio Web, lo que ayuda a entender cuáles son los términos más buscados y para los cuales el Sitio Web constituye una fuente de información.

En este sentido, la posibilidad de analizar por ejemplo, los logs de la navegación del Sitio Web o bien los logs de las palabras ingresadas en un buscador, permitirán al administrador del Sitio Web, tener información de primer orden para tomar decisiones acerca de contenidos, de la forma que tiene el Sitio Web e incluso, para tomar decisiones de reorganización de las secciones existentes en el mismo.

Quién busca y qué busca

Respecto de los usuarios del Sitio Web se debe intentar conseguir información acerca de qué están buscando en el Sitio Web y cuáles son los objetivos que persiguen al visitarlo.

Aunque la información que se obtiene mediante minería de web será anónima, ya que está basada en elementos de este tipo, será posible activar otros tipos de recursos para conocer al usuario y de esta manera saber más acerca de sus necesidades y las razones que lo llevan a visitar al Sitio Web.

Por lo mismo, se apoya como una buena práctica que el administrador del Sitio Web pueda dedicar algún tiempo de su jornada semanal a las siguientes actividades:

  • Responder correos electrónicos de los usuarios que tengan relación con la operación del Sitio Web, ya que en el intercambio con ellos será posible entender su percepción del Sitio Web y las necesidades de información que lo llevan a visitarlo. Desde allí, será más fácil conocer si hay satisfacción de las necesidades y qué pasos se deben dar para conseguirla.
  • Responder llamados telefónicos de usuarios que no consigan terminar sus operaciones y para quienes los sistemas de ayuda tradicionales ofrecidos por el servicio u organización dueña del Sitio Web tampoco aporten información adecuada. El contacto directo con los usuarios será una herramienta valiosa para perfeccionar los contenidos y funcionalidades del Sitio Web.
  • Desarrollar tests de usuario tendientes a entender de qué manera se relacionan los usuarios con los contenidos y a partir de esto, establecer las mejoras necesarias en los ámbitos que se requieran (este tema será tratado con más profundidad en la sección Usabilidad de esta Guía).

Los seis tipos de contenidos según R. Baeza

Cuando se esté trabajando con usuarios, será importante avanzar en el conocimiento de los seis tipos de contenidos que el usuario viene a buscar en el Sitio Web, los cuales quedan normalmente reflejados a través de las palabras que usa en el buscador interno del sitio para encontrar aquellos términos que el sistema de navegación no le puede aportar o no le muestra dónde pueden estar ubicado dentro de la organización actual de contenidos.

La imagen muestra el árbol de organización de contenidos donde aparecen los seis tipos definidos por el académico.

[D]Figura 3. - La imagen muestra el árbol de organización de contenidos donde aparecen los seis tipos definidos por el académico Ricardo Baeza-Yates.

Basado en un diagrama de árbol que se aprecia en la Figura 3, el académico Ricardo Baeza-Yates plantea que los seis tipos de contenidos que los usuarios buscan a través del buscador interno del sitio son:

  • A) Contenidos principales y que están en el Sitio Web, pero que no son destacados adecuadamente por el sistema de navegación o de contenidos.
  • B) Contenidos que constituyen un tema secundario del Sitio Web y que no son destacados como elemento de importancia.
  • C) Contenidos que no son destacados en el Sitio Web y que los usuarios asumen que son parte de los contenidos, por lo que los buscan en el Sitio Web.
  • D) Contenidos que existen en el Sitio Web pero que están registrados con otro nombre.
  • E) Contenidos que no existen en el Sitio Web pero que deberían estar, ya que forman parte de los contenidos que deberían utilizarse.
  • F) Contenidos que no existen en el Sitio Web y para cuya inexistencia se cuenta con definiciones editoriales o políticas de la organización o servicio.

El académico recalca que los últimos tres son muy importantes porque revelan que los usuarios pueden dar pistas de mucho interés para la creación de contenidos, para los cuales el Sitio Web es considerado una fuente principal o relevante.

Influencia de la Minería en los contenidos

Basado en la información anterior, es evidente que el desarrollo de una política de minería de web sobre los contenidos permite tener un aporte contundente para la generación de contenidos, ya que se trata de un mecanismo de feedback efectivo para entender las necesidades de información de los usuarios.

Por lo anterior, deberá constituir una buena práctica la revisión permanente de los informes de actividad del Sitio Web más la información que aporten los informes de minería web, ya que basados en ellos se podrán tomar decisiones editoriales que permitan responder a las necesidades que los usuarios manifiesten a través de su navegación por el Sitio Web.