Buscan determinar temáticas más vigentes en la web en tiempo real

La web mundial se duplica en contenidos cada seis u ocho meses, con una vertiginosa dinámica de enlaces a páginas y datos. A través del proyecto “Observatorios escalables de la Web en tiempo real”, el Dr. Mauricio Marín pretende proporcionar herramientas de software que faciliten la búsqueda de información en el ciberspacio.

 

Identificar las temáticas que se abordan en la red y las comunidades que emergen en torno a determinados tópicos, en tiempo real, es un tema que podría resolverse a través de la implementación de herramientas de software que monitoreen esta dinámica en la web. En esto trabaja actualmente el Dr. Mauricio Marín, quien encabeza el proyecto Fondef “Observatorios escalables de la web en tiempo-real”.

El director del Doctorado en Ciencias de la Ingeniería, mención Informática, de la Universidad, explica que esta investigación propone utilizar técnicas de bases de datos espacio-temporales, para mantener registro de la evolución de la web chilena a lo largo del tiempo, es decir, construir herramientas de software que permitan escalar millones de usuarios y grandes volúmenes de información que detecten tópicos con uno o dos segundos de retraso, como máximo.

Una aplicación práctica de este proyecto, según comenta el investigador, es -por ejemplo- seguir el valor de ciertos indicadores de la economía. El Observatorio podría seguir el precio del dólar y hacer correlaciones de tendencias en la última semana con respecto al año pasado en Chile o en algún otro país.  

"La web se caracteriza por ser un sistema muy dinámico que cambia minuto a minuto y, además, es masivo e inmenso, por lo que para los humanos es difícil seguir la pista a todos los asuntos. Entonces, a través de una herramienta de software, se podría seguir y detectar casos raros en series de tiempo, tales como precios”, plantea el Dr. Marín. 

Este estudio tendrá una metodología bastante experimental. “Las técnicas o los algoritmos que uno desarrolla, se basan en el empleo de datos y para eso las empresas son muy importantes, pues ellas nos pueden proporcionar datos de usuarios reales, obviamente anónimos, es decir, no se sabe la identidad de quienes produjeron esos antecedentes en particular”, comenta Marín. 

Sobre la base del comportamiento de los usuarios, se establecen los algoritmos, secuencia finita de instrucciones que describen de forma precisa las operaciones que un ordenador debe realizar para llevar a cabo una tarea en un tiempo más finito, y se hacen las optimizaciones. La idea es probar los algoritmos hechos sobre los datos que proporcionan las empresas participantes. 

El director del proyecto espera obtener como resultado un conjunto de herramientas de software útiles para las empresas, para que éstas lo puedan poner en sus sistemas y les permitan ofrecer mejores servicios a sus usuarios. La idea es que sea “un sistema basado en la web, un observatorio que esté disponible para todas las personas que quieran seguir alguna entidad o algún tópico”, remarca.

En este proyecto, que se extenderá por tres años, además participan los académicos Andrea Rodríguez de la Universidad de Concepción; Benjamín Bustos de la Universidad de Chile; Edmundo Leiva de la Universidad de Santiago, Bárbara Poblete y Marcelo Mendoza de la Fundación para la Transferencia Tecnológica de la Universidad de Chile (Untec); y Yahoo! Research Latin America, institución asociada. También forman parte del equipo de trabajo Carolina Bonacic y Alejandro Figueroa postdoctorandos, estudiantes de pregrado y postgrado, de la Usach y de las otras universidades participantes. También se suman las empresas Business News Americas, Newtenberg,  Bligoo y Modyo.