Algoritmo big data

Page 1

EL MUNDO NÚMERO 215 / MARTES 10 DE SEPTIEMBRE DE 2013

www.elmundo.es/baleares

B@LEÓPOLIS EL SUPLEMENTO DE LA INNOVACIÓN EN LAS ISLAS >Emprendedores/ TIC

El ‘TripAdvisor’ de los animales de compañía PÁGINA 3

El ‘oráculo’ de los bytes > Redes / La Universidad de Waterloo (Canada) premia un trabajo en el que participa el IFISC (CSIC-UIB) y que desarrolla una herramienta para procesar y visualizar gráficamente grandes bases de datos. Elena Soto Diariamente se publican unos 350 millones de tuits, a la hora una gran empresa puede procesar alrededor de un millón de transacciones comerciales, de forma continuada los sensores conectados en red capturan y almacenan cantidades ingentes de datos; esta avalancha constante y masiva de bytes (Big Data) es la materia prima de la nueva revolución que se avecina y que, según apuntan los expertos, transformará radicalmente nuestra manera de ver el mundo, permitiendo, entre otras cosas, tomar decisiones efectivas y rápidas casi en tiempo real. Pero ¿cómo desenterrar ese ‘tesoro’ oculto?

Disponer de una masa de información desordenada no tiene demasiado valor si no se es capaz de extraer lo más relevante, aquello que explique de alguna manera el qué y el porqué de las cosas. El ‘tesoro’, en este caso, se esconde en las constantes que se repiten, en los patrones que ni siquiera se habían sospechado o en las correlaciones que no son evidentes y que permitirían predecir y dar un sentido más completo al mundo que nos rodea. Las bases de datos contienen la información, pero pueden ser muy confusas y no aportar muchas pistas ¿Cómo interpretar correctamente este oráculo de bytes

y que sus respuestas expliquen de forma meridianamente clara el comportamiento de los datos en un determinado contexto? La irrupción del Big Data está permitiendo avances en áreas de lo más heterogéneas que van desde el marketing, a la investigación pasando por la política o el deporte y su análisis, gestión y visualización es uno de los grandes desafíos a los que se enfrenta tanto la ciencia y las empresas como el conjunto de la sociedad. El trabajo Fast visualisation of relevant portions of large dynamic Networks (Visualización rápida de las partes relevantes de las grandes redes dinámicas), desarrollado

por Przemyslaw A. Grabowicz, investigador del IFISC (CSIC-UIB), contribuye de forma notable a la exploración y visualización de redes dinámicas. Esta investigación acaba de ser galardonada con el premio CAD WICI Data Challenge, dotado con 10.000 dólares, que otorga el Instituto Waterloo para la Complejidad y la Innovación de la Universidad de Waterloo (Ontario, Canadá), que destaca su novedad y utilidad especialmente para la futura labor de la comunidad científica en la red. El estudio propone un algoritmo rápido que toma datos de una red dinámica grandísima (de millones de nodos) extrae y enlaza

los más relevantes y los guarda en un fichero que, posteriormente puede visualizarse con diferentes herramientas, permitiendo la creación de una película o su reproducción en tiempo real, permitiendo ver la relación entre datos y su evolución, agrupando conjuntos o definiendo jerarquías. Una de las aportaciones más novedosas de este método es que es flexible y versátil, por lo que es fácil de usar en numerosos contextos, pudiéndose aplicar a diferentes tipos de redes dinámicas que van desde las sociales a las biológicas pasando por las de transportes o las económicas. SIGUE EN PÁGINA 2


2 B@LEÓPOLIS

VIENE DE PORTADA «Esta estructurado en dos partes», explica Grabowicz, «la primera es el algoritmo y la segunda la visualización que el usuario puede personalizar con sus propias herramientas o con las que considere más atractivas». Para ilustrar sus posibilidades en este trabajo aparecen cuatro casos de estudio; los dos primeros están relacionados con la red social Twitter y realizan el seguimiento de los hashtag (etiquetas) publicados durante la Super Bowl y la muerte de Bin Laden; los dos últimos toman las palabras clave de las bases de datos IMDb (las siglas en inglés de base de datos de películas en Internet) y US Patentes. En el primer caso se representa la actividad en Twitter durante la Super Bowl de 2013. El al-

Permite visualizar los nodos más relevantes de la red y las conexiones entre ellos goritmo crea automáticamente un gráfico que permite visualizar en un videoclip como se desarrolla el evento en la red en un período de tiempo concreto, mostrando los momentos de mayor concentración de etiquetas, cómo evolucionan y se relacionan y a través de qué usuarios se propaga más la información. En el caso de Bin Laden se muestra el estallido inicial que se produjo en la red cuando Keith Urbahn –jefe de personal del exsecretario de Defensa Rumsfeld– publicó que «una fuente fiable le había confirmado su muerte». En este caso concreto, la animación revela como este usuario @ keithurbahn se convirtió en uno de los nodos más relevantes a la hora de expandirse la noticia. En el gráfico generado por el algorit-

EL MUNDO / AÑO XXII / MARTES 10 DE SEPTIEMBRE DE 2013

REDES DE BASES DE DATOS EN UN VIDEOCLIP

Przemyslaw A. Grabowicz, investigador del IFISC (CSIC-UIB), autor del estudio. / ELENA SOTO

Casos de estudio.

Capturas de pantalla de las animaciones generadas por las bases de datos: (A) Super Bowl 2013 en Twitter. (B) La muerte de

Bin Laden. (C) Las palabras claves usadas para describir las películas en Internet Movie Database (D) Los títulos de las patentes de US Patentes.

mo pueden visualizarse los momentos de mayor tráfico, la evolución de la noticia y cómo comenzaron a relacionarse las diferentes etiquetas tras el anuncio oficial. En los dos últimos ejemplos las redes están formadas por las palabras claves empleadas para describir las películas y las que aparecen en los títulos de las patentes registradas en Estados Unidos. En ambos casos el videoclip muestra la evolución de un siglo de la historia del cine y de 35 años de invenciones respectivamente, pudiendo verse como cambian las tendencias cinematográficas a lo largo de las décadas o hacia dónde se dirige la ciencia y la tecnología. Hashtags, etiquetas o palabras clave, este método permite crear una red actualizada de datos relacionados seleccionando dinámicamente para la visualización los nodos más relevantes de la misma y

La secuencia cronológica del vídeo puede ser de tres minutos o de cien años. las conexiones entre ellos, además de diferenciar entre los más antiguos y los de reciente actividad; La secuencia cronológica puede ser de tres minutos o de cien años. Si el archivo generado se conecta a una interfaz gráfica como Gephi puede visualizarse en vivo el gráfico en evolución, y puede ser aplicado a grandes flujos de datos en línea y visualizar su representación en forma de red. En un mundo que no cesa de generar datos de forma masiva la capacidad para interpretarlos y plasmarlos en una interfaz interactiva y en tiempo real podría ser una valiosa herramienta para mejorar el rendimiento o los procesos de innovación y de toma de decisiones. La minería de datos no ha hecho más que empezar.

>PROYECTOS CON FUTURO

Tecnorrevolución, las tecnologías que están cambiando el mundo Por E. S. Robots que imitan comportamientos animales, un simulador de realidad a escala nanométrica, una máquina que detecta el estado de relajación del cerebro, ojos robóticos que siguen a las personas o predecir mediante un ordenador cómo se propaga un virus y se produce una pandemia, son algunos de los módulos interactivos que encontrarán los visitantes en ExpoCaixa Tecnorrevolución, una muestra interactiva que quiere dar a conocer tecnologías convergentes, como la nanotecnología,

la biotecnología, las tecnologías de la información y de las comunicaciones (TIC) y las ciencias cognitivas (NBIC). Las tecnologías convergentes se han hecho famosas por ser fuente de inspiración de numerosas películas, como el Viaje fantástico o Cariño, he encogido a los niños, pero lo más importante es que su aplicación ha transformado radicalmente todos los campos. A través de seis módulos interactivos los visitantes pueden co-

ExpoCaixa Tecnorrevolución, exposición interactiva en Manacor.

nocer las numerosas posibilidades que presentan las aplicaciones de las tecnologías convergentes en la vida cotidiana en áreas tan diversas como la construcción, el transporte, la agricultura, la medicina, la educación o el arte. En el apartado de nanotecnología, por ejemplo, una pantalla multitáctil permite al visitante experimentar como trabaja está tecnología, escogiendo un tratamiento contra el cáncer y arrastrándolo hasta el tumor para observar qué pasa. La exposición organizada por la Obra Social La Caixa se podrá visitar hasta el 29 de setiembre de 2013 en ExpoCaixa, ubicada en la Plaza de Ramon Llull s/n de Manacor.


Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.