El poder del análisis en tiempo real

Corporaciones en el mundo predicen su futuro casi al mismo tiempo en que se van creando toneladas de información

  • Facebook (Compartir)
  • Tweetea!
  •  
  • Imágenes

El científico de datos Arnoldo Müller vive en el futuro.

Un algoritmo creado por él le permite encontrar similitudes entre millones de datos para predecir quién será el próximo presidente de Costa Rica o cuáles son las posibilidades de que un paciente reincida en un hospital de Estados Unidos.

Algunos de sus clientes manejan tal cantidad de información que guardarla sería imposible o innecesario. Es el momento en que la memoria RAM debe procesar el flujo en tiempo real.

Cuando la información fluye como una catarata, cae sobre el motor de similitudes creado por Müller y comienza a descubrir fenómenos en tiempo real.

Es lo que hace Facebook entre sus millones de usuarios: descubre similitudes, crea perfiles y, a partir de ellos, recomienda artículos o publicidad segundos después de que usted haya hecho clic sobre una historia.

Con el Internet de las cosas y de las personas –refrigeradoras que hablan y brazaletes que le miden la presión– el mundo de la data vive un momento crucial en el que la inmediatez reina.

“A como tengamos más dispositivos hablando unos con otros y hablando con nosotros mismos, vamos a necesitar más trabajo en streaming ”, predice Arnoldo Müller, fundador de la empresa SimMachines.

La estadística, la economía y la ciencia informática se unen desde hace años para crear sistemas de predicción y recomendación. La diferencia es que, con la gran cantidad de datos disponibles desde las más diversas fuentes, los resultados son mucho más precisos.

infografia

El futuro en un segundo

La inmediatez invade las tierras en las que reposaban toneladas de datos a la espera de análisis.

Aunque las grandes corporaciones apenas comienzan a despertar ante este fenómeno, las gigantes tecnológicas le apuestan agresivamente al cambio.

El martes 5 de mayo, la vicepresidenta del Centro de Datos de Intel, Diane Bryant, presentó una renovada familia de procesadores Xeon, que aumentó en un 70% su capacidad de emitir sesiones de análisis por hora para el soporte de decisiones empresariales.

“En la economía de los servicios digitales, el éxito o el fracaso pueden depender de cuán rápido responda el negocio ante los descubrimientos de grandes cantidades de datos”, dijo Bryant.

El procesador superó las expectativas de la industria tecnológica con sus 18 cores, un aumento del 20% en comparación con la familia anterior.

Los cores son una especie de minicerebros dentro del CPU. La innovación de Intel podría tener un fuerte impacto en la analítica en tiempo real, siempre que los analistas sepan programar el software de manera que logren aprovecharlo, han dicho los medios especializados.

Un gran avance en materia arquitectónica (¿cómo cabe tanta capacidad en un espacio tan pequeño?), pero que no está dirigido a usuarios comunes y corrientes.

Su precio, de todas formas, no lo permitiría, pues va desde los $1.224 hasta los $7.175.

Para demostrar su impacto en el mercado, Intel organizó una videoconferencia con expositores de dos marcas diametralmente opuestas: Nippon, la más grande firma de venta de pinturas en Asia, y Cloudera, desarrolladora de software de implementación alrededor de Hadoop (un software de código abierto que ayuda a ordenar millones de registros).

La firma de pinturas implementó hace un mes un sistema para entender lo que sus clientes quieren, según los registros que se crean a partir de una aplicación móviles, iColor, que les da consejos sobre diseño y color.

“Los datos que antes tardábamos días o semanas en analizar, ahora están disponibles casi en tiempo real”, contó Justin Chen, CIO de la empresa, una de las primeras en probar los nuevos procesadores de Intel.

Cloudera, por su parte, dijo que incrementó su cartera de clientes en un 85% desde que trabaja con este tipo de hardware .

Levantar el polvo

Un puñado de start-ups también levantan el polvo tras de sí al entrar al mercado de la analítica en tiempo real.

DataStreamX, de Singapur, recaudó una inversión de $370.000 en marzo. Su negocio: dedicarse a facilitar las transacciones entre corporaciones que quieren compartir sus grandes producciones de datos al tiempo en que se van creando. Ser un intermediario en ese proceso.

“Si estás creando un sistema de transporte, quieres saber, en tiempo real, cuáles son los precios del gas para poder ahorrar. Es entonces cuando los datos en tiempo real son útiles”, dijo Mike Davie, fundador de la iniciativa, al sitio especializado TechAsia.

Compradores y analistas de esa información, como DataSift, existen desde hace años.

DataSift, que empezó como una start-up europea en 2008, es ahora una de las más grandes firmas con permisos para recopilar datos de redes sociales y analizarlos para sus clientes.

Mientras Twitter canceló su contrato con la firma en abril, tras decidir que administrará por sí misma su data , Facebook anunció que irán un paso más allá en su relación.

La red social lanzó Topic Data (datos temáticos) en marzo, junto a la compañía de analítica.

La herramienta le muestra a los vendedores de cualquier producto qué están diciendo los usuarios de Facebook sobre temas relativos a su negocio.

“Un vendedor de secadoras de pelo puede ver demografías de la gente hablando sobre los efectos de la humedad en el cabello”, aseguró la red social.

¿Para qué sirve?

El análisis en tiempo real cumple con tres objetivos específicos, que son prácticamente su razón de ser:

Recomendar: Netflix lo hace todo el tiempo cuando le sugiere películas que usted no ha visto. No solo se basa en sus gustos, sino en los de gente que tiene un perfil semejante al suyo.

Descubrir: Los científicos de datos recopilan información sobre grupos de personas o de objetos y encuentran similitudes entre ellas que permiten desde evidenciar fenómenos sociales hasta encontrar fallas en un sistema.

Predecir: ¿Cuánto costará el dólar en cinco días? Aunque los modelos estadísticos siempre han permitido adelantar esta información, la analítica de grandes cantidades de datos es mucho más exacta.

Fuente Arnoldo Müller.

Sostenbilidad y financiamiento