El lado oculto de la ciencia de datos

Se deben entender los beneficios de los proyectos de análisis basados en matemática, estadística y herramientas tecnológicas

Este artículo es exclusivo para suscriptores (3)

Suscríbase para disfrutar de forma ilimitada de contenido exclusivo y confiable.


Ingrese a su cuenta para continuar disfrutando de nuestro contenido


Este artículo es exclusivo para suscriptores (2)

Suscríbase para disfrutar de forma ilimitada de contenido exclusivo y confiable.


Este artículo es exclusivo para suscriptores (1)

Suscríbase para disfrutar de forma ilimitada de contenido exclusivo y confiable.

El análisis de datos se implanta en las empresas, las cuales empiezan a usar diferentes tecnologías y recursos para sacarle provecho tanto a la información de los clientes como de la misma operación para innovar con productos, servicios y procesos.

Obtener buenos resultados en ese esfuerzo no es tan fácil. Los frutos pueden terminar siendo obvios, poco confiables o que aporten pocos insumos para proyectar el futuro.

Existen varias dificultades en el proceso y tienen que ver con la calidad (información desordenada, inconsistente y con archivos dañados) o disponibilidad de los datos.

Una dificultad cada vez mayor es que no se tenga el recurso humano especializado para salvar los obstáculos, incluyendo identificar los sesgos ocultos en el análisis.

La solución es más que tecnológica, pues se centra especialmente en el desarrollo de la cultura de datos y en la preparación del talento especializado en datos dentro de la empresa.

“El inconveniente más grande para las empresas al implementar proyectos de ciencia de datos se presenta por una falla en entender los beneficios tangibles de proyectos”, advirtió Ludvick Ibañez, gerente de desarrollo de negocio de Cisco Systems.

Los problemas en el uso de los datos no debe ser una excusa para evitarlos.

“Las empresas que realmente se fundamentan en ciencia de datos son las más ricas del mundo: Google, Amazon, Facebook, etc.”, recordó Oldemar Rodríguez, CEO del Programa Iberoamericano de Minería de Datos (Promidat).

Explorar datos

La ciencia de datos es una disciplina que combina la computación, la matemática y el conocimiento de los negocios.

Abarca un amplio conjunto de herramientas y capacidades, para generar valor a través de la información a disposición.

Se nutre, al tiempo que complementa, lo que ya hacen los sistemas de inteligencia de negocios, big data, analítica, estadística, minería de datos, modelado predictivo, aprendizaje de máquina y redes neuronales (aprendizaje donde se replica al cerebro humano).

Su objetivo es explotar los datos provenientes de distintas fuentes internas y externas para transformarlos en función de descubrir patrones y tendencias, lo que podría ser de provecho para las diferentes unidades o áreas de una empresa.

Eso sí, requiere hacer las preguntas pertinentes y definir los postulados de análisis para descubrir la información que no es evidente en los datos, advirtió Paul Solano, CEO de Smart Now Technologies.

La ciencia de datos se utiliza para identificar comportamientos de los clientes, automatizar actividades analíticas (segmentación, optimización y creación de modelos predictivos), generar recomendaciones de consumo e implementar medidas de seguridad.

Otras aplicaciones posibles abarcan el análisis de escenarios, identificar productos o servicios nuevos con más probabilidad de éxito, descubrir fraudes y visualizar oportunidades de negocio antes que los competidores.

“Puede ser utilizada para efectos de investigación y desarrollo, donde es necesario procesar diferentes fuentes y tipos de datos”, dijo José Mayorga, gerente regional de analítica de EY.

En la sombra

El alcance que se pueda obtener, sin embargo, depende de la materia prima, los datos, principalmente.

La información proviene de gran cantidad de fuentes (redes sociales, blogs, comentarios, sensores, registros contables) en volúmenes y calidad heterogénea. Puede estar repetida o ser extremadamente compleja.

Los procesos de ciencias de datos ocupan entre 60% y 80% de su esfuerzo en preparar la información.

El otro problema se deriva de la disponibilidad de método para ejecutar los procesos, de recursos tecnológicos, como las herramientas de modelación, y de capacidad de almacenamiento de datos.

“Muchas organizaciones cometen el error de hacer grandes inversiones iniciales para empujar a la utilización de la ciencia de datos. Esto generalmente es poco efectivo y no genera los resultados esperados”, dijo Solano, de Smart Now Technologies.

El primero se resolvería estructurando un proceso de gestión de la información, con reglas de negocio, que garantice su calidad, unificación, integración, seguridad y privacidad.

El segundo requiere que el científico de datos disponga de las competencias, metodologías y las herramientas adecuadas para identificar la solución tecnológica más adecuada a cada situación.

“Las herramientas son más fáciles de usar y permiten un mayor nivel de automatización y control en cada una de las etapas del desarrollo de modelos y su puesta en producción”, dijo Luis Vettorazzi, consultor de soluciones de negocios de software para GBM.

Vettorazzi indicó que, al usarse componentes que están en la Nube, se puede asignar capacidades y funcionalidades bajo demanda, según se requiera.

Lo que se necesita, además, es una adecuada administración de datos, una cultura interna orientada al análisis, un plan que operativice una estrategia de uso de datos para la toma de decisiones, equipo multidisciplinario apoyado por expertos, una metodología de implementación y métricas de seguimiento.

“Entre otras alternativas: ir trasladando las labores netamente operativas a herramientas más automatizadas, aprovechando soluciones en la nube o tecnologías como las bases de datos autónomas”, sugirió Cristian Sánchez, director regional de ventas de Oracle.

El peligro es exagerar el potencial y los costos de implementación de los proyectos de datos, por lo que se debe considerar dónde se ubicarán los datos, la infraestructura de almacenamiento a utilizar, la seguridad y los servicios profesionales, entre otros.

Ibañez, de Cisco, recomendó identificar uno o dos casos de uso, involucrando al personal de tecnología de información de la empresa y a los gerentes de las áreas, así como a proveedores con soluciones que complementen las capacidades de la empresa.