Tecnología

Guía para innovar en las empresas con minería, big data y ciencia de datos

Las empresas pueden encontrar mercados, generar recomendaciones de compra, atender consultas, brindar acceso a servicios y lanzar publicidad personalizada; las aplicaciones son múltiples, tanto como datos disponibles

La innovación en los negocios depende del acceso y entendimiento de los datos sobre la operación, los clientes y el mercado.

Información es lo que menos falta, pues la hay disponible en cada una de las áreas de la empresa: operativa, financiera, de producción, en los canales físicos, en recursos humanos, en logística, en finanzas y contabilidad, en redes sociales y venta en línea. “Estamos inundados de información”, advirtió Alfonso Uscátegui, gerente regional de servicios corporativos de nube de SAP.

Pero, ¿cuánta capacidad tiene su negocio para entenderlos y hacer una prospección? “Cada empresa tiene necesidades particulares”, dijo Julio Pallaviccini, gerente senior de consultoría de EY. “Por lo anterior, es de vital importancia saber escoger las mejores soluciones”.

Las soluciones, plataformas y servicios de asesoría para gestión de datos son variados y dependen de lo que se quiera, por lo que es indispensable conocer los conceptos:

Big data

Big data se refiere a conjuntos de datos extremadamente grandes, de gran variedad, que se generan constantemente a gran velocidad, con valor y que deben ser visualizados así como tener veracidad y variabilidad (flexibilidad para su manejo).

Las posibilidades de manejar tales volumenes de datos aumentaron con los avances tecnológicos de los últimos años y la diversidad de plataformas que permiten revelar patrones y tendencias relacionadas con las operaciones e interacciones en la empresa.

“Los volúmenes son tan grandes que no se pueden tratar con software convencional”, advirtió Eduardo Oreamuno, de la comisión de big data del Colegio de Profesionales en Informática y Computación (CPIC).

Analítica de datos

La analítica permite, en tiempo real, identificar patrones y conocimientos a partir de datos (históricos, estructurados y no estructurados), empleando métodos estadísticos para encontrar correlaciones significativas, generar gráficos, crear presentaciones visuales para facilitar el análisis y la toma decisiones.

Los análisis pueden ser descriptivos (para entender lo ocurrido y porqué), predictivos (para identificar comportamientos futuros) o prescriptivos (para determinar qué hacer).

José Argüello y Milton Villalobos, profesor y director de la escuela de información de la Universidad Cenfotec, aclaran que la analítica de datos se complementa con big data para hacer análisis precisos. Asimismo, la inteligencia de negocios (business intelligence) analiza lo pasado y la analítica (business analytics) genera predicciones y prescripciones.

Minería de datos

La minería de datos es el proceso de búsqueda de información útil en grandes bases de datos. Aquí las herramientas de big data son fundamentales, tales como los sistemas de data warehouse, data lake o data lake house que agregan, almacenan y combinan información.

Las empresas minoristas y financieras usan la minería de datos para aumentar clientes, predecir fluctuaciones en las tasas de interés o los precios de las acciones, determinar la demanda y hasta anticipar si un solicitante de un crédito cumplirá.

En especial es una técnica para descubrir información desconocida, basándose en estadísticas, inteligencia artificial, aprendizaje automático y métodos de extracción, transformación, limpieza e integración de datos, así como identificación de patrones. “La minería de datos está cubierta por la ciencia de datos”, dijo Oreamuno.

Ciencia de datos

La ciencia de datos es un concepto más amplio e implica un método sistemático que se apoya en varias disciplinas (estadística, matemática y ciencias sociales) y herramientas tecnológicas para generar conocimiento. Abarca desde el entendimiento del negocio hasta la recolección, preparación y limpieza de datos.

Se relaciona con big data, la minería de datos y el conocimiento o aprendizaje automático profundo, donde los sistemas utilizan inteligencia artificial y actúan según conocimientos ya existentes, para descubrir patrones ocultos.

A las empresas les ayuda a descubrir nuevas preguntas para impulsar la innovación. A diferencia del análisis de datos, que implica verificar una hipótesis, la ciencia de datos intenta construir conexiones y responder preguntas sobre el futuro.

En las compañías hay datos disponibles en hojas de cálculo, lectores de códigos de barras o códigos QR, equipos o máquinas con sistemas computacionales o de transmisión de información (telemetría), reportes manuales, sistemas gerenciales (ERP, por sus siglas en inglés) y de relaciones con los clientes (CRM). Se agregan encuestas, grupos focales y conversaciones en redes sociales.

Las empresas también obtienen informaciones de empresas de investigación de mercados o académicas, cámaras empresariales, y entidades como el Banco Central de Costa Rica, el Instituto Nacional de Estadística y Censos (INEC), el Programa Estado de la Nación y medios de comunicación, entre otras.

La clave está en generar una cultura de aprovechamiento de datos y convertir la empresa en una data-driven company, independientemente de su tamaño. La mayoría de las empresas utilizan datos en diferentes niveles.

Con independencia de su nivel de madurez en el uso de datos es necesario que las empresas identifiquen el estado actual de las prácticas y competencias técnicas del personal, por un lado, y las mejores prácticas recomendadas por el otro. Así pueden determinar sus oportunidades de mejora para definir una estrategia.

Los especialsitas señalan que las empresas pueden contratar servicios de proveedores externos o su propio personal especializado según los recursos, el nivel de aprovechamiento de la información que se desea y el proceso para lograrlo. En cualquier caso, se debe establecer medidas de seguridad y cumplimiento de las normas de privacidad de datos personales.

Para las empresas todo esto tiene sentido si logran encontrar nuevos mercados y productos, generar recomendaciones de compra, atender consultas de clientes, brindar acceso a servicios, atender consultas a través de los chatbots y lanzar publicidad personalizada. Las aplicaciones son múltiples y variadas, tanto como los datos disponibles.

Plataformas
Tipos de soluciones que se pueden utilizar:
Big data
Servicios administrados: Azure Data Lake Store, Azure Data Lake Analytics, Azure Synapse Analytics, Azure Stream Analytics, Azure Event Hub, Azure IoT Hub, and Azure Data Factory.
Tecnologías de código abierto basadas en la plataforma Apache Hadoop: HDFS, HBase, Hive, Pig, Spark, Storm, Oozie, Sqoop, and Kafka. Estas tecnologías están disponibles en Azure con el servicio Azure HDInsight.
Otras tecnologías recomendadas: Talend, Informatica y Data Factory SSIS de Microsoft (para ingesta de datos) y Hadoop, Cloudera, Fusion Insight, MapR, Azure Data Gen 2, SQL Server, PostgreSQL, Oracle (para almacenamiento).
Analítica
Azure Synapse Analytics, Azure Databricks, Alteryx, RapidMiner, Python, R Studio, IBM Watson, Azure Machine Learning, entre otras.
Visualización
PowerBI, Tableau, Pentaho.
Ciencia de datos
Data Science Virtual Machines, HDInsight Spark Clusters, Azure Synapse Analytics, Azure Data Lake, HDInsight Hive Clusters, Azure File Storage, SQL Server 2019 R and Python Services, Azure Databricks.
Minería de datos
SQL Server Integration Services (SSIS), SQL Server Reporting Services (SSRS), SQL Server Analysis Services (SSAS).
Fuente: EY y Cenfotec
Carlos Cordero Pérez

Carlos Cordero Pérez

Carlos Cordero es periodista especializado en temas tecnológicos. Escribe para El Financiero y es autor del blog "La Ley de Murphy".

LE RECOMENDAMOS

En beneficio de la transparencia y para evitar distorsiones del debate público por medios informáticos o aprovechando el anonimato, la sección de comentarios está reservada para nuestros suscriptores para comentar sobre el contenido de los artículos, no sobre los autores. El nombre completo y número de cédula del suscriptor aparecerá automáticamente con el comentario.