Las organizaciones están inundadas de datos; desde datos geocodificados de transacciones hasta tráfico del sitio web en tiempo real y cuantificaciones semánticas de los reportes corporativos anuales. Todos estos datos y fuentes solo añaden valor cuando se utilizan. Típicamente implica incorporar los datos en un modelo: una representación matemática formal que puede aplicarse o calibrarse para ajustarse a los datos.
Una curva cupón cero, que compara bonos con el mismo perfil de riesgo, pero diferentes fechas de liquidación, puede considerarse como un modelo. Una rúbrica de contratación también es una especie de modelo. Cuando escribe las características que hacen que valga la pena contratar a un candidato, usted crea un modelo que toma datos acerca del candidato y los convierte en una recomendación respecto a contratar o no a la persona. Otras organizaciones desarrollan modelos sofisticados. Algunos son estructurales y se pretende que capturen la realidad. Otros modelos obtienen datos usando herramientas de aprendizaje de las máquinas e inteligencia artificial.
Aunque los modelos aislados pueden desempeñarse bien, los ensambles de modelos funcionan incluso mejor. Los mejores pensadores, los predictores más acertados y los equipos de diseño más efectivos usan conjuntos de modelos. Son lo que yo llamo pensadores de modelos múltiples.
A favor de los modelos
Un modelo representa formalmente algún ámbito o proceso, muchas veces usando variables y fórmulas matemáticas. Las universidades líderes aplican modelos probabilísticos que representan a los solicitantes con base en el promedio de sus calificaciones, resultados de examen y otras variables, para determinar su probabilidad de graduarse. Las universidades también usan modelos para ayudar a los estudiantes a adoptar comportamientos exitosos. Estos modelos usan variables como los cambios en las calificaciones en exámenes a lo largo del semestre. Disney usó un modelo basado en agentes para diseñar parques y atracciones. Ese modelo creó una versión computarizada del parque, visitantes incluidos, y simuló su actividad, de forma que Disney pudiera ver cómo diferentes decisiones podrían afectar el funcionamiento del parque. La Congressional Budget Office usa un modelo económico que incluye estadísticas de ingresos, desempleo y salud, para estimar el costo de cambios a las leyes de salud.
Estos modelos ayudan a los líderes a explicar fenómenos y comunicar información. Imponen coherencia lógica y, al hacerlo, ayudan a pronosticar y tomar decisiones. Por ende, no debería sorprender que los modelos sean más exactos para predecir que la mayoría de las personas. En competiciones directas entre personas que usan modelos y personas que no, las primeras ganan, normalmente por amplios márgenes.
Los modelos poseen capacidades de las que carecen los humanos. Pueden integrar y aprovechar más datos, pueden probarse, calibrarse y compararse, y no cometen errores de lógica.
Combinaciones
Con un conjunto, puede compensar las brechas de cualquier modelo. Construir el mejor ensamble requiere pensamiento y esfuerzo. Los conjuntos más acertados no acumulan los modelos individuales de mayor desempeño. Usted quiere combinar modelos diversos.
La primera guía para construir un conjunto es buscar modelos que enfoquen su atención en diferentes partes de un problema o en distintos procesos. El matemático Doyne Farmer promueve los modelos basados en agentes como un buen segundo modelo. Estos consisten de “agentes” basados en reglas, que representan personas y organizaciones. A continuación, el modelo se aplica en una computadora. Un modelo basado en agentes para el mercado de la vivienda puede representar cada hogar, asignándole un ingreso y un pago de hipoteca o renta. También puede incluir reglas de comportamiento que describan condiciones para que los propietarios de casas refinancien o se declaren en bancarrota. Puede ser difícil plantear bien estas reglas y, como resultado, el modelo basado en agentes podría no ser tan correcto –al menos al inicio–. Sin embargo, argumentarían Farmer y otros, con el paso del tiempo los modelos podrían volverse muy exactos.
Los modelos estándar funcionan a partir de agregados, como los índices Case-Shiller, que miden los cambios en el precio de las viviendas. Si el índice Case-Shiller se eleva más rápidamente que los ingresos, podría ser probable una burbuja inmobiliaria. A pesar de lo útil que resulta este índice, está ciego ante cambios de la distribución que mantengan constante la media. Si los aumentos del ingreso van solo al 1%, mientras que los precios de la vivienda se incrementan generalizadamente, el índice no sería diferente en comparación con un incremento general de los ingresos. Los modelos basados en agentes no serían ciegos ante cambios en la distribución. El modelo basado en agentes no es necesariamente mejor. Su valor proviene de enfocar la atención donde no la pone el modelo estándar.
El segundo lineamiento toma prestado el concepto del boosting, una técnica del aprendizaje de las máquinas. Los algoritmos de clasificación en conjunto, como los modelos de bosques aleatorios, consisten en una colección de simples árboles de decisión. Un árbol de decisión que clasifique potenciales inversiones de capital de riesgo podría decir “si el mercado es grande, invierta”. Los bosques aleatorios son una técnica que combina múltiples árboles de decisión, y el boosting mejora el poder de esos algoritmos al usar datos para buscar nuevos árboles en forma novedosa. En lugar de buscar árboles que predigan aisladamente con alto nivel de exactitud, el boosting busca árboles que se desempeñen bien cuando el bosque de los árboles actuales no lo hace. Busque un modelo que atienda las debilidades de su modelo actual.
Un enfoque de boosting tomaría datos de todas las decisiones pasadas y observaría en dónde falló el primer modelo.
Muchas firmas han contratado científicos de computación para aplicar técnicas de inteligencia artificial (IA) para identificar errores de contratación previos. En lugar de intentar que la IA simplemente supere a su actual modelo de contratación, la utilizan para construir un segundo modelo que complemente al primero. Buscan en dónde falla el modelo actual y buscan nuevos modelos para complementarlo.
Tanto el boosting como la atención pretenden combinar modelos complementarios. Sin embargo, la atención observa lo que va dentro del modelo: las variables que considera. El boosting se enfoca en lo que resulta: casos donde el primer modelo tiene dificultades.
El boosting funciona mejor si tiene muchos datos históricos de cómo se desempeña su modelo primario. Algunas veces, no los tenemos. En esos casos, busque conflicto. Busque modelos que no concuerden. Cuando los equipos enfrentan decisiones complejas, esperan algo de desacuerdo. La unanimidad sería una señal de pensamiento de grupo. Eso también es cierto respecto a los modelos.
La única forma de que un conjunto mejore respecto a un modelo es si estos difieren. Para tomar prestada una cita de Richard Levins, la “verdad está en la intersección de mentiras independientes”. No está en la intersección de mentiras correlacionadas.
Para construir un conjunto, también podría construir un modelo de dinámica de sistemas, al igual que uno de contagio. Pensemos que el modelo de contagio resulta en ventas similares a largo plazo, pero con una absorción inicial más lenta, mientras que el modelo de dinámica de sistemas lleva a una predicción muy diferente. De ser así, crea una oportunidad para el pensamiento estratégico. ¿Por qué difieren los modelos?, ¿qué podemos aprender de ello? y ¿cómo intervenimos?
En suma, los modelos, al igual que los humanos, cometen errores por no poner atención a variables o interacciones relevantes. El pensamiento de modelos múltiples supera las problemas de atención de cualquier modelo.
Scott E. Page ocupa la cátedra colegiada Leonid Hurwicz de sistemas complejos, ciencia política y economía en la Universidad de Míchigan y es miembro externo de la facultad del Instituto Santa Fe. Es autor de “The Model Thinker” (Basic Books, 2018).