Forecasting Contextual
Recientemente, surgió la pregunta en una presentación sobre si a un modelo se le puede alimentar información contextual, además de los datos numéricos históricos utilizados en su entrenamiento.
La respuesta fue sí, y las LLMs han facilitado este tipo de implementaciones en meses recientes. De hecho, es similar a lo que hemos incorporado en la LLM que acompaña el motor predictivo de Signeo AI. Pensemos en información contextual como aquella que se le puede transmitir a un modelo de pronóstico a través de un prompt, como lo haría cualquiera con ChatGPT, Gemini o similar, pero aplicada a información específica de la cadena de suministro de una empresa. Esta información puede ser almacenada en memoria por el modelo y modificada por el usuario si así fuera necesario.
No es aconsejable una regla estática embebida en el código. Además de ser rígida, el usuario promedio de una cadena de suministro no tiene tiempo ni los medios para intervenir el código cada vez que algo cambia. Y en el contexto de la cadena de suministro, todo cambia: las reglas que hoy prevalecen, mañana pueden dejar de hacerlo. Añadir reglas al código una y otra vez incrementa el costo y frena la agilidad.
Pensemos en el modelo como un asistente que va tomando nota de lo que el planificador de demanda o abastecimiento sabe, pero que el modelo por sí solo ignoraría, por que simplemente no está en su data de entrenamiento.
Y es aquí donde se hace más evidente el desfase entre lo que los datos muestran y lo que los expertos saben. El modelo puede estar bien entrenado, pero si ignora la realidad operativa, sus estimados pueden desviarse, por exceso o por defecto, de lo que realmente sucederá.
Cuando el histórico no basta
Los modelos predictivos aprenden del pasado, pero la cadena de suministro vive en el presente. A veces, los datos no contienen la historia completa.
Sucede cuando se anticipa una sobreventa por razones que solo la operación conoce: una promoción inminente, un cliente que duplicará su pedido, una oportunidad puntual que no aparece en los registros. Si el modelo no recibe esta información, su pronóstico se queda corto.
Pero también ocurre lo contrario.
El modelo insiste en vender lo que no se puede entregar, porque desconoce el daño operativo, el retraso logístico o las restricciones que solo quienes operan la cadena conocen.
En ambos escenarios, el modelo necesita algo más que datos: necesita contexto.
Tradicionalmente, los modelos de series temporales han trabajado exclusivamente con datos numéricos, ignorando el contexto esencial que los expertos humanos suelen considerar. Al integrar este método se le puede dar un enfoque multimodal innovador, desde métodos estadísticos hasta LLMs, pueden abordar esta integración.
¿Pero qué tipo de información contextual se le puede dar a un modelo?
- Información intemporal: Aspectos estructurales del negocio que no cambian con el tiempo, como estacionalidades de largo período no reflejadas en los datos recientes (ej. Halloween, Navidad).
- Información histórica no representada: Comportamientos pasados relevantes que el histórico numérico no refleja, por ejemplo, períodos sin ventas debido a quiebres de stock o sobreventas atípicas durante la pandemia.
- Covariables: Variables externas que influyen sobre la demanda, como el clima o eventos específicos.
- Información futura: Hechos ya conocidos por la organización que afectarán la demanda pero que aún no han ocurrido, como el daño crítico de una línea o un embarque varado en aduanas.
Potencial de instrucciones contextuales
El potencial de los enfoques contextuales en forecasting, puede tener aplicaciones como:
– Predicción de demanda: Integrar datos externos (como tendencias del mercado) para anticipar picos o caídas.
– Optimización de inventarios: Incorporar políticas regulatorias, restricciones o capacidades operativas directamente en las proyecciones.
– Gestión energética y logística: Predecir interrupciones basadas en eventos climáticos o patrones históricos.
Futuro del Forecasting Contextual
Los hallazgos destacan la necesidad de desarrollar modelos más eficientes que balanceen precisión y recursos computacionales. Además, se plantea un futuro donde el forecasting no solo sea una herramienta predictiva, sino también un componente integrado en sistemas agénticos, habilitando decisiones automatizadas basadas en datos y contexto.