Ingeniería & Infraestructura
MLOps y Operación de Modelos
4–8 semanasEl mayor riesgo de un modelo en producción no es que sea impreciso al inicio — es que se vuelva impreciso con el tiempo sin que nadie lo note. Establecemos la infraestructura operacional que mantiene tus modelos funcionando, monitoreados y evolucionando: desde el tracking de experimentos hasta el reentrenamiento automatizado y el gobierno del ciclo de vida del modelo. Técnicamente: tracking de experimentos (MLflow, Weights & Biases), registro de modelos con versionado, CI/CD para modelos (pipelines de reentrenamiento automatizado), detección de drift de datos y concepto (PSI, métricas de degradación), estrategias champion/challenger y documentación de model cards.
Casos de uso
- —Modelos en producción sin monitoreo de rendimiento
- —Necesidad de reentrenamiento automatizado de modelos existentes
- —Gobierno y versionado de múltiples modelos en producción
- —Equipos que quieren escalar su capacidad de experimentación ML
- —Auditorías de ciclo de vida de modelos para compliance
Entregables
- —Setup de tracking de experimentos (MLflow o Weights & Biases)
- —Pipeline de reentrenamiento automatizado con triggers configurables
- —Registro de modelos con versionado y metadata
- —Sistema de detección de drift de datos y concepto con alertas
- —Estrategia champion/challenger para actualizaciones de modelo
- —Model cards para documentación de modelos en producción