IA de Mantenimiento Predictivo: Preparando Datos de Sensores + Documentos On-Premise

El mantenimiento predictivo promete reemplazar el mantenimiento programado con mantenimiento basado en condicion — interviniendo solo cuando el equipo realmente muestra signos de degradacion, no en intervalos arbitrarios del calendario. Los modelos de IA que habilitan esto necesitan datos de entrenamiento que combinen lecturas de sensores (vibracion, temperatura, presion, corriente) con registros de mantenimiento (que fallo, por que, y que se hizo al respecto).

Preparar estos datos de entrenamiento es mas dificil de lo que suena. Los datos de sensores y los registros de mantenimiento viven en sistemas diferentes, usan formatos diferentes, y son propiedad de equipos diferentes. Unirlos en un dataset de entrenamiento unificado — on-premise, en un entorno de manufactura aislado — requiere un pipeline de preparacion de datos deliberado.

Los Dos Flujos de Datos

Datos de Series Temporales de Sensores

Los equipos de manufactura generan lecturas continuas de sensores:

Sensores de vibracion: Aceleracion, velocidad, desplazamiento — indicadores primarios de la salud de rodamientos y maquinaria rotativa
Sensores de temperatura: Temperaturas de rodamientos, temperaturas de bobinado de motor, temperaturas de proceso
Sensores de presion: Presion hidraulica, presion neumatica, presion de refrigerante
Sensores electricos: Corriente del motor, voltaje, factor de potencia — indicadores de carga electrica y mecanica
Sensores de flujo: Flujo de refrigerante, flujo de lubricante, flujo de material de proceso

Estos datos tipicamente se almacenan en un historiador (OSIsoft PI, Aveva, InfluxDB) a tasas de muestreo desde una vez por segundo hasta cientos de veces por segundo. El volumen es sustancial — una sola maquina con 20 sensores muestreando a 1 Hz genera 1.7 millones de puntos de datos por dia.

Registros de Mantenimiento

Los registros de mantenimiento capturan lo que le paso al equipo:

Ordenes de trabajo: Registros estructurados de actividades de mantenimiento planificadas y no planificadas
Notas de tecnicos: Descripciones en texto libre de sintomas, observaciones y acciones tomadas
Informes de fallas: Analisis de causa raiz vinculando fallas a factores contribuyentes
Registros de reemplazo de partes: Que se reemplazo, cuando y por que
Manuales de equipos: Procedimientos de mantenimiento del fabricante y descripciones de modos de falla

Estos datos tipicamente se almacenan en un CMMS (Sistema Computarizado de Gestion de Mantenimiento) como SAP PM, Maximo o Fiix — y los campos de texto libre son donde vive la verdadera inteligencia.

El Desafio de la Preparacion de Datos

Alineando Series Temporales con Eventos

El desafio central: conectar patrones de sensores con resultados de mantenimiento. Un pico de vibracion el 15 de marzo necesita vincularse al reemplazo de rodamiento del 17 de marzo para crear un ejemplo de entrenamiento etiquetado.

Esta alineacion requiere:

Sincronizacion de marcas de tiempo entre el historiador y el CMMS (que frecuentemente usan diferentes zonas horarias o fuentes de reloj)
Ventanas de eventos: Definir la ventana de tiempo antes de una falla que constituye el patron de "pre-falla" (horas? dias? semanas?)
Normal vs. degradandose: Etiquetar que ventanas de sensores representan operacion normal vs. degradacion progresiva
Multiples modos de falla: El mismo equipo puede fallar de diferentes maneras, cada una con diferentes firmas de sensores

Extrayendo Inteligencia de los Registros de Mantenimiento

Las notas de tecnicos contienen informacion critica en forma no estructurada:

"Revise el motor de la Linea 3 de la prensa. Se noto vibracion inusual durante la operacion. Se reemplazo el conjunto de rodamiento superior. Se encontro desgaste significativo en la pista interior. Posible contaminacion por fuga de refrigerante del mes pasado."

De esta nota, un profesional de mantenimiento capacitado extrae:

Modo de falla: Desgaste de rodamiento
Causa raiz: Contaminacion por refrigerante
Equipo: Motor de prensa Linea 3
Componente: Conjunto de rodamiento superior
Severidad: Significativa (requirio reemplazo)

Un ingeniero de ML sin experiencia en mantenimiento perderia la cadena causal entre la fuga de refrigerante y la falla del rodamiento. Por eso el etiquetado por expertos de dominio es esencial.

Manejando el Desequilibrio de Clases

Las fallas de equipos son (esperemos) eventos raros. En una operacion de manufactura saludable, el 95-99% de las lecturas de sensores representan operacion normal. Los patrones de falla que el mantenimiento predictivo necesita detectar estan en el 1-5% restante.

La preparacion de datos de entrenamiento debe abordar esto:

Sobremuestreo de ventanas de falla
Generacion de datos sinteticos para modos de falla raros
Ventanas cuidadosas para maximizar el uso de datos de degradacion (la disminucion gradual antes de la falla es mas util que el momento de la falla en si)

El Pipeline

Paso 1: Exportacion y Limpieza de Datos de Sensores

Exportar del historiador para rangos de tiempo relevantes (tipicamente 6-24 meses por unidad de equipo)
Remuestrear a intervalos consistentes si los sensores tienen diferentes tasas de muestreo
Manejar datos faltantes (caidas de sensores, vacios del historiador)
Eliminar valores atipicos causados por malfunciones de sensores (no problemas de equipo)
Normalizar entre diferentes tipos y escalas de sensores

Paso 2: Procesamiento de Registros de Mantenimiento

Exportar ordenes de trabajo y notas de tecnicos del CMMS
Parsear campos de texto libre para modo de falla, causa raiz, componente y severidad
Estandarizar terminologia (la misma falla descrita de forma diferente por diferentes tecnicos)
Mapear eventos de mantenimiento a identificadores de equipo que coincidan con datos de sensores
Construir una linea de tiempo de eventos de mantenimiento por unidad de equipo

Paso 3: Fusion de Datos

Alinear series temporales de sensores con lineas de tiempo de eventos de mantenimiento
Crear ventanas etiquetadas: "normal" (sin evento de mantenimiento siguiente), "pre-falla" (evento de mantenimiento dentro de N dias), "post-mantenimiento" (recientemente servido)
Adjuntar contexto de mantenimiento a ventanas de sensores (modo de falla, causa raiz)
Crear vectores de caracteristicas combinando estadisticas de sensores (media, desviacion estandar, pico, RMS, caracteristicas de frecuencia) con metadatos del equipo

Paso 4: Etiquetado y Validacion

Los ingenieros de mantenimiento validan la alineacion entre patrones de sensores y eventos de falla
Los expertos de dominio revisan casos extremos: Fue realmente una falla, o mantenimiento programado? Fue la lectura del sensor genuina, o un artefacto de medicion?
Etiquetar vida util restante (RUL) donde los registros del equipo lo soporten

Paso 5: Exportacion

Datasets estructurados para modelos de clasificacion de series temporales
Matrices de caracteristicas para modelos de ML tradicional (Random Forest, XGBoost)
Datos de secuencia para modelos basados en LSTM/Transformer
Documentacion de mapeos sensor-a-falla para interpretabilidad del modelo

Por Que Esto Debe Hacerse On-Premise

La preparacion de datos de mantenimiento predictivo tiene tres requisitos estrictos para procesamiento on-premise:

Aislamiento de red OT: Los datos de sensores viven en la red de tecnologia operacional, que tipicamente esta aislada de la red de TI y del internet
Proteccion de secretos comerciales: Las configuraciones de equipos, parametros de proceso y patrones de falla son inteligencia competitiva
Volumen de datos: Meses de datos de sensores de alta frecuencia de cientos de maquinas es demasiado grande para transferencia practica a la nube

La herramienta de preparacion de datos debe funcionar dentro de estas restricciones — completamente sin conexion, en infraestructura local, sin dependencias de la nube.

Ertas Data Suite esta disenado exactamente para este entorno: una aplicacion de escritorio nativa que funciona aislada, procesa tanto datos estructurados de sensores como registros de mantenimiento no estructurados, y exporta en formatos adecuados para modelos de mantenimiento predictivo. La interfaz es accesible para ingenieros de mantenimiento y profesionales de confiabilidad que entienden el equipo — no solo para cientificos de datos que entienden los algoritmos.