Back to blog
    IA de Mantenimiento Predictivo: Preparando Datos de Sensores + Documentos On-Premise
    predictive-maintenancemanufacturingsensor-datadata-preparationon-premisesegment:enterprise

    IA de Mantenimiento Predictivo: Preparando Datos de Sensores + Documentos On-Premise

    Como preparar datos de entrenamiento de mantenimiento predictivo combinando series temporales de sensores, registros de mantenimiento e informes de fallas — on-premise en entornos de manufactura aislados.

    EErtas Team·

    El mantenimiento predictivo promete reemplazar el mantenimiento programado con mantenimiento basado en condicion — interviniendo solo cuando el equipo realmente muestra signos de degradacion, no en intervalos arbitrarios del calendario. Los modelos de IA que habilitan esto necesitan datos de entrenamiento que combinen lecturas de sensores (vibracion, temperatura, presion, corriente) con registros de mantenimiento (que fallo, por que, y que se hizo al respecto).

    Preparar estos datos de entrenamiento es mas dificil de lo que suena. Los datos de sensores y los registros de mantenimiento viven en sistemas diferentes, usan formatos diferentes, y son propiedad de equipos diferentes. Unirlos en un dataset de entrenamiento unificado — on-premise, en un entorno de manufactura aislado — requiere un pipeline de preparacion de datos deliberado.

    Los Dos Flujos de Datos

    Datos de Series Temporales de Sensores

    Los equipos de manufactura generan lecturas continuas de sensores:

    • Sensores de vibracion: Aceleracion, velocidad, desplazamiento — indicadores primarios de la salud de rodamientos y maquinaria rotativa
    • Sensores de temperatura: Temperaturas de rodamientos, temperaturas de bobinado de motor, temperaturas de proceso
    • Sensores de presion: Presion hidraulica, presion neumatica, presion de refrigerante
    • Sensores electricos: Corriente del motor, voltaje, factor de potencia — indicadores de carga electrica y mecanica
    • Sensores de flujo: Flujo de refrigerante, flujo de lubricante, flujo de material de proceso

    Estos datos tipicamente se almacenan en un historiador (OSIsoft PI, Aveva, InfluxDB) a tasas de muestreo desde una vez por segundo hasta cientos de veces por segundo. El volumen es sustancial — una sola maquina con 20 sensores muestreando a 1 Hz genera 1.7 millones de puntos de datos por dia.

    Registros de Mantenimiento

    Los registros de mantenimiento capturan lo que le paso al equipo:

    • Ordenes de trabajo: Registros estructurados de actividades de mantenimiento planificadas y no planificadas
    • Notas de tecnicos: Descripciones en texto libre de sintomas, observaciones y acciones tomadas
    • Informes de fallas: Analisis de causa raiz vinculando fallas a factores contribuyentes
    • Registros de reemplazo de partes: Que se reemplazo, cuando y por que
    • Manuales de equipos: Procedimientos de mantenimiento del fabricante y descripciones de modos de falla

    Estos datos tipicamente se almacenan en un CMMS (Sistema Computarizado de Gestion de Mantenimiento) como SAP PM, Maximo o Fiix — y los campos de texto libre son donde vive la verdadera inteligencia.

    El Desafio de la Preparacion de Datos

    Alineando Series Temporales con Eventos

    El desafio central: conectar patrones de sensores con resultados de mantenimiento. Un pico de vibracion el 15 de marzo necesita vincularse al reemplazo de rodamiento del 17 de marzo para crear un ejemplo de entrenamiento etiquetado.

    Esta alineacion requiere:

    • Sincronizacion de marcas de tiempo entre el historiador y el CMMS (que frecuentemente usan diferentes zonas horarias o fuentes de reloj)
    • Ventanas de eventos: Definir la ventana de tiempo antes de una falla que constituye el patron de "pre-falla" (horas? dias? semanas?)
    • Normal vs. degradandose: Etiquetar que ventanas de sensores representan operacion normal vs. degradacion progresiva
    • Multiples modos de falla: El mismo equipo puede fallar de diferentes maneras, cada una con diferentes firmas de sensores

    Extrayendo Inteligencia de los Registros de Mantenimiento

    Las notas de tecnicos contienen informacion critica en forma no estructurada:

    "Revise el motor de la Linea 3 de la prensa. Se noto vibracion inusual durante la operacion. Se reemplazo el conjunto de rodamiento superior. Se encontro desgaste significativo en la pista interior. Posible contaminacion por fuga de refrigerante del mes pasado."

    De esta nota, un profesional de mantenimiento capacitado extrae:

    • Modo de falla: Desgaste de rodamiento
    • Causa raiz: Contaminacion por refrigerante
    • Equipo: Motor de prensa Linea 3
    • Componente: Conjunto de rodamiento superior
    • Severidad: Significativa (requirio reemplazo)

    Un ingeniero de ML sin experiencia en mantenimiento perderia la cadena causal entre la fuga de refrigerante y la falla del rodamiento. Por eso el etiquetado por expertos de dominio es esencial.

    Manejando el Desequilibrio de Clases

    Las fallas de equipos son (esperemos) eventos raros. En una operacion de manufactura saludable, el 95-99% de las lecturas de sensores representan operacion normal. Los patrones de falla que el mantenimiento predictivo necesita detectar estan en el 1-5% restante.

    La preparacion de datos de entrenamiento debe abordar esto:

    • Sobremuestreo de ventanas de falla
    • Generacion de datos sinteticos para modos de falla raros
    • Ventanas cuidadosas para maximizar el uso de datos de degradacion (la disminucion gradual antes de la falla es mas util que el momento de la falla en si)

    El Pipeline

    Paso 1: Exportacion y Limpieza de Datos de Sensores

    • Exportar del historiador para rangos de tiempo relevantes (tipicamente 6-24 meses por unidad de equipo)
    • Remuestrear a intervalos consistentes si los sensores tienen diferentes tasas de muestreo
    • Manejar datos faltantes (caidas de sensores, vacios del historiador)
    • Eliminar valores atipicos causados por malfunciones de sensores (no problemas de equipo)
    • Normalizar entre diferentes tipos y escalas de sensores

    Paso 2: Procesamiento de Registros de Mantenimiento

    • Exportar ordenes de trabajo y notas de tecnicos del CMMS
    • Parsear campos de texto libre para modo de falla, causa raiz, componente y severidad
    • Estandarizar terminologia (la misma falla descrita de forma diferente por diferentes tecnicos)
    • Mapear eventos de mantenimiento a identificadores de equipo que coincidan con datos de sensores
    • Construir una linea de tiempo de eventos de mantenimiento por unidad de equipo

    Paso 3: Fusion de Datos

    • Alinear series temporales de sensores con lineas de tiempo de eventos de mantenimiento
    • Crear ventanas etiquetadas: "normal" (sin evento de mantenimiento siguiente), "pre-falla" (evento de mantenimiento dentro de N dias), "post-mantenimiento" (recientemente servido)
    • Adjuntar contexto de mantenimiento a ventanas de sensores (modo de falla, causa raiz)
    • Crear vectores de caracteristicas combinando estadisticas de sensores (media, desviacion estandar, pico, RMS, caracteristicas de frecuencia) con metadatos del equipo

    Paso 4: Etiquetado y Validacion

    • Los ingenieros de mantenimiento validan la alineacion entre patrones de sensores y eventos de falla
    • Los expertos de dominio revisan casos extremos: Fue realmente una falla, o mantenimiento programado? Fue la lectura del sensor genuina, o un artefacto de medicion?
    • Etiquetar vida util restante (RUL) donde los registros del equipo lo soporten

    Paso 5: Exportacion

    • Datasets estructurados para modelos de clasificacion de series temporales
    • Matrices de caracteristicas para modelos de ML tradicional (Random Forest, XGBoost)
    • Datos de secuencia para modelos basados en LSTM/Transformer
    • Documentacion de mapeos sensor-a-falla para interpretabilidad del modelo

    Por Que Esto Debe Hacerse On-Premise

    La preparacion de datos de mantenimiento predictivo tiene tres requisitos estrictos para procesamiento on-premise:

    1. Aislamiento de red OT: Los datos de sensores viven en la red de tecnologia operacional, que tipicamente esta aislada de la red de TI y del internet
    2. Proteccion de secretos comerciales: Las configuraciones de equipos, parametros de proceso y patrones de falla son inteligencia competitiva
    3. Volumen de datos: Meses de datos de sensores de alta frecuencia de cientos de maquinas es demasiado grande para transferencia practica a la nube

    La herramienta de preparacion de datos debe funcionar dentro de estas restricciones — completamente sin conexion, en infraestructura local, sin dependencias de la nube.

    Ertas Data Suite esta disenado exactamente para este entorno: una aplicacion de escritorio nativa que funciona aislada, procesa tanto datos estructurados de sensores como registros de mantenimiento no estructurados, y exporta en formatos adecuados para modelos de mantenimiento predictivo. La interfaz es accesible para ingenieros de mantenimiento y profesionales de confiabilidad que entienden el equipo — no solo para cientificos de datos que entienden los algoritmos.

    Turn unstructured data into AI-ready datasets — without it leaving the building.

    On-premise data preparation with full audit trail. No data egress. No fragmented toolchains. EU AI Act Article 30 compliance built in.

    Keep reading