Back to blog
    Pipelines de Etiquetado de Imagenes para IA de Inspeccion de Calidad en Manufactura
    manufacturingquality-inspectionimage-labelingcomputer-visiondefect-detectionon-premiseenterprise

    Pipelines de Etiquetado de Imagenes para IA de Inspeccion de Calidad en Manufactura

    Una guia practica para construir pipelines de etiquetado de imagenes para inspeccion de calidad en manufactura — comparando estrategias de bounding box, segmentacion y clasificacion para deteccion de defectos, analisis de superficies y verificacion de ensamblaje.

    EErtas Team·

    Los fabricantes pierden un estimado de 15-20% de ingresos en costos relacionados con la calidad segun la American Society for Quality. La inspeccion visual impulsada por IA puede reducir las tasas de escape de defectos en un 90% comparado con la inspeccion manual — pero la brecha entre una demo prometedora y un sistema de inspeccion listo para produccion es casi siempre un problema de etiquetado de datos.

    Los modelos de vision por computadora para inspeccion de calidad necesitan imagenes de entrenamiento etiquetadas con precision. Un modelo de deteccion de rayones que fue entrenado con bounding boxes dibujados de manera imprecisa producira detecciones imprecisas e inconsistentes en produccion. Un clasificador de defectos de superficie entrenado con categorias inconsistentes generara clasificaciones inconsistentes. El pipeline de etiquetado determina el techo de lo que el modelo puede lograr.

    Esta guia cubre como disenar y construir pipelines de etiquetado de imagenes para tres casos de uso principales de inspeccion en manufactura: deteccion de defectos, analisis de superficies y verificacion de ensamblaje.

    Comparacion de Estrategias de Etiquetado

    La primera decision arquitectonica en cualquier pipeline de inspeccion basado en vision es la estrategia de etiquetado. Cada estrategia captura informacion diferente y se adapta a diferentes tareas de inspeccion.

    EstrategiaQue CapturaIdeal ParaTiempo de Anotacion por ImagenSalida del Modelo
    Clasificacion de imagenCategoria de imagen completa (aprobado/rechazado, tipo de defecto)Clasificacion aprobado/rechazado, evaluacion de calidad por lote2-5 segundosEtiqueta de categoria + puntuacion de confianza
    Bounding boxUbicacion y extension aproximada de defectosConteo de defectos, localizacion de defectos, imagenes con multiples defectos10-30 segundosRectangulos con etiquetas de clase
    Segmentacion semanticaLimites de defectos a nivel de pixelMedicion de area superficial, gradacion de severidad de defectos2-5 minutosMascara de pixeles por clase
    Segmentacion de instanciasInstancias individuales de defectos a nivel de pixelConteo de defectos superpuestos, mediciones por defecto3-8 minutosMascaras de pixeles por instancia
    Anotacion de keypointsPuntos de caracteristicas especificasAlineacion de ensamblaje, posicionamiento de componentes15-45 segundosPares de coordenadas nombrados

    Mapeo de Estrategia a Caso de Uso

    Elegir la estrategia de etiquetado incorrecta desperdicia esfuerzo de anotacion y limita la capacidad del modelo. Asi es como cada caso de uso de manufactura se mapea a la estrategia apropiada:

    Caso de Uso de InspeccionEstrategia RecomendadaPor Que
    Deteccion de defectos de soldaduraBounding box o segmentacion de instanciasNecesidad de localizar defectos individuales; la segmentacion agrega medicion de severidad via area del defecto
    Deteccion de rayones en superficieSegmentacion semanticaLos rayones son formas irregulares; los bounding boxes incluyen demasiada area sin defecto, inflando regiones de falsos positivos
    Inspeccion de juntas de soldadura PCBBounding box + clasificacionCada junta necesita localizacion (bounding box) mas grado de calidad (clasificacion: buena, fria, puenteada, insuficiente)
    Verificacion de completitud de ensamblajeAnotacion de keypoints o bounding boxVerificar presencia y posicion de componentes en ubicaciones esperadas
    Uniformidad de pintura/recubrimientoSegmentacion semanticaDefectos como piel de naranja, escurrimientos o zonas delgadas necesitan medicion basada en area para gradacion de severidad
    Tolerancia dimensionalAnotacion de keypointsMedir distancias entre puntos de referencia para verificar conformidad dimensional
    Integridad de empaqueClasificacion de imagenAprobado/rechazado binario en integridad del sello, colocacion de etiqueta o nivel de llenado

    Construyendo el Pipeline de Etiquetado de Imagenes

    Un pipeline de etiquetado en produccion para inspeccion de manufactura involucra mas que dibujar cajas en imagenes. Requiere ingesta, preprocesamiento, anotacion, aseguramiento de calidad y exportacion con control de versiones.

    Etapa 1: Ingesta y Preprocesamiento de Imagenes

    Las imagenes de inspeccion de manufactura provienen de camaras de barrido lineal, camaras de area, microscopios, sistemas de rayos X y captura con smartphones. Cada fuente tiene diferentes caracteristicas de resolucion, espacio de color y metadatos.

    Fuente de ImagenResolucion TipicaPreprocesamiento Necesario
    Camara de barrido lineal4K-16K pixeles de ancho, altura variableUnir segmentos de linea en imagenes completas de la pieza
    Camara de area (montaje fijo)2-12 MPRecorte consistente a region de interes, normalizacion de exposicion
    Microscopio / lente macro5-20 MPApilamiento de enfoque, anotacion de calibracion de escala
    Rayos X / CT1-4 MP, escala de grises de 16 bitsAjuste de ventana/nivel, conversion de formato a 8 bits para anotacion
    Smartphone (captura en campo)12-48 MPRedimensionar, normalizacion de color, correccion de orientacion

    La consistencia del preprocesamiento es critica. Si las imagenes de entrenamiento tienen exposicion, regiones de recorte u orientaciones variables, el modelo aprende a detectar variaciones de iluminacion en lugar de defectos. Estandariza el preprocesamiento antes de que comience la anotacion.

    Ertas Data Suite ingesta imagenes a traves del nodo Image Parser, que extrae metadatos incrustados (EXIF, resolucion, espacio de color) y alimenta las imagenes al pipeline de procesamiento. El canvas visual hace que sea sencillo agregar pasos de normalizacion antes de que las imagenes lleguen a la etapa de etiquetado.

    Etapa 2: Diseno del Flujo de Trabajo de Anotacion

    El flujo de trabajo de anotacion debe disenarse para el contexto de inspeccion especifico, no adaptarse de una configuracion generica de herramienta de etiquetado.

    El diseno de la taxonomia de defectos es la base. Una taxonomia bien disenada para una operacion de estampado de metal podria verse asi:

    Clase de DefectoDescripcion VisualNiveles de SeveridadTamano Minimo de Anotacion
    RayonMarca lineal en superficie, profundidad variableMenor (solo cosmetico), Mayor (afecta la funcion)20px de longitud minima
    AbolladuraDeformacion localizada con sombraMenor (profundidad inferior a 0.1mm), Mayor (profundidad superior a 0.1mm)10x10px minimo
    GrietaDiscontinuidad lineal, frecuentemente ramificadaTodas las grietas son Mayor15px de longitud minima
    PorosidadVacios circulares/irregulares en la superficieDispersa (cosmetica), Agrupada (preocupacion estructural)5x5px minimo por poro
    RebabaProtrusion de material en bordesMenor (dentro de tolerancia), Mayor (excede tolerancia)10px minimo
    ContaminacionMaterial extrano en la superficieCualquier presencia se marca8x8px minimo

    Establecer tamanos minimos de anotacion previene que los etiquetadores marquen artefactos que estan por debajo del umbral de deteccion del sistema de camara de produccion. Si la camara de produccion resuelve a 0.1mm por pixel y un defecto debe ser de al menos 0.5mm para ser relevante, las anotaciones menores a 5 pixeles son ruido.

    Etapa 3: Aseguramiento de Calidad del Etiquetado

    La consistencia del etiquetado entre anotadores es el mayor riesgo de calidad en los datasets de inspeccion de manufactura. Dos anotadores mirando la misma imagen de un rayon pueden dibujar bounding boxes de diferentes tamanos, clasificar la severidad de manera diferente o no estar de acuerdo sobre si una marca es un rayon o una marca de herramienta.

    Protocolos de acuerdo inter-anotador:

    Metodo de QAComo FuncionaCuando Usar
    Doble anotacionDos anotadores etiquetan independientemente la misma imagen; desacuerdos van a un adjudicadorPrimeras 200-500 imagenes (fase de calibracion)
    Verificacion aleatoria10-15% de imagenes aleatorias revisadas por un anotador seniorEtiquetado de produccion continuo
    Revision de consensoRevision grupal de casos limite para establecer precedentesCuando surgen nuevos tipos de defectos o cambia la taxonomia
    Umbral de IoUSolapamiento de bounding box/segmentacion debe exceder 0.75 entre anotadoresVerificacion de QA automatizada en imagenes con doble anotacion

    Tasas objetivo de acuerdo inter-anotador por estrategia:

    • Clasificacion de imagen: 95% o mayor acuerdo
    • Bounding box: 0.75+ IoU (Intersection over Union)
    • Segmentacion semantica: 0.70+ IoU (el acuerdo a nivel de pixel es mas dificil)
    • Keypoints: dentro de 5 pixeles de la posicion de referencia

    Etapa 4: Aumento de Datos y Balance

    Los datasets de defectos de manufactura son inherentemente desbalanceados. Una linea de produccion que funciona bien produce muchas mas piezas buenas que defectuosas. Un dataset que refleje las tasas naturales de defectos podria contener 99% de imagenes aprobadas y 1% de imagenes rechazadas — lo cual entrena un modelo que simplemente predice "aprobado" para todo.

    Estrategias de balance:

    • Recoleccion controlada: Recolectar y fotografiar intencionalmente piezas defectuosas durante retenciones de calidad, estaciones de retrabajo o pruebas destructivas
    • Aumento sintetico: Aplicar transformaciones geometricas (rotacion, volteo, recorte), variacion de color y adicion de ruido a imagenes de defectos para aumentar su representacion
    • Aumento por copia y pegado: Para tareas de segmentacion, pegar regiones de defectos etiquetados sobre imagenes de piezas limpias (requiere mascaras de segmentacion a nivel de pixel)
    • Sintesis basada en GAN: Generar imagenes sinteticas de defectos usando modelos generativos entrenados con defectos reales (requiere un minimo de 200-300 imagenes reales de defectos por clase)

    El balance objetivo depende del caso de uso. Para inspeccion critica de seguridad (automotriz, aeroespacial), mantener al menos una proporcion de 5:1 bueno-a-defecto con aumento intensivo de tipos de defectos raros. Para inspeccion cosmetica, una proporcion de 10:1 es tipicamente suficiente.

    Etapa 5: Exportacion e Integracion con el Modelo

    El formato de exportacion debe coincidir con el framework del modelo. La inspeccion de manufactura comunmente usa:

    FrameworkFormato de ExportacionTipo de Anotacion
    YOLOv8/v9YOLO TXT (class x_center y_center width height)Bounding box
    COCOJSON con coordenadas de poligonoBounding box, segmentacion, keypoint
    Pascal VOCXML por imagenBounding box
    TFRecordProtobuf binarioCualquiera (especifico del framework)
    Custom PyTorchCSV o JSONL con rutas + etiquetasCualquiera

    Ertas Data Suite exporta datasets etiquetados a traves de nodos exportadores configurables. El enfoque de pipeline significa que el paso de exportacion es reproducible — cuando se recolectan nuevas imagenes, fluyen a traves del mismo preprocesamiento, se etiquetan, pasan las mismas verificaciones de QA y se exportan en el mismo formato sin intervencion manual.

    Requisitos On-Premise para Manufactura

    Los datos de imagenes de manufactura frecuentemente contienen disenos de productos propietarios, parametros de proceso y metricas de calidad que representan una ventaja competitiva significativa. Enviar imagenes del piso de fabrica a herramientas de etiquetado basadas en la nube introduce riesgos de exposicion de propiedad intelectual que la mayoria de los fabricantes no aceptaran.

    Mas alla de las preocupaciones de propiedad intelectual, los entornos de manufactura frecuentemente tienen conectividad de red limitada o restringida. Las estaciones de trabajo del piso de fabrica pueden estar en redes aisladas sin acceso a internet. Un pipeline de etiquetado on-premise que funciona sin dependencias en la nube no es solo una preferencia de cumplimiento — es un requisito operacional.

    Ertas Data Suite se ejecuta como una aplicacion de escritorio nativa sin necesidad de exposicion de red. El pipeline visual opera completamente en computo local, y el espacio de trabajo de anotacion (actualmente en desarrollo activo) esta disenado para expertos del dominio — ingenieros de calidad y operadores de linea — que entienden los defectos pero no deberian necesitar instalar entornos Python o configurar servidores de anotacion.

    Lista de Verificacion de Implementacion Practica

    Para equipos que construyen IA de inspeccion de manufactura, el pipeline de datos debe abordar cada uno de estos requisitos antes de que comience el entrenamiento del modelo:

    1. Estandarizar la captura de imagenes — iluminacion, angulo, resolucion y region de interes consistentes en todas las imagenes de entrenamiento
    2. Disenar la taxonomia de defectos con aportes de ingenieros de calidad, no solo ingenieros de ML
    3. Establecer umbrales de tamano minimo de anotacion basados en la resolucion de la camara de produccion y la significancia del defecto
    4. Calibrar anotadores con una fase de doble anotacion en las primeras 200-500 imagenes
    5. Implementar QA continuo con verificaciones aleatorias en el 10-15% de las imagenes etiquetadas
    6. Abordar el desbalance de clases mediante recoleccion controlada y aumento antes del entrenamiento
    7. Versionar datasets para que el rendimiento del modelo pueda rastrearse a versiones de datos especificas
    8. Exportar en el formato del framework objetivo con pasos de pipeline reproducibles

    Los equipos que entregan modelos de inspeccion confiables invierten fuertemente en la calidad del etiquetado. Los equipos que luchan en produccion tipicamente apresuraron el etiquetado con anotaciones inconsistentes, datasets desbalanceados o sin proceso de QA. El pipeline es el producto.

    Turn unstructured data into AI-ready datasets — without it leaving the building.

    On-premise data preparation with full audit trail. No data egress. No fragmented toolchains. EU AI Act Article 30 compliance built in.

    Keep reading