Back to blog
    Articulo 10 vs. Articulo 30 del EU AI Act: Lo Que Tu Equipo de Datos Necesita Saber
    eu-ai-actarticle-10article-30compliancedata-preparationsegment:enterprise

    Articulo 10 vs. Articulo 30 del EU AI Act: Lo Que Tu Equipo de Datos Necesita Saber

    Una comparacion detallada de los Articulos 10 y 30 del EU AI Act — las dos disposiciones mas criticas para la gobernanza de datos de entrenamiento de IA, documentacion y cumplimiento.

    EErtas Team·

    Si tu organizacion construye o despliega sistemas de IA de alto riesgo en la UE, dos articulos del EU AI Act daran forma directamente a como opera tu equipo de datos: el Articulo 10 (Datos y Gobernanza de Datos) y el Articulo 30 (Documentacion Tecnica). Estan relacionados pero son distintos, y confundirlos genera brechas de cumplimiento.

    Este articulo desglosa lo que requiere cada articulo, quien es responsable y como interactuan en la practica.

    Articulo 10: Datos y Gobernanza de Datos

    El Articulo 10 trata sobre el proceso de preparar datos de entrenamiento. Establece requisitos para como deben gestionarse los datasets de entrenamiento, validacion y prueba de los sistemas de IA de alto riesgo.

    Que Requiere

    Practicas de gobernanza de datos que cubran:

    • Decisiones de diseno para la recopilacion y origen de datos
    • Operaciones de preparacion de datos (limpieza, etiquetado, agregacion)
    • Evaluaciones de relevancia y representatividad
    • Examen de posibles sesgos
    • Identificacion de brechas o deficiencias en los datos

    Criterios de calidad de datos incluyendo:

    • Los datos de entrenamiento deben ser relevantes, suficientemente representativos y lo mas libres de errores posible
    • Los datasets deben ser apropiados para el proposito previsto del sistema de IA
    • Las propiedades estadisticas deben entenderse y documentarse

    Examen de sesgo:

    • Los datasets deben examinarse en busca de sesgos que podrian llevar a resultados discriminatorios
    • Donde se identifique sesgo, deben tomarse medidas apropiadas para abordarlo
    • El proceso de examen en si debe documentarse

    Quien es Responsable

    Las obligaciones del Articulo 10 recaen en el proveedor del sistema de IA de alto riesgo — la entidad que desarrolla o encarga el sistema de IA y lo coloca en el mercado. En la practica, esto significa el equipo de datos, los ingenieros de ML y su cadena de gestion.

    El Desafio Practico

    El Articulo 10 exige que tu proceso de preparacion de datos sea documentado y auditable. Aqui es donde la mayoria de las empresas tienen dificultades — no porque no limpien datos o verifiquen sesgos, sino porque estos pasos ocurren en scripts dispersos, notebooks y procesos ad-hoc sin un registro unificado.

    Articulo 30: Documentacion Tecnica

    El Articulo 30 trata sobre la salida — la documentacion que debes producir y mantener para cada sistema de IA de alto riesgo.

    Que Requiere

    La documentacion tecnica debe incluir:

    • Descripcion general del sistema de IA, su proposito previsto y el proveedor
    • Descripcion detallada de los elementos del sistema incluyendo algoritmos, datos, procesos de entrenamiento y decisiones de diseno
    • Informacion sobre los datos de entrenamiento: fuentes de datos, alcance, caracteristicas principales, metodologia de recopilacion, procedimientos de etiquetado y metodos de limpieza/preparacion de datos
    • Procedimientos de validacion y prueba: metricas, resultados de pruebas y benchmarks de rendimiento
    • Medidas de gestion de riesgos: riesgos identificados y pasos de mitigacion
    • Planes de monitoreo y actualizacion: enfoque de monitoreo post-despliegue

    Quien es Responsable

    Igual que el Articulo 10 — el proveedor. Pero la documentacion del Articulo 30 tambien debe estar disponible para las autoridades de vigilancia del mercado bajo solicitud. Esto significa que la documentacion debe estar organizada, completa y accesible — no enterrada en una wiki de equipo o dispersa entre commits de Git.

    El Desafio Practico

    El Articulo 30 requiere que produzcas un documento coherente (o conjunto de documentos) que describa todo tu sistema de IA, incluyendo el linaje de sus datos de entrenamiento. Si tu pipeline de datos es una cadena de herramientas desconectadas, ensamblar esta documentacion retroactivamente es costoso y propenso a errores.

    Como Interactuan

    Piensa en el Articulo 10 como los requisitos de proceso y el Articulo 30 como los requisitos de reporte. Son complementarios:

    AspectoArticulo 10Articulo 30
    EnfoqueComo preparas los datosQue documentas al respecto
    AlcancePracticas de gobernanza de datosDocumentacion tecnica completa del sistema
    MomentoDurante el desarrolloMantenida durante todo el ciclo de vida
    AudienciaEquipos internosReguladores y autoridades
    Producto clavePipeline de datos gobernadoPaquete de documentacion tecnica

    El Articulo 10 te dice que debe hacer tu pipeline de datos. El Articulo 30 te dice que debes poder demostrar que lo hizo.

    La Brecha que Tienen la Mayoria de las Empresas

    El pipeline tipico de IA empresarial tiene una version del cumplimiento del Articulo 10 — los equipos limpian datos, examinan sesgos y validan calidad. Lo que falta es la conexion con el Articulo 30: la documentacion que demuestra que estos pasos ocurrieron, con que datos, por quien y con que resultados.

    Esta brecha existe porque la mayoria de los pipelines de datos se construyen con herramientas desconectadas:

    1. Ingestion ocurre en una herramienta (Docling, Unstructured.io, parsers personalizados)
    2. Limpieza ocurre en scripts de Python o notebooks
    3. Etiquetado ocurre en Label Studio o Prodigy
    4. Scoring de calidad ocurre en Cleanlab o codigo personalizado
    5. Exportacion ocurre en otro script mas

    En cada frontera, la continuidad del rastro de auditoria se rompe. La herramienta de ingestion no sabe lo que hizo el script de limpieza. La herramienta de etiquetado no sabe que se filtro durante la limpieza. El scorer de calidad no conoce la procedencia original de los datos que esta evaluando.

    Como Luce un Pipeline Conforme

    Para satisfacer tanto el Articulo 10 como el Articulo 30 simultaneamente, un pipeline de datos necesita:

    1. Registro unificado: Cada operacion en cada etapa registrada en un unico registro de auditoria
    2. Atribucion de operador: Quien realizo o aprobo cada paso, con marcas de tiempo
    3. Linaje de datos: Capacidad de rastrear cualquier registro de salida hasta su fuente original a traves de cada transformacion
    4. Metricas de calidad: Captura automatizada de puntuaciones de calidad, tasas de error y evaluaciones de sesgo
    5. Capacidad de exportacion: Generacion con un clic de documentacion que satisfaga los requisitos de formato del Articulo 30

    Este es fundamentalmente un problema de arquitectura, no un complemento de cumplimiento. Las plataformas que manejan el pipeline completo en un unico sistema — como Ertas Data Suite — generan esta documentacion como subproducto de la operacion normal, porque cada etapa comparte la misma infraestructura de registro.

    Lo que tu Equipo de Datos Deberia Hacer Ahora

    1. Audita tu pipeline actual para brechas del Articulo 10: Esta documentado el examen de sesgo? Estan escritas las practicas de gobernanza de datos?
    2. Evalua tu preparacion para el Articulo 30: Podrias producir documentacion tecnica completa para tu sistema de IA hoy?
    3. Identifica rupturas de linaje: Donde falla la continuidad del rastro de auditoria en tu cadena de herramientas actual?
    4. Planifica para agosto de 2026: Construye cumplimiento en pipelines nuevos en lugar de adaptar retroactivamente los existentes

    La fecha limite de aplicacion se acerca. El costo de incorporar documentacion desde el inicio es una fraccion del costo de reconstruirla despues del hecho.

    Turn unstructured data into AI-ready datasets — without it leaving the building.

    On-premise data preparation with full audit trail. No data egress. No fragmented toolchains. EU AI Act Article 30 compliance built in.

    Keep reading