
Articulo 10 vs. Articulo 30 del EU AI Act: Lo Que Tu Equipo de Datos Necesita Saber
Una comparacion detallada de los Articulos 10 y 30 del EU AI Act — las dos disposiciones mas criticas para la gobernanza de datos de entrenamiento de IA, documentacion y cumplimiento.
Si tu organizacion construye o despliega sistemas de IA de alto riesgo en la UE, dos articulos del EU AI Act daran forma directamente a como opera tu equipo de datos: el Articulo 10 (Datos y Gobernanza de Datos) y el Articulo 30 (Documentacion Tecnica). Estan relacionados pero son distintos, y confundirlos genera brechas de cumplimiento.
Este articulo desglosa lo que requiere cada articulo, quien es responsable y como interactuan en la practica.
Articulo 10: Datos y Gobernanza de Datos
El Articulo 10 trata sobre el proceso de preparar datos de entrenamiento. Establece requisitos para como deben gestionarse los datasets de entrenamiento, validacion y prueba de los sistemas de IA de alto riesgo.
Que Requiere
Practicas de gobernanza de datos que cubran:
- Decisiones de diseno para la recopilacion y origen de datos
- Operaciones de preparacion de datos (limpieza, etiquetado, agregacion)
- Evaluaciones de relevancia y representatividad
- Examen de posibles sesgos
- Identificacion de brechas o deficiencias en los datos
Criterios de calidad de datos incluyendo:
- Los datos de entrenamiento deben ser relevantes, suficientemente representativos y lo mas libres de errores posible
- Los datasets deben ser apropiados para el proposito previsto del sistema de IA
- Las propiedades estadisticas deben entenderse y documentarse
Examen de sesgo:
- Los datasets deben examinarse en busca de sesgos que podrian llevar a resultados discriminatorios
- Donde se identifique sesgo, deben tomarse medidas apropiadas para abordarlo
- El proceso de examen en si debe documentarse
Quien es Responsable
Las obligaciones del Articulo 10 recaen en el proveedor del sistema de IA de alto riesgo — la entidad que desarrolla o encarga el sistema de IA y lo coloca en el mercado. En la practica, esto significa el equipo de datos, los ingenieros de ML y su cadena de gestion.
El Desafio Practico
El Articulo 10 exige que tu proceso de preparacion de datos sea documentado y auditable. Aqui es donde la mayoria de las empresas tienen dificultades — no porque no limpien datos o verifiquen sesgos, sino porque estos pasos ocurren en scripts dispersos, notebooks y procesos ad-hoc sin un registro unificado.
Articulo 30: Documentacion Tecnica
El Articulo 30 trata sobre la salida — la documentacion que debes producir y mantener para cada sistema de IA de alto riesgo.
Que Requiere
La documentacion tecnica debe incluir:
- Descripcion general del sistema de IA, su proposito previsto y el proveedor
- Descripcion detallada de los elementos del sistema incluyendo algoritmos, datos, procesos de entrenamiento y decisiones de diseno
- Informacion sobre los datos de entrenamiento: fuentes de datos, alcance, caracteristicas principales, metodologia de recopilacion, procedimientos de etiquetado y metodos de limpieza/preparacion de datos
- Procedimientos de validacion y prueba: metricas, resultados de pruebas y benchmarks de rendimiento
- Medidas de gestion de riesgos: riesgos identificados y pasos de mitigacion
- Planes de monitoreo y actualizacion: enfoque de monitoreo post-despliegue
Quien es Responsable
Igual que el Articulo 10 — el proveedor. Pero la documentacion del Articulo 30 tambien debe estar disponible para las autoridades de vigilancia del mercado bajo solicitud. Esto significa que la documentacion debe estar organizada, completa y accesible — no enterrada en una wiki de equipo o dispersa entre commits de Git.
El Desafio Practico
El Articulo 30 requiere que produzcas un documento coherente (o conjunto de documentos) que describa todo tu sistema de IA, incluyendo el linaje de sus datos de entrenamiento. Si tu pipeline de datos es una cadena de herramientas desconectadas, ensamblar esta documentacion retroactivamente es costoso y propenso a errores.
Como Interactuan
Piensa en el Articulo 10 como los requisitos de proceso y el Articulo 30 como los requisitos de reporte. Son complementarios:
| Aspecto | Articulo 10 | Articulo 30 |
|---|---|---|
| Enfoque | Como preparas los datos | Que documentas al respecto |
| Alcance | Practicas de gobernanza de datos | Documentacion tecnica completa del sistema |
| Momento | Durante el desarrollo | Mantenida durante todo el ciclo de vida |
| Audiencia | Equipos internos | Reguladores y autoridades |
| Producto clave | Pipeline de datos gobernado | Paquete de documentacion tecnica |
El Articulo 10 te dice que debe hacer tu pipeline de datos. El Articulo 30 te dice que debes poder demostrar que lo hizo.
La Brecha que Tienen la Mayoria de las Empresas
El pipeline tipico de IA empresarial tiene una version del cumplimiento del Articulo 10 — los equipos limpian datos, examinan sesgos y validan calidad. Lo que falta es la conexion con el Articulo 30: la documentacion que demuestra que estos pasos ocurrieron, con que datos, por quien y con que resultados.
Esta brecha existe porque la mayoria de los pipelines de datos se construyen con herramientas desconectadas:
- Ingestion ocurre en una herramienta (Docling, Unstructured.io, parsers personalizados)
- Limpieza ocurre en scripts de Python o notebooks
- Etiquetado ocurre en Label Studio o Prodigy
- Scoring de calidad ocurre en Cleanlab o codigo personalizado
- Exportacion ocurre en otro script mas
En cada frontera, la continuidad del rastro de auditoria se rompe. La herramienta de ingestion no sabe lo que hizo el script de limpieza. La herramienta de etiquetado no sabe que se filtro durante la limpieza. El scorer de calidad no conoce la procedencia original de los datos que esta evaluando.
Como Luce un Pipeline Conforme
Para satisfacer tanto el Articulo 10 como el Articulo 30 simultaneamente, un pipeline de datos necesita:
- Registro unificado: Cada operacion en cada etapa registrada en un unico registro de auditoria
- Atribucion de operador: Quien realizo o aprobo cada paso, con marcas de tiempo
- Linaje de datos: Capacidad de rastrear cualquier registro de salida hasta su fuente original a traves de cada transformacion
- Metricas de calidad: Captura automatizada de puntuaciones de calidad, tasas de error y evaluaciones de sesgo
- Capacidad de exportacion: Generacion con un clic de documentacion que satisfaga los requisitos de formato del Articulo 30
Este es fundamentalmente un problema de arquitectura, no un complemento de cumplimiento. Las plataformas que manejan el pipeline completo en un unico sistema — como Ertas Data Suite — generan esta documentacion como subproducto de la operacion normal, porque cada etapa comparte la misma infraestructura de registro.
Lo que tu Equipo de Datos Deberia Hacer Ahora
- Audita tu pipeline actual para brechas del Articulo 10: Esta documentado el examen de sesgo? Estan escritas las practicas de gobernanza de datos?
- Evalua tu preparacion para el Articulo 30: Podrias producir documentacion tecnica completa para tu sistema de IA hoy?
- Identifica rupturas de linaje: Donde falla la continuidad del rastro de auditoria en tu cadena de herramientas actual?
- Planifica para agosto de 2026: Construye cumplimiento en pipelines nuevos en lugar de adaptar retroactivamente los existentes
La fecha limite de aplicacion se acerca. El costo de incorporar documentacion desde el inicio es una fraccion del costo de reconstruirla despues del hecho.
Turn unstructured data into AI-ready datasets — without it leaving the building.
On-premise data preparation with full audit trail. No data egress. No fragmented toolchains. EU AI Act Article 30 compliance built in.
Keep reading

EU AI Act Training Data Compliance: The Complete Guide (2026)
Everything enterprises need to know about EU AI Act training data requirements — data quality, bias testing, documentation mandates, and the August 2026 deadline.

EU AI Act Compliance Timeline: What's Due by August 2026
A clear timeline of EU AI Act enforcement dates, what's already in effect, what's coming in August 2026, and what enterprises need to have in place for training data compliance.

Data Lineage Is Now a Legal Requirement — Are You Ready?
The EU AI Act makes data lineage mandatory for high-risk AI systems. Most enterprise pipelines have lineage gaps at every tool boundary. Here's what needs to change.