Articulo 10 vs. Articulo 30 del EU AI Act: Lo Que Tu Equipo de Datos Necesita Saber

Si tu organizacion construye o despliega sistemas de IA de alto riesgo en la UE, dos articulos del EU AI Act daran forma directamente a como opera tu equipo de datos: el Articulo 10 (Datos y Gobernanza de Datos) y el Articulo 30 (Documentacion Tecnica). Estan relacionados pero son distintos, y confundirlos genera brechas de cumplimiento.

Este articulo desglosa lo que requiere cada articulo, quien es responsable y como interactuan en la practica.

Articulo 10: Datos y Gobernanza de Datos

El Articulo 10 trata sobre el proceso de preparar datos de entrenamiento. Establece requisitos para como deben gestionarse los datasets de entrenamiento, validacion y prueba de los sistemas de IA de alto riesgo.

Que Requiere

Practicas de gobernanza de datos que cubran:

Decisiones de diseno para la recopilacion y origen de datos
Operaciones de preparacion de datos (limpieza, etiquetado, agregacion)
Evaluaciones de relevancia y representatividad
Examen de posibles sesgos
Identificacion de brechas o deficiencias en los datos

Criterios de calidad de datos incluyendo:

Los datos de entrenamiento deben ser relevantes, suficientemente representativos y lo mas libres de errores posible
Los datasets deben ser apropiados para el proposito previsto del sistema de IA
Las propiedades estadisticas deben entenderse y documentarse

Examen de sesgo:

Los datasets deben examinarse en busca de sesgos que podrian llevar a resultados discriminatorios
Donde se identifique sesgo, deben tomarse medidas apropiadas para abordarlo
El proceso de examen en si debe documentarse

Quien es Responsable

Las obligaciones del Articulo 10 recaen en el proveedor del sistema de IA de alto riesgo — la entidad que desarrolla o encarga el sistema de IA y lo coloca en el mercado. En la practica, esto significa el equipo de datos, los ingenieros de ML y su cadena de gestion.

El Desafio Practico

El Articulo 10 exige que tu proceso de preparacion de datos sea documentado y auditable. Aqui es donde la mayoria de las empresas tienen dificultades — no porque no limpien datos o verifiquen sesgos, sino porque estos pasos ocurren en scripts dispersos, notebooks y procesos ad-hoc sin un registro unificado.

Articulo 30: Documentacion Tecnica

El Articulo 30 trata sobre la salida — la documentacion que debes producir y mantener para cada sistema de IA de alto riesgo.

Que Requiere

La documentacion tecnica debe incluir:

Descripcion general del sistema de IA, su proposito previsto y el proveedor
Descripcion detallada de los elementos del sistema incluyendo algoritmos, datos, procesos de entrenamiento y decisiones de diseno
Informacion sobre los datos de entrenamiento: fuentes de datos, alcance, caracteristicas principales, metodologia de recopilacion, procedimientos de etiquetado y metodos de limpieza/preparacion de datos
Procedimientos de validacion y prueba: metricas, resultados de pruebas y benchmarks de rendimiento
Medidas de gestion de riesgos: riesgos identificados y pasos de mitigacion
Planes de monitoreo y actualizacion: enfoque de monitoreo post-despliegue

Quien es Responsable

Igual que el Articulo 10 — el proveedor. Pero la documentacion del Articulo 30 tambien debe estar disponible para las autoridades de vigilancia del mercado bajo solicitud. Esto significa que la documentacion debe estar organizada, completa y accesible — no enterrada en una wiki de equipo o dispersa entre commits de Git.

El Desafio Practico

El Articulo 30 requiere que produzcas un documento coherente (o conjunto de documentos) que describa todo tu sistema de IA, incluyendo el linaje de sus datos de entrenamiento. Si tu pipeline de datos es una cadena de herramientas desconectadas, ensamblar esta documentacion retroactivamente es costoso y propenso a errores.

Como Interactuan

Piensa en el Articulo 10 como los requisitos de proceso y el Articulo 30 como los requisitos de reporte. Son complementarios:

Aspecto	Articulo 10	Articulo 30
Enfoque	Como preparas los datos	Que documentas al respecto
Alcance	Practicas de gobernanza de datos	Documentacion tecnica completa del sistema
Momento	Durante el desarrollo	Mantenida durante todo el ciclo de vida
Audiencia	Equipos internos	Reguladores y autoridades
Producto clave	Pipeline de datos gobernado	Paquete de documentacion tecnica

El Articulo 10 te dice que debe hacer tu pipeline de datos. El Articulo 30 te dice que debes poder demostrar que lo hizo.

La Brecha que Tienen la Mayoria de las Empresas

El pipeline tipico de IA empresarial tiene una version del cumplimiento del Articulo 10 — los equipos limpian datos, examinan sesgos y validan calidad. Lo que falta es la conexion con el Articulo 30: la documentacion que demuestra que estos pasos ocurrieron, con que datos, por quien y con que resultados.

Esta brecha existe porque la mayoria de los pipelines de datos se construyen con herramientas desconectadas:

Ingestion ocurre en una herramienta (Docling, Unstructured.io, parsers personalizados)
Limpieza ocurre en scripts de Python o notebooks
Etiquetado ocurre en Label Studio o Prodigy
Scoring de calidad ocurre en Cleanlab o codigo personalizado
Exportacion ocurre en otro script mas

En cada frontera, la continuidad del rastro de auditoria se rompe. La herramienta de ingestion no sabe lo que hizo el script de limpieza. La herramienta de etiquetado no sabe que se filtro durante la limpieza. El scorer de calidad no conoce la procedencia original de los datos que esta evaluando.

Como Luce un Pipeline Conforme

Para satisfacer tanto el Articulo 10 como el Articulo 30 simultaneamente, un pipeline de datos necesita:

Registro unificado: Cada operacion en cada etapa registrada en un unico registro de auditoria
Atribucion de operador: Quien realizo o aprobo cada paso, con marcas de tiempo
Linaje de datos: Capacidad de rastrear cualquier registro de salida hasta su fuente original a traves de cada transformacion
Metricas de calidad: Captura automatizada de puntuaciones de calidad, tasas de error y evaluaciones de sesgo
Capacidad de exportacion: Generacion con un clic de documentacion que satisfaga los requisitos de formato del Articulo 30

Este es fundamentalmente un problema de arquitectura, no un complemento de cumplimiento. Las plataformas que manejan el pipeline completo en un unico sistema — como Ertas Data Suite — generan esta documentacion como subproducto de la operacion normal, porque cada etapa comparte la misma infraestructura de registro.

Lo que tu Equipo de Datos Deberia Hacer Ahora

Audita tu pipeline actual para brechas del Articulo 10: Esta documentado el examen de sesgo? Estan escritas las practicas de gobernanza de datos?
Evalua tu preparacion para el Articulo 30: Podrias producir documentacion tecnica completa para tu sistema de IA hoy?
Identifica rupturas de linaje: Donde falla la continuidad del rastro de auditoria en tu cadena de herramientas actual?
Planifica para agosto de 2026: Construye cumplimiento en pipelines nuevos en lugar de adaptar retroactivamente los existentes

La fecha limite de aplicacion se acerca. El costo de incorporar documentacion desde el inicio es una fraccion del costo de reconstruirla despues del hecho.

Articulo 10 vs. Articulo 30 del EU AI Act: Lo Que Tu Equipo de Datos Necesita Saber

Articulo 10: Datos y Gobernanza de Datos

Que Requiere

Quien es Responsable

El Desafio Practico

Articulo 30: Documentacion Tecnica

Que Requiere

Quien es Responsable

El Desafio Practico

Como Interactuan

La Brecha que Tienen la Mayoria de las Empresas

Como Luce un Pipeline Conforme

Lo que tu Equipo de Datos Deberia Hacer Ahora

Turn unstructured data into AI-ready datasets — without it leaving the building.

Keep reading

Checklist de Preparación para IA en Industrias Reguladas (2026)

La Trazabilidad de Datos Ahora Es un Requisito Legal — ¿Estás Preparado?

Cronograma de Cumplimiento del EU AI Act: Que Vence en Agosto 2026