
ITARdefensecomplianceexport-controldata-pipelineAIon-premiseair-gapped
面向国防承包商的ITAR合规AI训练数据管道
一份以合规为核心的指南,介绍如何构建满足ITAR出口管制要求的AI训练数据管道。涵盖ITAR合规矩阵、受控技术数据的管道架构、审计要求以及面向国防承包商的本地部署方案。
EErtas Team·
国际武器贸易条例(ITAR)为国防承包商处理技术数据设定了严格的边界。当这些技术数据成为AI模型的训练数据时,管道中的每一步——从文档摄取到模型导出——都处于出口管制的审查之下。
大多数AI数据准备工具并非为此设计。它们假设具有云连接性、SaaS交付、跨国工程团队,以及可以在环境之间自由移动的数据。ITAR的假设恰恰相反:受控访问、仅限美国公民处理、禁止外国访问,以及从源文档到训练输出的可审计数据血统。
本手册介绍如何架构一个端到端满足ITAR要求的AI训练数据管道。
AI团队的ITAR基础知识
ITAR管控的内容
ITAR(22 CFR 第120-130部分)规范国防物品和国防服务的出口和临时进口。对于AI训练数据管道,相关管控包括:
- 技术数据(22 CFR 120.33):国防物品的设计、开发、生产、制造、组装、操作、维修、测试、维护或修改所需的信息。包括工程图纸、规格说明、测试程序和操作手册。
- 国防服务(22 CFR 120.32):向外国人员提供国防物品的设计、开发、工程、制造、生产、组装、测试、维修、维护、修改、操作、拆除、销毁、加工或使用方面的协助(包括培训)。
对AI的关键影响: 如果您的训练数据包含ITAR管控的技术数据,并且您的AI模型基于这些数据训练,那么模型本身可能被视为国防物品或包含受控技术数据。训练管道、每个中间阶段的数据以及模型输出都可能受ITAR约束。
谁可以访问ITAR数据
只有美国公民(美国公民、合法永久居民或8 U.S.C. 1324b(a)(3)定义的受保护个人)才能在没有出口许可证的情况下访问ITAR管控的技术数据。这适用于:
- 操作数据管道的人员
- 维护处理环境的系统管理员
- 理论上可以访问存储数据的云服务提供商员工(这就是云处理存在问题的原因)
- 可能远程访问系统的软件供应商支持人员
ITAR合规要求矩阵
以下矩阵将ITAR要求映射到具体的数据管道控制措施。
| ITAR要求 | 法规 | 管道控制 | 验证方法 |
|---|---|---|---|
| 仅限美国公民访问 | 22 CFR 120.16, 120.32 | 操作系统级访问控制;无远程访问;无云处理 | 带有公民身份验证的人员名册;访问日志 |
| 禁止外国人访问技术数据 | 22 CFR 120.17 | 气隙隔离或独立网络;无SaaS工具;无外国托管服务 | 网络隔离验证;软件清单审计 |
| 数据标记和追踪 | 22 CFR 125.4 | 管道中保留ITAR标记;所有输出上的分类元数据 | 输出检查;出口审查中的标记验证 |
| 派生数据的出口管控 | 22 CFR 120.33, 125.1 | 训练数据、中间产物和模型输出归类为ITAR管控 | 数据清单;存储位置审计 |
| 记录保存 | 22 CFR 122.5 | 所有数据处理的完整审计跟踪;5年记录保留 | 审计日志审查;保留政策文档 |
| 注册和许可 | 22 CFR 122.1 | 承包商已在DDTC注册;国内处理不需要出口许可证 | 注册确认;法律审查 |
ITAR管控技术数据的管道架构
基础设施要求
处理环境必须同时满足ITAR访问控制和实际的数据工程需求。
| 组件 | 要求 | 理由 |
|---|---|---|
| 处理工作站 | 本地部署,位于美国境内,在受控设施内 | ITAR数据不得离开美国领土或被非美国公民访问 |
| 网络连接 | 气隙隔离或无互联网访问的独立VLAN | 消除通过云服务或遥测的意外出口风险 |
| 软件 | 无云依赖的本地应用程序 | SaaS工具通过可能被非美国公民访问的服务器路由数据 |
| 存储 | 静态加密,受控访问,位于美国境内 | 静态技术数据必须防止未授权访问 |
| 备份 | 加密,存储在同一受控设施内 | 备份介质受与主存储相同的ITAR管控 |
| 可移动介质 | 登记、追踪,不使用时存放在批准的容器中 | 包含ITAR数据的介质是受控物品 |
数据管道阶段
[带有ITAR标记的源文档]
|
授权导入(登记介质,监管链)
|
文件导入 + 文档解析
|
ITAR标记保留(元数据标记)
|
清洗(去重、标准化)
|
受控数据编辑(如果创建非受控衍生品)
|
质量评分 + 验证
|
训练/验证/测试拆分
|
导出(JSONL、CSV——标记为ITAR管控)
|
授权导出(登记介质,监管链)
Ertas中的每个阶段映射到可视化管道画布上的特定节点。可视化管道对于ITAR合规的关键优势在于,审计人员和出口管制官员可以按顺序查看应用于数据的每项转换,而无需阅读代码。