符合 HIPAA 要求的医疗 AI 训练与数据准备

    Ertas 为医疗卫生机构提供安全的本地数据准备流水线和可视化微调平台——让您无需将受保护的健康信息暴露给第三方服务,即可构建临床 AI 模型。

    The Challenges You Face

    受保护的健康信息不能离开您的网络

    HIPAA、HITECH 和机构审查委员会的要求使得使用处理受保护健康信息的云端 AI 服务几乎不可能。大多数 AI 平台要求将数据上传到外部服务器,造成了完全阻碍采用的合规障碍。

    临床数据杂乱且缺乏结构

    电子健康档案、临床笔记、实验室报告和影像元数据以数十种格式到达,存在不一致的术语、缩写和缺失字段。为 AI 训练准备这些数据需要通用 ETL 工具无法处理的专业清洗和规范化。

    审计追踪是不可妥协的要求

    监管审计要求每个数据转换、访问事件和模型决策都可追溯。大多数 ML 工作流涉及临时脚本和 Jupyter 笔记本,不会产生任何审计追踪,造成在检查中暴露的合规漏洞。

    领域专业知识掌握在临床医生手中,而非工程师

    了解临床工作流、医学术语和患者背景的人是临床医生——而非 ML 工程师。构建有效的医疗 AI 需要能让领域专家直接参与数据标注和模型评估的工具。

    How Ertas Solves This

    Ertas Data Suite 作为原生桌面应用完全在本地运行。受保护的健康信息永远不会离开您的网络。五模块流水线——导入、清洗、标注、增强、导出——通过确定性、可审计的转换处理临床数据,满足最严格的合规要求。

    Data Suite 中的每项操作都记录在仅追加的审计日志中,捕获谁在何时对哪些数据做了什么。此日志与您现有的合规文档集成,可随时导出供监管审查。

    Ertas Studio 通过为临床 AI 模型提供可视化微调来补充本地数据流水线。一旦 Data Suite 准备并脱敏了训练数据集,Studio 的云端训练基础设施会处理 GPU 密集型工作。导出的模型为 GGUF 文件,运行在您自己的基础设施上——因此推理与数据准备一样,都在您的安全边界之内。

    Key Features for 医疗卫生机构

    Data Suite

    气隙数据处理

    Data Suite 无需任何网络连接即可运行。将其安装在安全工作站上,在本地处理受保护的健康信息,并导出干净的数据集,无需任何数据接触互联网。非常适合有严格网络隔离策略的环境。

    Vault

    合规就绪的审计追踪

    每项数据转换、标注分配和导出操作都以时间戳、用户标识和前后快照进行记录。以与常见医疗合规框架兼容的格式导出审计日志。

    Data Suite

    临床医生友好的标注界面

    标注模块以上下文方式呈现数据,配有为临床工作流设计的注释工具。临床医生可以标记实体、分类文档并验证 AI 建议的标签,而无需学习开发者工具。

    Data Suite

    脱敏流水线

    清洗模块内置的 PII 和 PHI 检测功能可在数据导出用于训练之前识别并脱敏患者标识符、日期和位置信息——即使在本地工作流中也增加了一层保护。

    Why It Works

    • Data Suite 的气隙架构无需任何额外基础设施修改即可满足 HIPAA 安全规则的技术保障要求。
    • 仅追加的审计追踪提供了 HITRUST CSF 认证所需的文档,并支持 OIG 审计准备。
    • 医疗卫生机构已使用 Data Suite 从非结构化电子病历笔记中准备临床 NLP 训练数据集,且没有任何受保护的健康信息离开医院网络。
    • 临床医生参与标注的方式已被证明可将临床 NLP 模型准确率提高 15-25%,优于非临床标注人员生成的标签。
    • 在医院自有服务器上部署 GGUF 模型确保推理期间使用的患者数据完全在机构控制之下。

    Example Workflow

    一家医院的信息科团队希望构建一个从非结构化临床笔记中提取药物清单的模型。数据工程师在医院网络内的安全工作站上打开 Ertas Data Suite,通过导入模块导入 10,000 份脱敏临床笔记,然后运行清洗模块规范化格式并删除样板标头。

    一组临床医生使用标注模块在 500 份代表性笔记样本中标注药物提及、剂量和频率。增强模块通过受控改写生成额外的训练样本。导出模块生成带有完整审计元数据的版本化 JSONL 数据集。

    信息科团队将脱敏的训练集上传到 Ertas Studio,微调一个 130 亿参数的模型,并导出 GGUF。该模型部署在医院的 GPU 服务器上,完全在本地运行,并开始以经临床医生验证的准确率从新笔记中提取药物数据。

    Ship AI that runs on your users' devices.

    Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.