Back to blog
    n8n + 本地 LLM:构建符合 HIPAA 的自动化工作流
    n8nlocal-llmhipaahealthcareautomationsegment:agency

    n8n + 本地 LLM:构建符合 HIPAA 的自动化工作流

    如何使用自托管 n8n 和本地 LLM 推理构建符合 HIPAA 的自动化工作流——包含临床记录摘要和预约分诊的实际示例。

    EErtas Team·

    n8n 已成为需要自托管基础设施的代理机构首选的工作流自动化平台。当与本地运行的 LLM 结合时,它创建了一个完全自包含的自动化技术栈,数据不会离开组织的网络——这正是医疗客户所要求的。

    本指南详细介绍架构、具体集成模式,以及完整技术栈的 HIPAA 合规检查清单。

    架构

    核心架构很简单:

    [EHR / 临床系统] → [n8n(自托管)] → [本地 LLM(Ollama/vLLM)] → [输出目标]
    

    每个组件都运行在医疗机构控制的基础设施上。n8n 编排工作流。本地 LLM 处理自然语言处理。AI 推理不需要外部 API 调用。

    组件技术栈

    组件角色部署方式
    n8n工作流编排组织服务器上的 Docker 容器
    Ollama 或 vLLMLLM 推理服务器同一服务器或专用 GPU 机器
    PostgreSQLn8n 工作流数据 + 执行日志本地数据库
    Redis(可选)高负载工作流的队列管理本地实例
    反向代理TLS 终止、访问控制同一网络上的 Nginx/Caddy

    硬件要求

    对于服务 20-50 个并发工作流执行的典型医疗部署:

    • CPU: 8 核以上(用于 n8n 和支持服务)
    • RAM: 最低 32 GB(16 GB 用于 n8n/服务,16 GB 用于模型加载)
    • GPU: RTX 5090(32 GB VRAM)或 RTX 4090(24 GB VRAM)
    • 存储: 500 GB SSD(模型、日志、工作流数据)

    总硬件成本:$4,000-6,000 用于完整服务器构建。与云 n8n + 云 AI API 的月费相比,回收期通常为 2-4 个月。

    将 n8n 连接到本地 LLM 端点

    n8n 通过 HTTP 请求节点或 OpenAI 兼容节点连接本地 LLM。Ollama 和 vLLM 都暴露 OpenAI 兼容的 API 端点,这使得集成非常简单。

    使用 Ollama

    Ollama 默认运行在 localhost:11434。在 n8n 中:

    1. 添加 HTTP 请求 节点
    2. 将 URL 设为 http://localhost:11434/api/chat
    3. 方法:POST
    4. 请求体(JSON):
    {
      "model": "your-fine-tuned-model",
      "messages": [
        {"role": "system", "content": "You are a clinical note summariser..."},
        {"role": "user", "content": "{{$json.clinical_note}}"}
      ],
      "stream": false
    }

    或者,使用 Ollama 的 OpenAI 兼容端点 http://localhost:11434/v1/chat/completions,配合 n8n 内置的 OpenAI 节点——只需在凭据配置中更改基础 URL。

    使用 vLLM

    vLLM 为并发请求提供更高的吞吐量。它默认暴露 OpenAI 兼容的 API:

    python -m vllm.entrypoints.openai.api_server \
      --model /path/to/your/model \
      --host 0.0.0.0 --port 8000

    在 n8n 中,配置 OpenAI 凭据,基础 URL 为 http://your-gpu-server:8000/v1,API 密钥可以是任意字符串(vLLM 默认不需要认证——通过反向代理添加)。

    示例工作流 1:临床记录摘要

    用例: 医生口述冗长的临床记录。工作流将其摘要为结构化的出院摘要。

    工作流步骤:

    1. 触发器: Webhook 从 EHR 系统接收临床记录(或 n8n 轮询共享文件夹)
    2. 预处理: 提取患者标识符,将元数据与记录正文分离
    3. LLM 推理: 将记录正文发送到本地 LLM,使用指定输出格式的系统提示(SOAP 记录结构)
    4. 后处理: 解析 LLM 输出,验证必填字段是否存在
    5. 质量检查: 如果置信度指标低于阈值,标记进行人工审核
    6. 输出: 通过 API 将结构化摘要写回 EHR,或存入审核队列

    n8n 节点链: Webhook → Function(预处理) → HTTP Request(LLM) → Function(验证) → IF(质量检查) → [EHR API / 审核队列]

    整个工作流根据记录长度在 3-8 秒内执行完毕。使用微调模型,摘要质量与医生花 15 分钟完成相同任务的质量相当。

    示例工作流 2:预约分诊

    用例: 患者请求预约的消息按紧急程度分类并路由到相应科室。

    工作流步骤:

    1. 触发器: n8n 从诊所管理系统轮询患者消息队列
    2. LLM 推理: 将患者消息发送到本地 LLM,使用分类提示(紧急/常规/非临床、科室分配)
    3. 解析响应: 提取分类结果和置信度评分
    4. 路由: 基于分类,在相应科室队列中创建预约请求
    5. 通知: 通过安全消息向患者发送确认

    微调的关键优势: 通用模型会出现分诊错误,因为它不了解特定诊所的科室结构、医生专业和分诊协议。使用该特定诊所 2,000-3,000 条历史分诊决策微调的模型可达到 95% 以上的准确率。

    示例工作流 3:先前授权文件组装

    用例: 通过提取相关临床信息并匹配保险公司要求来组装先前授权包。

    工作流步骤:

    1. 触发器: 在诊所管理系统中发起先前授权请求
    2. 收集数据: n8n 查询 EHR 获取相关临床记录、实验室结果、影像报告
    3. LLM 提取: 本地 LLM 提取与保险公司标准匹配的临床相关信息
    4. 文件组装: 用提取的数据填充先前授权模板
    5. 审核队列: 向工作人员展示组装好的包进行最终审核和提交

    此工作流将先前授权准备时间从 30-45 分钟减少到 5-10 分钟的审核时间。

    技术栈的 HIPAA 合规检查清单

    使用此检查清单验证你的 n8n + 本地 LLM 部署满足 HIPAA 要求:

    管理保障措施

    • 指定负责 AI 自动化系统的安全官
    • 关于 AI 系统使用和 PHI 处理的员工培训
    • 访问授权策略——谁可以创建/修改处理 PHI 的工作流
    • 针对 AI 工作流故障或意外输出的事件响应程序
    • 包含 AI 自动化组件的定期风险评估

    物理保障措施

    • 服务器硬件在物理安全位置(上锁的服务器室、数据中心)
    • 服务器物理访问的访问日志
    • 环境控制(电源、冷却、消防)

    技术保障措施

    • n8n 访问的唯一用户认证
    • n8n 中的基于角色的访问控制(管理员 vs 查看者 vs 编辑者)
    • 所有网络通信的 TLS 加密(n8n 与 LLM 之间、n8n 与 EHR 之间)
    • n8n 中启用审计日志(记录所有工作流执行)
    • LLM 推理日志的捕获和按策略保留
    • n8n 网页界面的自动会话超时
    • 存储工作流执行数据的数据库静态加密
    • 网络分段——AI 服务器在隔离 VLAN 上
    • AI 服务器无出站互联网访问(或仅限软件包更新)

    运维保障措施

    • n8n 工作流、LLM 模型和配置的备份程序
    • 包含 AI 自动化组件的灾难恢复计划
    • 工作流修改的变更管理流程
    • 定期的备份恢复测试
    • 模型版本控制——跟踪哪个模型版本产生了哪些输出

    入门

    最快的部署路径:

    1. 在配有 GPU 的服务器上通过 Docker 设置 n8n(n8n 自托管文档
    2. 在同一服务器上安装 Ollama 并加载基础模型
    3. 使用 Ertas Studio 在任务特定数据上微调模型
    4. 构建一个简单的概念验证工作流(临床记录摘要是最简单的起点)
    5. 运行上述合规检查清单
    6. 在连接到生产系统之前,使用合成数据向医疗客户演示

    Ship AI that runs on your users' devices.

    Ertas early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    延伸阅读

    Ship AI that runs on your users' devices.

    Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    Keep reading