Back to blog
    法律客户AI代理机构技术栈:n8n + 微调模型 + 本地部署
    代理机构技术栈法律n8n架构segment:agency

    法律客户AI代理机构技术栈:n8n + 微调模型 + 本地部署

    服务律所的AI代理机构的完整架构——从n8n编排到微调模型推理到面向客户的交付。组件选择、部署拓扑和扩展考虑。

    EErtas Team·

    为律所构建AI解决方案需要满足法律合规要求同时对小型代理机构团队可管理的特定技术栈。

    完整架构

    ┌─────────────────────────────────────────────────────────┐
    │                    客户网络                               │
    │                                                          │
    │  ┌──────────┐    ┌──────────┐    ┌───────────────────┐  │
    │  │   DMS    │───→│   n8n    │───→│  LLM推理          │  │
    │  │(iManage) │    │(自托管)   │    │  (Ollama/vLLM)    │  │
    │  └──────────┘    │          │    │  + LoRA适配器       │  │
    │                  └────┬─────┘    └───────────────────┘  │
    │                       │                                  │
    │                  ┌────▼─────┐    ┌───────────────────┐  │
    │                  │ 向量数据库│    │  客户门户          │  │
    │                  │(Chroma/  │    │  (结果UI)          │  │
    │                  │ Qdrant)  │    └───────────────────┘  │
    │                  └──────────┘                            │
    └─────────────────────────────────────────────────────────┘
    

    每个组件在律所网络内运行。没有数据离开边界。

    组件选择

    n8n: 自托管、可视化工作流构建器、OpenAI兼容节点直接连接本地LLM端点。

    Ollama/vLLM: 简单部署用Ollama,生产部署用vLLM(更高吞吐量)。

    基础模型 + LoRA适配器: 一个基础模型加载在GPU内存中,每客户LoRA适配器在推理时动态加载。单GPU服务所有法律客户。

    向量数据库: Chroma用于轻量部署,Qdrant用于生产。

    数据流示例:合同审查

    1. 律师上传合同
    2. n8n webhook触发
    3. n8n提取文本,分块
    4. 每个段落查询向量数据库获取类似条款
    5. 发送到本地LLM(带律所特定LoRA适配器)
    6. LLM返回风险分析
    7. n8n汇总为结构化审查报告
    8. 交付到客户门户

    30页合同总处理时间:2-5分钟。


    Ship AI that runs on your users' devices.

    Ertas early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    延伸阅读

    Ship AI that runs on your users' devices.

    Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    Keep reading