Ertas + OpenClaw 助力 AI 代理商
为客户部署 OpenClaw 的 AI 代理商面临着与每个依赖 API 工具相同的利润侵蚀问题:随客户规模增长的按 token 成本。Ertas 使代理商能够在本地运行按客户微调的模型,完全消除 API 成本,同时比通用云模型提供更好的领域特定结果。
The Challenge
OpenClaw 是目前最强大的 AI 代理框架——通过客户已在使用的消息平台实现自主任务执行、浏览器自动化、文件管理、邮件分拣和基于 cron 的监控。对于 AI 代理商来说,它是从简单聊天机器人部署到全方位 AI 助手的自 然演进。
但使用云 API 时经济模型在规模上行不通。每个客户的 OpenClaw 实例将每次交互都路由通过 GPT-4o 或 Claude——在每次分拣的邮件、每份生成的报告、每条发送的消息上产生按 token 费用。一个活跃客户每月可能花费 150-300 澳元的 API 转发费。在 10-20 个客户中,代理商面临 2,000-4,000 澳元/月的可变成本,直接侵蚀固定服务费利润。
更糟糕的是成本不可预测。客户的营销活动走红,支持量翻三倍?API 账单也翻三倍——但服务费不变。OpenClaw 的 cron 任务每 30 分钟扫描一次收件箱?这是 24/7 持续的 token 吞吐量,即使没有可操作的事项也在消耗额度。
差异化问题同样紧迫。如果每家代理商都用相同的 GPT-4o 后端部署 OpenClaw,客户实际上得到的是相同的 AI——只是包装了不同的品牌。没有护城河。技术上有能力的客户可以自己复制这个设置。
The Solution
Ertas 将代理商的 OpenClaw 部署从 API 转发转变为专有 AI 基础设施。模式是:在 Ertas Studio 中为每个客户的领域数据微调一个 LoRA 适配器,将所有适配器部署在通过 Ollama 本地运行的共享基础模型上,并将每个客户的 OpenClaw 实例指向本地端点。
经济模型立即翻转。不再是每个客户每月 150-300 澳元的 API 成本,一次性硬件投资后推理免费。一台 Mac Studio 或 RTX 4090 服务器可以轻松处理 15-20 个并发客户适配器。硬件在 4-6 周内收回成本。之后每增加一个客户都是纯利润。
质量提升才是真 正的卖点。为房地产客户微调的模型已经学会了该客户的房源列表、定价术语和买家沟通风格。为牙科诊所微调的模型了解诊所的预约类型、保险面板和患者沟通语调。通用 GPT-4o 从系统提示近似;微调模型从训练数据内化。代理商可以向客户展示可衡量的准确度改进——这证明了溢价定价的合理性,并创造了通用 API 访问永远无法提供的转换成本。
Key Features
按客户微调
Studio 使代理商能够从共享基础模型为每个客户微调 LoRA 适配器。上传客户的对话日志、产品目录或领域数据,配置训练运行,生成捕捉该客户特定需求的适配器——无需管理 GPU 基础设施。
多租户代理服务
Cloud 支持部署单个基础模型,在推理时动态加载按客户分配的 LoRA 适配器。每个客户的 OpenClaw 实例自动路由到正确的适配器。从 5 个客户扩展到 50 个客户无需成比例增加基础设施。
客户数据隔离
Vault 在客户之间强制执行严格的数据边界。每个客户的训练数据、适配器权重和推理日志分别加密和访问控制。客户环境之间无交叉污染——满足企业客户要求的数据主权需求。
代理商模型市场
Hub 提供针对常见代理商垂直领域优化的基础模型——客户支持、邮件分拣、报告生成、日程安排。代理商可以在微调前根据客户需求对模型进行基准测试,缩短新客户入职的部署时间。
Example Workflow
一家位于悉尼的 AI 自动化代理商为房地产、酒店和专业服务领域的 12 个小企业客户管理 OpenClaw 部署。每个客户有一个 OpenClaw 代理通过 WhatsApp 和邮件处理邮件分拣、预约安排和客户咨询回复。使用云 API,代理商月度 API 支出为 2,800 澳元——其中三个大流量客户(一家房地产代理、一家精品酒店和一家会计事务所)占 1,500 澳元。代理商迁移到 Ertas。对于每个客户,他们导出 3-6 个月的对话历史,格式化为 JSONL 训练数据,并在 Ertas Studio 中微调 LoRA 适配器。每个客户的训练耗时 30-60 分钟。所有 12 个适配器部署在一台 Mac Studio M2 Ultra(5,500 澳元)上运行 Ollama,根据哪个客户的 OpenClaw 实例发出请求进行适配器热切换。迁移 后,代理商月度 AI 推理成本从 2,800 澳元降至 14.50 澳元(Ertas 订阅)加上电费。硬件在不到 8 周内收回成本。更重要的是,客户满意度提高:房地产客户的咨询分类准确率从 76%(GPT-4o)跃升至 93%(微调模型),酒店的预订确认回复匹配其品牌声音到客人无法将其与人工员工区分。代理商现在将微调模型作为高端差异化卖点——证明了比部署通用 API 代理的竞争对手高 30% 服务费的合理性。
Compliance & Security
本地部署意味着没有客户数据传输给第三方 AI 提供商。按客户分配的 LoRA 适配器配合 Vault 的加密和访问控制提供了企业和受监管行业客户所需的数据隔离。代理商可以提供书面保证,保证客户数据仅在受控基础设施上处理——这在 RFP 回复和企业采购流程中是一项竞争优势。
Related Resources
Adapter
Fine-Tuning
GGUF
Inference
LoRA
Multi-Tenant Inference
OpenClaw for Agencies: Per-Client AI Agents Without the API Bill
How to Power OpenClaw with Fine-Tuned Local Models (No API Costs)
OpenClaw + Fine-Tuned Models vs. OpenClaw + GPT-4: A Practical Comparison
How to Cut Your AI Agency Costs by 90% with Fine-Tuned Local Models
Multi-Tenant AI Deployment: One Base Model, Dozens of Client Adapters
White-Label AI: Build Custom Models for Every Client
Make.com
n8n
Ollama
OpenClaw
Ertas for Customer Support
Ertas for AI Automation Agencies
Ship AI that runs on your users' devices.
Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.