OpenClaw + Ertas
将 OpenClaw 的默认云 API 后端替换为通过 Ollama 部署的微调模型,实现零成本推理、更好的领域特定准确性和完整的数据隐私。
Overview
OpenClaw 是一个开源的自主 AI 智能体,可连接到消息平台(WhatsApp、Telegram、Slack、Discord、Teams),并能通过大语言模型执行任务——从邮件分类和文件管理到浏览器自动化和 Shell 命令。凭借超过 180,000 个 GitHub 星标,它已成为最受欢迎的个人 AI 智能体框架。
默认情况下,OpenClaw 通过 OpenAI 和 Anthropic 等云 API 进行推理路由,这意味着每次交互都产生按 token 计费的费用,且敏感数据会离开您的基础设施。Ertas 解决了这两个问题:在您的数据上微调领域 特定模型,导出为 GGUF,通过 Ollama 部署,并将 OpenClaw 指向本地端点。结果是一个理解您特定工作流、每次交互零成本且所有数据保留在您机器上的 AI 智能体。
How Ertas Integrates
OpenClaw 支持通过兼容 OpenAI 的 API 提供服务的任何模型,这包括 Ollama——Ertas 训练模型的推荐本地部署目标。在 Ertas Studio 中微调后,以 GGUF 格式下载模型及配套的 Modelfile。使用一条 CLI 命令将其注册到 Ollama,然后更新 OpenClaw 的 models.providers 配置指向您的本地 Ollama 端点。
对于运行按客户 OpenClaw 部署的代理机构,Ertas 实现了特别高效的架构:在共享基础模型上微调按客户的 LoRA 适配器(每个 50-200MB)。每个客户的 OpenClaw 实例连接到同一个 Ollama 服务器,但在推理时加载不同的适配器。这完全消除了按客户的 API 费用,同时提供比通用云模型更好的领域特定准确性。Ertas Cloud 可以管理完整的生命周期——训练、适配器版本控制、部署监控和模型版本间的 A/B 测试。
Getting Started
- 1
为您的 OpenClaw 工作流微调模型
将 OpenClaw 用例的训练数据(邮件分类示例、支持对话、报告模板)上传到 Ertas Studio。选择针对智能体任务优化的基础模型(推荐 Llama 3.3 8B 或 Qwen 2.5 7B)并启动 LoRA 微调运行。
- 2
导出为 GGUF
以首选量化级别下载 GGUF 格式的微调模型。Q5_K_M 推荐用于 OpenClaw 智能体任务——它在多步推理工作流中平衡了质量和速度。
- 3
通过 Ollama 部署
使用 Ertas 生成的 Modelfile 一条命令将模型注册到 Ollama。Modelfile 包含正确的聊天模板、系统提示和运行时参数。
- 4
配置 OpenClaw 的模型提供商
更新 OpenClaw 的 models.providers 配置,使用本地 Ollama 端点 http://127.0.0.1:11434/v1。将微调模型设为所有任务的默认模型,或配置任务特定的路由。
- 5
测试并迭代
通过微调模型运行您的标准 OpenClaw 工作流。收集准确性不足的案例,将其添加到训练数据集中,并为下一次迭代重新微调。
// openclaw.json — configure local fine-tuned model
{
"models": {
"providers": [
{
"name": "ertas-local",
"api": "openai-completions",
"baseUrl": "http://127.0.0.1:11434/v1",
"models": ["my-finetuned-model"]
}
]
}
}
// Deploy your Ertas-trained model with Ollama:
// ollama create my-finetuned-model -f ./Modelfile
// ollama run my-finetuned-model "Test prompt"Benefits
- 零按 token 推理费用——所有 OpenClaw 交互在本地运行
- 在领域特定智能体任务上比通用云模型更高的准确性
- 完整的数据隐私——文件、邮件和提示永远不会离开您的基础设施
- 面向运行多租户 OpenClaw 部署的代理机构的按客户 LoRA 适配器
- 消 除 API 密钥管理及相关安全风险
- 兼容 OpenClaw 的完整功能集,包括定时任务和心跳监控
Related Resources
Adapter
Fine-Tuning
GGUF
Inference
LoRA
How to Power OpenClaw with Fine-Tuned Local Models (No API Costs)
OpenClaw Security: Why Running Your Own Models Is the Only Real Fix
OpenClaw for Agencies: Per-Client AI Agents Without the API Bill
OpenClaw + Fine-Tuned Models vs. OpenClaw + GPT-4: A Practical Comparison
HIPAA, GDPR, and OpenClaw: A Compliance Guide for Regulated Industries
Extending OpenClaw with Custom Skills Powered by Fine-Tuned Models
Open-Source Models for OpenClaw: Llama 3, Qwen 2.5, and Which to Fine-Tune
Running AI Models Locally: The Complete Guide to Local LLM Inference
How to Cut Your AI Agency Costs by 90% with Fine-Tuned Local Models
llama.cpp
LM Studio
n8n
Ollama
vLLM
Ertas for Healthcare
Ertas for Customer Support
Ertas for Legal
Ertas for AI Automation Agencies
Ertas for Indie Developers & Vibe-Coded Apps
Ship AI that runs on your users' devices.
Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.