OpenRouter + Ertas
通过 OpenRouter 的统一 API 访问 Ertas 训练的模型以及数百个其他 LLM,支持自动故障转移路由和成本优化。
Overview
OpenRouter 是一个统一 API 网关,通过单一端点提供来自多个提供商的数百个大语言模型的访问。开发者无需管理 OpenAI、Anthropic、Google 和数十个开源模型主机的单独 API 密钥、SDK 和计费关系,只需与 OpenRouter 集成一次即可访问整个模型生态系统。OpenRouter 自动处理路由、负载均衡、速率限制和提供商故障转移。
除了聚合功能外,OpenRouter 还提供智能模型选择工具。开发者可以在承诺使用某个模型之前,在成本、速度和质量指标上并排比较模型。平台支持自定 义模型托管,这意味着组织可以在公共模型旁注册自己的微调模型,并使用相同的 API 在它们之间路由。这使 OpenRouter 成为希望通过托管 API 层向内部或外部消费者提供 Ertas 训练模型的团队的自然分发和部署渠道。
How Ertas Integrates
在 Ertas Studio 中微调模型后,您可以将其作为自定义模型端点注册到 OpenRouter。这让您的团队——或外部消费者——通过标准 OpenRouter API 与其他模型一起访问您的 Ertas 训练模型。好处在于运营简洁性:无需为微调模型管理单独的推理端点和 API 层,您可以利用 OpenRouter 现有的认证、速率限制、使用跟踪和计费基础设施。
对于为不同任务使用多个模型的团队,OpenRouter 的路由功能与 Ertas 训练的专业模型完美配合。您可以将复杂的领域特定查询路由到 Ertas 训练模型,而将简单任务回退到通用模型。OpenRouter 的 API 完全兼容 OpenAI SDK,因此任何基于 OpenAI 客户端库构建的应用只需更改基础 URL 和模型名称即可使用您的微调模型——这与使 Ertas 模型在整个开源推理生态系统中可移植的模式相同。
Getting Started
- 1
在 Ertas Studio 中微调您的模型
在您的数据上训练领域特定模型。选择适合性能和成本要求的基础模型和量化格式。
- 2
部署到推理端点
通过 Ertas Cloud、vLLM 或任何具有公共或 VPN 可访问端点的生产级推理服务器提供模型服务。
- 3
将模型注册到 OpenRouter
在 OpenRouter 的仪表板中将 Ertas 训练模型添加为自定义模型。配置端点 URL、模型功能和访问权限。
- 4
配置路由规则
设置路由偏好,将特定查询类型或应用定向到您的微调模型。为高可用性场景配置故障转移模型。
- 5
与 OpenRouter API 集成
使用兼容 OpenAI SDK 的 OpenRouter API 从任何应用访问您的模型。通过 OpenRouter 仪表板跟踪使用情况和成本。
from openai import OpenAI
# Use OpenRouter to access your Ertas-trained model
client = OpenAI(
base_url="https://openrouter.ai/api/v1",
api_key="sk-or-your-openrouter-key",
)
response = client.chat.completions.create(
model="your-org/ertas-legal-7b", # Your custom model on OpenRouter
messages=[
{"role": "system", "content": "You are a legal document analyst."},
{"role": "user", "content": "Summarize the key obligations in this contract."},
],
temperature=0.1,
max_tokens=1024,
)
print(response.choices[0].message.content)Benefits
- 通过具有内置认证和速率限制的托管 API 提供微调模型
- 兼容 OpenAI SDK 的 API 意味着现有应用零代码更改
- 自动故障转移路由确保生产工作负载的高可用性
- 在一个仪表板中跟踪所有模型的使用情况和成本分析
- 在专业微调模型和通用模型之间智能路由
- 通过访问控制与团队成员或外部消费者共享微调模型
Related Resources
Fine-Tuning
GGUF
Inference
Getting Started with Ertas: Fine-Tune and Deploy Custom AI Models
Running AI Models Locally: The Complete Guide to Local LLM Inference
Privacy-Conscious AI Development: Fine-Tune in the Cloud, Run on Your Terms
How to Fine-Tune an LLM: The Complete 2026 Guide
Self-Hosted AI for Indie Apps: Replace GPT-4 with Your Own Model
Hugging Face
LangChain
LM Studio
Ollama
vLLM
Ertas for SaaS Product Teams
Ertas for Customer Support
Ertas for AI Automation Agencies
Ertas for Indie Developers & Vibe-Coded Apps
Ship AI that runs on your users' devices.
Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.