用 $50/月构建 AI SaaS：微调本地技术栈

每个人谈论 AI SaaS 都好像你需要风险资本来支付 API 账单。你不需要。你需要一个微调模型、一台 $30 的服务器，和停止按 token 付费给 OpenAI 的意愿。

完整技术栈

基础模型选择

Llama 3.3 8B — 默认选择。Qwen 2.5 7B — 结构化输出更好。Phi-4（3.8B） — 微软的小而强模型。

用 Ertas 微调

成本：$14.50/月（Builder 方案）

GGUF 导出和量化

Q5_K_M 是最佳点。 质量差异在测量噪声范围内，但模型显著更小更快。

VPS：你的 AI 服务器

成本：$20-30/月

Hetzner CAX31（ARM，8 vCPU，32 GB RAM） — 约$16/月。

Ollama：推理服务器

成本：免费（开源）

curl -fsSL https://ollama.com/install.sh | sh

连接你的应用

const response = await openai.chat.completions.create({
  model: "myapp-model",
  messages: [{ role: "user", content: userPrompt }],
}, {
  baseURL: "http://your-server-ip:11434/v1",
  apiKey: "ollama",
});

改了两行。相同 SDK。相同响应格式。你的应用不知道区别。

完整成本明细

项目	月成本
Ertas Builder 方案	$14.50
Hetzner CAX31 VPS	约$16
Ollama	$0
总计	约$30.50/月

$50/月。生产 AI 推理。无按 token 收费。

真正重要的数学

以 $9.99/月订阅、2,000 MAU 和 12% 付费转化率：

API 方式：收入 $2,398/月，AI 成本 $1,200/月，利润 $1,198/月（50%） $50 技术栈：收入 $2,398/月，AI 成本 $50/月，利润 $2,348/月（98%）

那额外的 $1,150/月是"勉强能用的副项目「和」养活你的生意"之间的区别。

Ship AI that runs on your users' devices.

Free plan with 30 credits/mo, no card required. Paid plans from $25/mo USD.

or view pricing →

用 $50/月构建 AI SaaS：微调本地技术栈

完整技术栈

基础模型选择

用 Ertas 微调

GGUF 导出和量化

VPS：你的 AI 服务器

Ollama：推理服务器

连接你的应用

完整成本明细

真正重要的数学

延伸阅读

Ship AI that runs on your users' devices.

Keep reading

独立应用的自托管 AI：用自己的模型替代 GPT-4

停止为 AI 按用户付费：独立应用的固定成本架构

从 Cursor 到生产：部署无供应商锁定的 AI 功能