Ertas 助力客户支持

在真实的支持对话上微调 AI 模型，使其准确解决工单——而不是用通用的、模棱两可的回复应付。

The Challenge

客户支持团队被工单量淹没，同时还要维持质量。通用 AI 聊天机器人承诺减轻压力，但持续令人失望——它们虚构不存在的产品功能，给出自信但错误的故障排除步骤，升级到人工客服的比率高到自动化几乎起不了作用。根本原因很简单：这些模型从未见过您的产品文档、内部操作手册，或您的资深客服人员学会处理的数千个细微边缘案例。

随着产品变得更加复杂，问题更加严重。每个新功能、定价变更或集成都增加了通用模型会失败的新表面积。RAG 流水线有所帮助，但引入了自身的可靠性问题——分块伪影、检索遗漏和上下文窗口溢出，这些不可预测地降低了回答质量。支持负责人需要的 AI 能够像经过培训的客服那样深入理解产品，而不是一个对检索到的片段进行模式匹配然后碰运气的系统。

The Solution

Ertas 将您最好的支持知识转化为专门构建的 AI 模型。通过 Studio，支持运营团队可以在已解决的工单历史、内部知识库和导出为 JSONL 数据集的精选问答对上直接微调模型。生成的模型不仅仅检索相关文档——它已经内化了您产品的逻辑、术语和故障排除决策树，产生的回复质量匹配您最优秀的人工客服。

Ertas Cloud 将这些微调后的支持模型部署为全天候运行的推理端点，通过 REST API 直接与您的帮助台平台集成。由于模型紧凑（7B-14B 参数）并通过 GGUF 量化优化，即使在工单高峰期，响应时间也能保持在 500 毫秒以内。随着产品的发展，Studio 使在新工单数据上重新训练和零停机部署更新模型变得简单——让您的 AI 客服的知识与最新发布说明保持同步。

Key Features

Studio

支持专属模型训练

将已解决的工单、宏和知识库文章作为 JSONL 训练数据导入 Studio。通过 LoRA 适配器微调，让模型学习您产品的特定术语、常见故障模式和首选解决路径——而非通用的客户服务套话。

Hub

对话型基础模型

从 Hub 精选的指令微调和聊天优化基础模型开始。按许可证、语言支持和参数数量筛选，为您的支持用例找到合适的基础——从用于简单 FAQ 的轻量级 7B 模型到用于复杂故障排除的 14B 模型。

Cloud

低延迟服务

通过 GGUF 量化推理部署到 Cloud，实现低于 500 毫秒的响应时间。配置自动扩缩以应对工单高峰，设置金丝雀部署以安全更新模型，并通过内置分析仪表板监控解决质量。

Vault

对话数据保护

Vault 自动检测并编辑训练数据集中的个人身份信息（PII）——电子邮件地址、电话号码、账户 ID——在数据到达模型之前。保留策略确保对话数据按计划清除，访问日志为隐私审查提供清晰的审计追踪。

Example Workflow

一家 SaaS 公司的支持团队导出 100,000 个已解决的 Zendesk 工单作为 JSONL 数据集，筛选高 CSAT 评分和已验证解决方案的工单。数据集上传到 Vault，后者扫描并编辑客户 PII。在 Studio 中，团队从 Hub 选择一个指令微调的 Llama 3 8B 模型，并针对公司的故障排除和账户管理领域运行 LoRA 微调作业。在 5,000 个工单的保留测试集上验证后，模型达到 87% 的自动解决准确率——比之前基于 RAG 的聊天机器人的 34% 大幅提升。模型通过 Cloud 作为 REST 端点部署，与 Zendesk webhook 集成，自主处理一级工单，仅在置信度分数低于阈值时才升级。月度支持成本降低 35%，平均首次响应时间从 4 小时降至不到 10 秒。