Ertas 助力客户支持

    在真实的支持对话上微调 AI 模型,使其准确解决工单——而不是用通用的、模棱两可的回复应付。

    The Challenge

    客户支持团队被工单量淹没,同时还要维持质量。通用 AI 聊天机器人承诺减轻压力,但持续令人失望——它们虚构不存在的产品功能,给出自信但错误的故障排除步骤,升级到人工客服的比率高到自动化几乎起不了作用。根本原因很简单:这些模型从未见过您的产品文档、内部操作手册,或您的资深客服人员学会处理的数千个细微边缘案例。

    随着产品变得更加复杂,问题更加严重。每个新功能、定价变更或集成都增加了通用模型会失败的新表面积。RAG 流水线有所帮助,但引入了自身的可靠性问题——分块伪影、检索遗漏和上下文窗口溢出,这些不可预测地降低了回答质量。支持负责人需要的 AI 能够像经过培训的客服那样深入理解产品,而不是一个对检索到的片段进行模式匹配然后碰运气的系统。

    The Solution

    Ertas 将您最好的支持知识转化为专门构建的 AI 模型。通过 Studio,支持运营团队可以在已解决的工单历史、内部知识库和导出为 JSONL 数据集的精选问答对上直接微调模型。生成的模型不仅仅检索相关文档——它已经内化了您产品的逻辑、术语和故障排除决策树,产生的回复质量匹配您最优秀的人工客服。

    Ertas Cloud 将这些微调后的支持模型部署为全天候运行的推理端点,通过 REST API 直接与您的帮助台平台集成。由于模型紧凑(7B-14B 参数)并通过 GGUF 量化优化,即使在工单高峰期,响应时间也能保持在 500 毫秒以内。随着产品的发展,Studio 使在新工单数据上重新训练和零停机部署更新模型变得简单——让您的 AI 客服的知识与最新发布说明保持同步。

    Key Features

    Studio

    支持专属模型训练

    将已解决的工单、宏和知识库文章作为 JSONL 训练数据导入 Studio。通过 LoRA 适配器微调,让模型学习您产品的特定术语、常见故障模式和首选解决路径——而非通用的客户服务套话。

    Hub

    对话型基础模型

    从 Hub 精选的指令微调和聊天优化基础模型开始。按许可证、语言支持和参数数量筛选,为您的支持用例找到合适的基础——从用于简单 FAQ 的轻量级 7B 模型到用于复杂故障排除的 14B 模型。

    Cloud

    低延迟服务

    通过 GGUF 量化推理部署到 Cloud,实现低于 500 毫秒的响应时间。配置自动扩缩以应对工单高峰,设置金丝雀部署以安全更新模型,并通过内置分析仪表板监控解决质量。

    Vault

    对话数据保护

    Vault 自动检测并编辑训练数据集中的个人身份信息(PII)——电子邮件地址、电话号码、账户 ID——在数据到达模型之前。保留策略确保对话数据按计划清除,访问日志为隐私审查提供清晰的审计追踪。

    Example Workflow

    一家 SaaS 公司的支持团队导出 100,000 个已解决的 Zendesk 工单作为 JSONL 数据集,筛选高 CSAT 评分和已验证解决方案的工单。数据集上传到 Vault,后者扫描并编辑客户 PII。在 Studio 中,团队从 Hub 选择一个指令微调的 Llama 3 8B 模型,并针对公司的故障排除和账户管理领域运行 LoRA 微调作业。在 5,000 个工单的保留测试集上验证后,模型达到 87% 的自动解决准确率——比之前基于 RAG 的聊天机器人的 34% 大幅提升。模型通过 Cloud 作为 REST 端点部署,与 Zendesk webhook 集成,自主处理一级工单,仅在置信度分数低于阈值时才升级。月度支持成本降低 35%,平均首次响应时间从 4 小时降至不到 10 秒。

    Compliance & Security

    支持对话经常包含客户 PII,包括姓名、电子邮件和账户详情。Vault 的自动 PII 检测和编辑流水线应在微调前应用于所有训练数据。受 GDPR、CCPA 或 SOC 2 要求约束的组织可以配置 Vault 保留策略和访问控制以满足其特定的合规义务。

    Related Resources

    Ship AI that runs on your users' devices.

    Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.