客戶支援

    根據您的工單歷史和產品知識微調客戶支援 AI 模型

    The Challenge

    客戶支援團隊淹沒在工單量中,同時努力維持品質。通用 AI 聊天機器人承諾提供幫助,但持續令人失望——它們會虛構不存在的產品功能,給出自信但錯誤的故障排除步驟,並以極高的比率轉介給人工客服,導致自動化幾乎沒有任何改善。根本原因很簡單:這些模型從未見過您的產品文件、您的內部運行手冊,或您的資深客服人員已學會處理的數千個細微邊緣案例。

    隨著產品變得更加複雜,問題加深。每個新功能、定價變更或整合都增加了另一個通用模型會失敗的表面積。RAG 管線有所幫助但引入了自身的可靠性問題——分塊偽影、檢索遺漏和上下文視窗溢出,這些都會不可預測地降低回答品質。支援主管需要的 AI 是真正以受過訓練的客服人員深度理解其產品的,而不是一個對檢索片段進行模式匹配並祈求最好結果的系統。

    The Solution

    Ertas 將您最好的支援知識轉化為專門建構的 AI 模型。透過 Studio,支援營運團隊可以直接在已解決的工單歷史、內部知識庫和匯出為 JSONL 資料集的精選問答配對上微調模型。產出的模型不僅僅是檢索相關文件——它已經內化了您產品的邏輯、術語和故障排除決策樹,產出的回應品質與您頂級人工客服相當。

    Ertas Cloud 將這些微調後的支援模型部署為始終在線的推論端點,透過 REST API 直接與您的客服平台整合。由於模型緊湊(7B-14B 參數)並使用 GGUF 量化最佳化,即使在工單量高峰期回應時間也保持在 500 毫秒以下。隨著產品演進,Studio 使在新工單資料上重新訓練並以零停機部署更新模型變得簡單直接——讓您的 AI 客服的知識與最新版本說明保持同步。

    Key Features

    Studio

    支援調校模型訓練

    將已解決的工單、巨集和知識庫文章作為 JSONL 訓練資料匯入 Studio。使用 LoRA 適配器進行微調,讓模型學習您產品的特定術語、常見故障模式和偏好的解決路徑——而非通用的客服套話。

    Hub

    對話基礎模型

    從 Hub 精選的指令調校和聊天最佳化基礎模型開始。按授權、語言支援和參數數量篩選,為您的支援用例找到合適的基礎——從用於簡單 FAQ 的輕量級 7B 模型到用於複雜故障排除的 14B 模型。

    Cloud

    低延遲服務

    透過 GGUF 量化推論部署至 Cloud,實現低於 500 毫秒的回應時間。設定自動擴展以處理工單高峰,設置金絲雀部署以安全更新模型,並透過內建分析儀表板監控解決品質。

    Vault

    對話資料保護

    Vault 自動偵測並遮蔽 PII——電子郵件地址、電話號碼、帳號 ID——在訓練資料集到達模型之前。保留政策確保對話資料按時程清除,存取日誌為隱私審查提供清晰的稽核追蹤。

    Example Workflow

    一家 SaaS 公司的支援團隊匯出 100,000 張已解決的 Zendesk 工單作為 JSONL 資料集,篩選具有高 CSAT 分數和已驗證解決方案的工單。資料集上傳至 Vault,由 Vault 掃描並遮蔽客戶 PII。在 Studio 中,團隊從 Hub 選擇一個指令調校的 Llama 3 8B 模型,並執行針對公司故障排除和帳戶管理領域的 LoRA 微調工作。在 5,000 張留出工單的驗證集上驗證後,模型達到 87% 的自動解決準確率——相比先前基於 RAG 的聊天機器人的 34%。模型透過 Cloud 作為 REST 端點部署,與其 Zendesk webhook 整合,自主處理一級工單,僅在信心分數低於門檻時才轉介。每月支援成本降低 35%,平均首次回應時間從 4 小時降至 10 秒以內。

    Compliance & Security

    支援對話經常包含客戶 PII,包括姓名、電子郵件和帳戶詳情。在微調之前,應對所有訓練資料套用 Vault 的自動 PII 偵測和遮蔽管線。受 GDPR、CCPA 或 SOC 2 要求約束的組織可以設定 Vault 保留政策和存取控制以滿足其特定的合規義務。

    Related Resources

    Ship AI that runs on your users' devices.

    Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.