客戶支援

根據您的工單歷史和產品知識微調客戶支援 AI 模型

The Challenge

客戶支援團隊淹沒在工單量中，同時努力維持品質。通用 AI 聊天機器人承諾提供幫助，但持續令人失望——它們會虛構不存在的產品功能，給出自信但錯誤的故障排除步驟，並以極高的比率轉介給人工客服，導致自動化幾乎沒有任何改善。根本原因很簡單：這些模型從未見過您的產品文件、您的內部運行手冊，或您的資深客服人員已學會處理的數千個細微邊緣案例。

隨著產品變得更加複雜，問題加深。每個新功能、定價變更或整合都增加了另一個通用模型會失敗的表面積。RAG 管線有所幫助但引入了自身的可靠性問題——分塊偽影、檢索遺漏和上下文視窗溢出，這些都會不可預測地降低回答品質。支援主管需要的 AI 是真正以受過訓練的客服人員深度理解其產品的，而不是一個對檢索片段進行模式匹配並祈求最好結果的系統。

The Solution

Ertas 將您最好的支援知識轉化為專門建構的 AI 模型。透過 Studio，支援營運團隊可以直接在已解決的工單歷史、內部知識庫和匯出為 JSONL 資料集的精選問答配對上微調模型。產出的模型不僅僅是檢索相關文件——它已經內化了您產品的邏輯、術語和故障排除決策樹，產出的回應品質與您頂級人工客服相當。

Ertas Cloud 將這些微調後的支援模型部署為始終在線的推論端點，透過 REST API 直接與您的客服平台整合。由於模型緊湊（7B-14B 參數）並使用 GGUF 量化最佳化，即使在工單量高峰期回應時間也保持在 500 毫秒以下。隨著產品演進，Studio 使在新工單資料上重新訓練並以零停機部署更新模型變得簡單直接——讓您的 AI 客服的知識與最新版本說明保持同步。

Key Features

Studio

支援調校模型訓練

將已解決的工單、巨集和知識庫文章作為 JSONL 訓練資料匯入 Studio。使用 LoRA 適配器進行微調，讓模型學習您產品的特定術語、常見故障模式和偏好的解決路徑——而非通用的客服套話。

Hub

對話基礎模型

從 Hub 精選的指令調校和聊天最佳化基礎模型開始。按授權、語言支援和參數數量篩選，為您的支援用例找到合適的基礎——從用於簡單 FAQ 的輕量級 7B 模型到用於複雜故障排除的 14B 模型。

Cloud

低延遲服務

透過 GGUF 量化推論部署至 Cloud，實現低於 500 毫秒的回應時間。設定自動擴展以處理工單高峰，設置金絲雀部署以安全更新模型，並透過內建分析儀表板監控解決品質。

Vault

對話資料保護

Vault 自動偵測並遮蔽 PII——電子郵件地址、電話號碼、帳號 ID——在訓練資料集到達模型之前。保留政策確保對話資料按時程清除，存取日誌為隱私審查提供清晰的稽核追蹤。

Example Workflow

一家 SaaS 公司的支援團隊匯出 100,000 張已解決的 Zendesk 工單作為 JSONL 資料集，篩選具有高 CSAT 分數和已驗證解決方案的工單。資料集上傳至 Vault，由 Vault 掃描並遮蔽客戶 PII。在 Studio 中，團隊從 Hub 選擇一個指令調校的 Llama 3 8B 模型，並執行針對公司故障排除和帳戶管理領域的 LoRA 微調工作。在 5,000 張留出工單的驗證集上驗證後，模型達到 87% 的自動解決準確率——相比先前基於 RAG 的聊天機器人的 34%。模型透過 Cloud 作為 REST 端點部署，與其 Zendesk webhook 整合，自主處理一級工單，僅在信心分數低於門檻時才轉介。每月支援成本降低 35%，平均首次回應時間從 4 小時降至 10 秒以內。