Back to blog
    如何評估自定義 AI 模型項目的範圍(以及收費多少)
    agencyscopingpricingproject-managementcustom-modelsegment:agency

    如何評估自定義 AI 模型項目的範圍(以及收費多少)

    自定義 AI 模型項目的發現問題、項目類型、價格範圍和範圍管理策略。如何在報價之前正確評估範圍。

    EErtas Team·

    自定義 AI 模型工作中最昂貴的錯誤是在不了解您實際在構建什麼的情況下開始項目。自定義 AI 模型項目在表面上看起來相似——「我們想在我們的資料上微調模型」——但在複雜性、資料質量、整合要求和交付時間表方面差異巨大。

    在報價前良好地評估範圍,可以讓您避免兩種最常見的機構災難:低估複雜項目(您虧損)或高估簡單項目(您失去客戶)。

    決定項目複雜性的 4 個變量

    每個自定義 AI 模型項目都有四個變量。每一個都可以使範圍加倍或加三倍:

    1. 資料可用性和質量。 最不可預測的變量。擁有 2,000 個乾淨、已標注的(輸入、輸出)JSONL 格式對的客戶是 2 週的項目。認為他們有資料但實際上有非結構化 PDF、不一致格式和部分標注的客戶是 6-8 週的項目(主要是資料工程)。在評估實際資料之前不要報價。

    2. 任務複雜性。 分類任務(將這個工單路由到 X 部門)比生成任務(以我們的品牌聲音撰寫對這個工單的回覆)更容易微調。單輸出任務比多步推理任務更簡單。任務越難,需要的訓練資料越多,需要的迭代也越多。

    3. 部署要求。 在客戶 VPS 上的 Ollama 上部署 GGUF 模型很直接。與現有的企業 CRM 系統、Salesforce 自定義對象和舊式 API 網關整合是模型工作之上的 4 週整合項目。在報價之前繪製整合面。

    4. 質量閾值。 需要 80% 準確率的客戶與需要 95%+ 的客戶是不同的項目。更高的閾值需要更多訓練資料、更多評估週期,有時還需要更大的模型。明確詢問:「這需要達到什麼準確率級別才能取代您當前的流程?」

    發現電話清單

    在獲得這些問題的答案之前不要報任何費用。預算 45-60 分鐘。

    問題和當前解決方案:

    • 您希望 AI 處理什麼具體任務?
    • 這個任務今天是如何完成的?誰在做,需要多長時間?
    • 錯誤對您的成本是多少(在時間、金錢或客戶影響方面)?

    資料:

    • 您是否有這個任務被正確完成的歷史示例?
    • 以什麼格式(電子表格、CRM 記錄、聊天日誌、PDF)?
    • 有多少示例?(要求查看樣本——不是樣本的描述,而是實際文件)
    • 誰標注或批准了這些示例?

    部署:

    • 模型在哪裡運行?(您的伺服器?客戶的伺服器?雲端 API?)
    • 它需要與哪些系統整合?
    • 客戶團隊中誰會持續管理它?

    成功標準:

    • 您如何知道模型在工作?
    • 什麼準確率會讓這個成功?
    • 如果模型出錯會發生什麼?

    時間表和利益相關者:

    • 您什麼時候需要這個能用?
    • 誰在這個項目上做最終決定?
    • 您心目中的預算範圍是多少?

    項目類型和價格範圍

    項目類型描述時間表價格範圍
    資料審計評估現有資料質量,推薦資料集結構,估計微調可行性1-2 週$1,500-3,000
    概念驗證在現有資料上微調一個模型,評估準確率,在測試環境中部署2-4 週$3,000-8,000
    標準部署一個用例的資料準備 + 微調 + 整合 + 監控設置4-8 週$8,000-20,000
    多用例部署與上述相同,但 2-4 個不同的模型/用例8-16 週$20,000-60,000
    持續服務費每月模型維護、重新訓練、監控、評估每月$500-2,500/月

    這些是 2026 年市場條件下的美元範圍。根據您的市場、您的業績記錄和客戶規模進行調整。500 人的公司為相同的交付物支付的費用比 20 人的公司多。

    資料問題

    這值得單獨說明,因為這是大多數 AI 項目失敗的地方,也是大多數範圍評估錯誤發生的地方。

    客戶始終高估他們的資料準備程度。發現過程中的常見回答:

    • 「我們有 5 年的客戶支持工單」→ 通常存儲在沒有導出功能的系統中,部分標注,通常反映已改變的政策,格式不一致。3-4 週資料工程後的真實乾淨訓練資料:300-800 個示例。

    • 「我們有所有的產品文檔」→ 非結構化的 PDF、Word 文件和 wiki。對 RAG 有用,不能直接用於微調。必須轉換為(問題、答案)對。

    • 「我們的團隊每天手動做這件事」→ 任務定義清晰,但沒有記錄的示例。必須前瞻性地收集或合成創建。

    增加範圍的紅旗:

    • 「我們可以在下週給您資料」(他們還沒有)
    • 資料在有導出限制的系統中
    • 多個團隊為資料集做出了貢獻(標注不一致)
    • 標注是由不同的人在不同時期完成的

    減少範圍的綠旗:

    • 從 CRM 或工單系統的乾淨導出
    • 由單個人或緊密團隊進行的一致標注
    • 客戶可以在 24 小時內給您一個樣本文件

    在報價之前始終要求查看樣本文件。查看 50 個實際示例比任何描述都更能說明問題。

    AI 項目中的範圍蔓延

    AI 模型工作中的範圍蔓延有其特定特徵。它通常以三種形式之一出現:

    功能擴展: 「模型能否也處理 X?」——其中 X 是一個相關但不同的任務,需要額外的訓練資料。用變更單處理這個問題,而不是吸收它。

    準確率談判: 您以 87% 的準確率交付了一個模型;客戶想要 92%。達到更高的準確率通常需要更多資料和更多訓練週期。在您的工作說明中明確定義「完成」,並提前商定具體的準確率指標。

    整合擴展: 隨著您對客戶系統了解更多,部署範圍增長。原來的「與我們的 CRM 整合」變成「與我們的 CRM、我們的電子郵件平台和我們的報告系統整合」。每個整合都是一個單獨的可交付成果。

    工作說明:關鍵部分

    每個自定義 AI 模型項目在開始工作之前都需要書面工作說明。關鍵部分:

    可交付成果——您將交付的確切內容列表:模型文件、整合代碼、文檔、訓練資料文檔、部署指南。

    準確率閾值——構成成功模型的具體指標(例如,「在 200 個示例的保留測試集上 ≥88% 準確率」)。這防止了「我以為它會更好」的對話。

    資料要求——客戶必須提供什麼資料、以什麼格式、在什麼日期之前。如果他們不提供,時間表會推移。

    修訂政策——包含多少輪模型修訂。在包含的輪次之後,額外的迭代作為變更單收費。

    交接和支持——他們收到什麼培訓/文檔,您在發布後提供多長時間的支持,發布後支持包含什麼,以及什麼會觸發額外的服務費。

    付款結構——推薦:40% 預付,30% 在模型交付時,30% 在整合完成時。沒有定金就不要開始工作。


    Ship AI that runs on your users' devices.

    Ertas early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    延伸閱讀

    Ship AI that runs on your users' devices.

    Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    Keep reading