Blog

代理專家：FunctionGemma + Gemma 4 E2B 與微調出貨論點

Google 的 FunctionGemma（270M）與 Gemma 4 E2B（2B）是 2026 年最小、最具公信力的函式呼叫模型。它們不是通用——它們明確設計為被微調。這就是重點。

Meta 的 Llama Stack 是建構基於 Llama 代理的標準參考架構。將其與微調 Llama 4 衍生模型以及 Swift/Kotlin 用戶端 SDK 結合,你便能獲得完全在使用者手機上執行的完整代理堆疊。

Deploy custom AI models, no ML expertise required.

Free plan, no card. Paid plans from $25/mo USD.

TypeScript 優先的行動建構者不必使用 Python 代理框架。Mastra 與 Vercel AI SDK 加上透過 llama.cpp 在裝置端執行的微調 4B 模型,產生具有零按 token 成本的完整代理堆疊。

我們在 BFCL v4、真實行動延遲與微調後準確率三個維度上，對 2026 年最佳的三個裝置端工具呼叫基底——Qwen3-4B、Gemma 4 E4B 與 Phi-4-Mini——進行了基準測試。每個模型在不同情境中勝出；以下是如何挑選。

Deploy custom AI models, no ML expertise required.

Free plan, no card. Paid plans from $25/mo USD.