Gemma 4 (e2b / e4b)
2B-4B 规模质量: 同类最佳
Gemma 4 的边缘变体是 2026 年最强的小型开源权重模型。e2b(约 2B 有效参数)在 Q4_K_M 下约为 1.5GB——可装入手机、嵌入式设备和任何 4GB+ 内存的系统——并独特地支持图像输入,尽管规模如此之小。e4b(约 4B 有效参数)进一步扩展质量,同时保持笔记本可部署性。两者均以 Apache 2.0 发布(这是 Gemma 第一代采用此许可),使商业部署变得简单。对于移动聊天、设备端助手和基于摄像头的 AI 应用,目前没有其他开源权重家族能在 2B 规模上匹敌 e2b。
Strengths
- e2b 约 1.5GB,可装入手机和任何 4GB+ 内存的设备
- 原生多模态——即便是 2B 变体也接受图像输入
- Apache 2.0 许可(Gemma 4 新增)——无任何商业限制
- 一流的 MLX 支持,适用于 Apple Silicon 部署
Trade-offs
- 在复杂推理任务上无法匹敌更大模型(8B+)
- 多模态支持相比纯文本模型增加了一定推理复杂度