AI Models

Open-source models you can fine-tune with Ertas.

Ant Group Ling / Ring

Ant Group (inclusionAI)

Ant Group 兆級參數開放權重家族——Ling-2.5-1T（非思考模式，1M 上下文）和 Ring-2.5-1T（全球首個混合線性架構思考模型，在 IMO 2025 取得 35/42 金牌等級成績並橫掃 CMO 2025），以及 2026 年 4 月推出的 Ling-2.6-1T 更新版。

1T (Ling/Ring 2.5)1T (Ling 2.6)

Apertus

Swiss AI Initiative (ETH Zurich + EPFL + CSCS)

瑞士的開源權重基礎模型家族——權重、訓練資料與訓練配方完全公開,以 Apache 2.0 釋出,並對 1,000+ 種語言提供一級支援,且明確契合 EU AI Act 與瑞士資料保護需求。

Arcee Trinity Large

Arcee AI

Arcee AI 於 2026 年 1 月發布的版本——一個 4,000 億參數的專家混合模型，具備 13B 活躍參數、256 個專家（每個 token 啟用 4 個）、17 兆訓練 token，並在 2,048 顆 NVIDIA B300 晶片上訓練 30-33 天。是 2026 年少數幾個美國製造的前沿開源權重模型之一，與 OLMo 3 及 GPT-OSS 並列。

Code Llama

Meta

Meta 基於 Llama 2 打造的專業程式碼生成模型系列，提供 7B、13B、34B 和 70B 四種規格，並針對程式碼補全、指令跟隨和 Python 開發提供最佳化變體。

Command R

Cohere

Cohere 以企業為核心的模型系列，提供 35B 和 104B 兩種規格，專為檢索增強生成（RAG）而設計，具備原生引用支援、工具使用和涵蓋 10 種以上語言的多語言能力。

DeepSeek V3.2

DeepSeek

DeepSeek 於 2025 年末發布的版本，引入 DeepSeek 稀疏注意力（DSA）——一種可學習的稀疏注意力機制，能實現高效的長上下文推論，並搭配統一思考模式切換。DeepSeek V4 的直接前身。MIT 風格授權。

DeepSeek V4

DeepSeek

DeepSeek 於 2026 年 4 月發布的旗艦——一個 1.6 兆參數的專家混合模型，活躍參數 49B，具備 100 萬 token 上下文，目前在開源權重綜合智慧基準上領先，並據報導正在縮短與前沿閉源模型的差距。

284B-A13B (Flash)1.6T-A49B (Pro)

DeepSeek-R1

DeepSeek

DeepSeek 透過強化學習訓練的專用推理模型，能夠執行延伸思維鏈推理，提供從 1.5B 到 70B 的蒸餾版本以及完整的 671B 混合專家架構。

DeepSeek-V3

DeepSeek

DeepSeek 的旗艦級 6,710 億參數混合專家模型，每個 token 活躍 37B 參數，以極高的推論效率提供前沿級別的通用效能。

671B (37B active)

Devstral 2

Mistral AI

Mistral AI 編碼特化的開放權重家族——Devstral 2（123B）和 Devstral Small 2（24B），其中 123B 變體在 SWE-Bench Verified 上取得 72.2% 分數，24B 可在消費級硬體上執行。在 2026 年 3 月被併入 Mistral Small 4 的統一架構之前，作為編碼專家系列發布。

24B (Small 2)123B

Falcon

TII Abu Dhabi

阿布達比技術創新研究所的開放權重模型家族，提供 7B、40B 和 180B 三種規格，使用龐大的 RefinedWeb 資料集訓練，開創了使用高品質過濾網路資料進行 LLM 訓練的先河。

Falcon H1R-7B

TII

TII 於 2026 年 1 月推出的混合 Mamba+Transformer 架構——擁有 256K 上下文視窗的 70 億參數模型，在 AIME 2025 上取得 83.1% 的成績，於數學基準上勝過比其大 7 倍的推理模型。

Falcon-H1 Arabic

TII

技術創新研究所於 2026 年 1 月推出的阿拉伯語特化版本——三種規格（3B、7B、34B）採用 Mamba+Transformer 混合架構，領先 Open Arabic LLM 排行榜。34B 變體在阿拉伯語特定基準上以不到一半的參數量勝過 Llama 3.3 70B。

Falcon-H1-Tiny

TII

技術創新研究所於 2026 年 1 月推出的超小型模型集合——15 個低於 100M 參數的變體，外加 600M 推理模型（Falcon-H1-Tiny-R-0.6B），全部採用 Mamba+Transformer 混合架構，是 2026 年瀏覽器與微控制器部署中規模最小的可用 LLM。

FunctionGemma

Google

Google 為工具呼叫量身打造的 270M 參數模型——一個 Gemma 3 衍生模型,專為將自然語言意圖映射到函式呼叫而訓練。是開源權重生態系中最小、最具公信力的函式呼叫模型,也是針對你自家工具 schema 進行微調的明確邀請。

Gemma 3

Google

Google 基於 Gemini 技術打造的最新開放權重模型家族，提供 1B、4B、12B 和 27B 四種規格，具備原生多模態視覺語言能力和 128K token 上下文視窗。

Gemma 4

Google

Google 於 2026 年 4 月發布的開源權重模型家族——首個以 Apache 2.0 授權發布的 Gemma 世代，涵蓋密集 31B 旗艦、26B-A3.8B 專家混合變體，以及為邊緣最佳化的 4B 與 2B 模型，全部具備原生多模態能力。

2B (e2b)4B (e4b)26B-A3.8B

GLM-4.5

Z.ai

Z.ai 於 2025 年 7 月發布的專家混合版本——3,550 億總參數，每個 token 活躍 320 億，設計於 8× 華為昇騰 H20 晶片上運作。GLM-5 旗艦的主力前身。

GLM-4.6

Z.ai

Z.ai 於 2025 年下半年發布的中階版本——一個 3,550 億參數的專家混合模型，具備 200K 上下文、近乎 Claude Sonnet 4 的程式編寫表現，且每個任務所用的 token 比前代少約 15%。配套的視覺變體 GLM-4.6V（106B 與 9B）將該家族延伸至多模態使用情境。

GLM-4.7

Z.ai

Z.ai 於 2025 年 12 月發布的程式編寫導向版本——一個 4,000 億參數的專家混合模型，具備「保留思考」多輪推理，加上一個較小的 GLM-4.7 Flash 變體用於生產服務。發布時在開源權重模型中登頂 Code Arena，後續由 GLM-5 系列接棒。

~400B (旗艦)Flash (較小)

GLM-5

Z.ai

Z.ai 的 2026 年 2 月旗艦——一個於華為昇騰晶片上訓練的 7,450 億參數模型，是 GLM-5 系列的基礎，在 2026 年 4 月 GLM-5.1 更新加入大量後訓練改善之前。Z.ai 於 2026 年 1 月在香港證券交易所掛牌上市。

GLM-5.1

Z.ai

Z.ai 於 2026 年 4 月 8 日對 GLM-5 的更新——相同的 7,450 億參數基礎搭配精煉後的後訓練，帶來 28% 的程式編寫提升、8 小時自主執行能力，以及 SWE-Bench Pro 領先成績，短暫地讓開源權重模型超越 GPT-5.4 與 Claude Opus 4.6。

GPT-OSS

OpenAI

OpenAI 自 GPT-2 以來首次的開放權重模型發布——一個專家混合家族，包含 117B/5.1B 活躍的 GPT-OSS-120B 旗艦，以及較小的 21B/3.6B 活躍 GPT-OSS-20B 變體，於 2025 年 8 月以 Apache 2.0 授權發布。

21B-A3.6B (20b)117B-A5.1B (120b)

Hermes 4

Nous Research

Nous Research 於 2025 年 8 月發布的模型家族——基於 Llama-3.1 的微調版，提供 14B、70B 與 405B 三種規格，採用明確思考 token 的混合推理、中性對齊的後訓練，並使用 Atropos 強化學習系統搭配約 1,000 個任務專屬驗證器，在約 600 億 token 上訓練。

IBM Granite 4.1

IBM

IBM 於 2026 年 4 月 29 日推出的企業導向版本——包含 3B、8B 和 30B 三種規格的稠密模型家族，外加 Embedding R2 和 2B Speech 變體。8B Instruct 在基準測試上能與前一代 Granite 4.0 32B MoE 匹敵。Apache 2.0 授權，涵蓋 12 種以上語言。

InternLM

Shanghai AI Lab

上海人工智慧實驗室的多語言模型系列，提供 7B 和 20B 兩種規格，具備強大的中英雙語能力、長上下文支援，以及在推理和工具使用基準測試上的卓越表現。

Kimi K2

Moonshot AI

Moonshot AI 原始 2025 年的兆參數專家混合模型——Kimi K2 系列的基礎，K2.5 以 99.0 分創下開放權重 HumanEval 紀錄，K2.6 引入 Agent Swarm 編排。修改版 MIT 授權。

Kimi K2.5

Moonshot AI

Moonshot AI 於 2026 年 1 月推出的版本——首個多模態 Kimi 模型，在 K2 系列的 1T 參數專家混合架構上加入 MoonViT-3D 視覺編碼器。創下 99.0 的開放權重 HumanEval 紀錄，並引入了原始的 100 代理群（agent swarm）執行環境，K2.6 後續將其擴展至 300。

Kimi K2.6

Moonshot AI

Moonshot AI 於 2026 年 4 月發布：1 兆參數的專家混合模型，活躍參數 32B，原生支援視覺，並具備突出的 Agent Swarm 能力，可擴展至 300 個協同子代理、執行 4,000 個步驟，用於長視界的編程與研究任務。

Llama 3

Meta

Meta 的第三代開放權重大型語言模型家族，以 8B、70B 和 405B 三種參數配置，在推理、程式碼生成和多語言任務上提供頂尖效能。

Llama 4

Meta

Meta 的第四代開放權重模型家族，採用混合專家架構，Scout（總計 109B，活躍 17B）用於高效部署，Maverick（總計 400B，活躍 17B）用於高能力任務。

Scout 109B (17B active)Maverick 400B (17B active)

Magistral

Mistral AI

Mistral AI 的專用推理模型產品線——Magistral Medium 1.2（magistral-medium-2509）與 Magistral Small 1.2（magistral-small-2509）——專注於延伸的思維鏈能力，後續此產品線整併入 Mistral Small 4。

MiMo V2.5

Xiaomi

小米於 2026 年 4 月 28 日推出的中階模型——3100 億參數、150 億活躍參數的專家混合模型，採用 MIT 授權，與更大型的 MiMo V2.5 Pro 旗艦同步發布。是 MiMo 家族中可部署的中階選項，適合不需要完整 Pro 基礎架構的團隊。

MiMo V2.5 Pro

Xiaomi

小米於 2026 年 4 月發布的旗艦——1.02 兆參數的專家混合模型，活躍參數 42B，具備 100 萬 token 上下文，採用 MIT 授權，據報導在代理式編程任務上於 SWE-Bench Pro 勝過 Claude Opus 4.6。

MiniMax M2.5

MiniMax

MiniMax 的旗艦程式設計模型——目前在 SWE-Bench Verified 上以 80.2% 領先所有開放權重模型，專為代理式程式設計工作負載而設計。後續的 M2.7 持續延伸此產品線。

MiniMax M2.7

MiniMax

MiniMax 於 2026 年 3 月發布的自我演化版本——透過 100+ 輪自主強化學習改進，具備原生推理、205K 上下文，以及自主執行 30-50% RL 研究工作流程的能力。是 M2.5（先前 SWE-Bench Verified 領先者，80.2%）的後繼者。

Mistral 7B

Mistral AI

Mistral AI 的基礎 70 億參數模型，效能遠超其級別，採用滑動視窗注意力和分組查詢注意力實現高效的長上下文推論。

Mistral Small 4

Mistral AI

Mistral 於 2026 年 3 月推出的版本，將先前獨立的 Magistral（推理）、Devstral（程式設計代理）與 Mistral Small（指令微調）產品線統一為單一的 119B 專家混合模型，活躍參數為 6B，以 Apache 2.0 授權發布。

Mixtral

Mistral AI

Mistral AI 的混合專家模型，將每個 token 路由到 8 個專家網路中的 2 個，8x7B 變體以 13B 密集模型的成本提供 70B 級效能。

Nemotron 3 Nano Omni

NVIDIA

NVIDIA 於 2026 年 4 月 29 日發布的全模態版本——一個 300 億參數的專家混合模型，每個 token 約 3B 活躍參數，統一處理文字／視覺／音訊／影像，在影片工作負載上吞吐量為其他開源全模態模型的 9 倍，且僅需 25GB RAM 部署。發布時的生產採用者：Foxconn、Palantir、Oracle、DocuSign。

Neural Chat

Intel

Intel 基於 Mistral 7B 微調的 70 億參數對話模型，針對 Intel 硬體最佳化，展現強大的聊天效能，特別注重 CPU 推論效率。

OLMo

Allen AI

Allen Institute for AI 的完全開放語言模型家族，提供 1B、7B 和 13B 三種規格，完全公開訓練資料、程式碼、權重和評估——為可重現的 AI 研究樹立標準。

OpenChat

OpenChat

基於 Mistral 7B 微調的 70 億參數模型，使用條件強化學習微調（C-RLFT）技術，透過創新的混合品質資料訓練方法達到 GPT-3.5 級效能。

Phi-3

Microsoft

Microsoft 的緊湊型語言模型家族，提供 3.8B、7B 和 14B 三種規格，專為裝置端和邊緣部署設計，在推理和指令跟隨任務上展現令人驚豔的強勁效能。

Phi-4

Microsoft

Microsoft 的 140 億參數小型語言模型，透過合成資料訓練強調推理品質，在數學和邏輯基準測試上達到與數倍於其規格的模型相競爭的效能。

Qwen 2.5

Alibaba

阿里巴巴全面的開放權重模型家族，涵蓋從 0.5B 到 72B 的七種規格，具備特別強大的多語言和程式碼能力，支援 29 種以上語言。

Qwen 3

Alibaba

阿里巴巴的最新一代模型家族，同時提供密集和混合專家架構，規格從 0.6B 到 235B，具備內建的混合思考模式以實現自適應推理深度。

Qwen 3.5

Alibaba

阿里巴巴 2026 年 2 月旗艦推理版本——一個 397B-A17B 專家混合模型，目前在開放權重 GPQA Diamond 基準測試中以 88.4 分領先，並提供從 0.8B 到 122B-A10B 的同系列變體。Apache 2.0 授權。

Qwen 3.6

Alibaba

阿里巴巴於 2026 年 4 月發布的旗艦版本，結合了完全密集的 27B 變體（在程式編寫上勝過上一代 397B 推理模型）以及用於超高效推論的 35B-A3B 專家混合變體，全部以 Apache 2.0 授權發布。

Qwen3-Coder

Alibaba

阿里巴巴的專業程式碼模型產品線——包括 480B-A35B 的 Qwen3-Coder 旗艦（具備 256K-1M 上下文）以及 80B-A3B 的 Qwen3-Coder-Next，兩者皆原生為 Claude Code、Cline 與 Qwen Code 風格的代理式程式碼 CLI 設計。Apache 2.0 授權。

30B-A3B80B-A3B (Next)480B-A35B

Qwen3-Coder-Next

Alibaba

阿里巴巴於 2026 年 2 月推出的小巨人版本——一個 800 億參數的專家混合模型，每個 token 僅活躍 3B 參數，在程式設計基準上勝過 DeepSeek V3.2（37B 活躍）、Kimi K2.5 與 GLM-4.7（各 32B 活躍），同時激活的參數少 10 倍。Apache 2.0 授權，256K 上下文。

Qwen3-Omni

Alibaba

阿里巴巴的全模態模型——在單一 30B-A3B 專家混合檢查點中，接受文字、圖像、音訊與影片輸入，並產出文字加即時語音輸出。Apache 2.0 授權。

Qwen3.5-Omni

Alibaba

阿里巴巴於 2026 年 3 月 30 日發布的全模態版本——包含 Plus、Flash 與 Light 三個變體，支援 113 種語音輸入語言、256K 上下文（10 小時音訊或 400 秒 720p 影片），並在音訊基準上勝過 Gemini 3.1 Pro。是 Qwen3-Omni 在架構與能力上的後繼者。

Light (邊緣端)Flash (低延遲)Plus (旗艦)

SmolLM

HuggingFace

HuggingFace 的超緊湊語言模型家族，提供 135M、360M 和 1.7B 三種規格，使用高品質 Cosmopedia 合成資料集訓練，專為資源需求最低的裝置端 AI 應用而設計。

SOLAR

Upstage

Upstage 透過深度上擴展（depth up-scaling）這一新穎技術建立的 107 億參數模型，透過合併和擴展預訓練模型的層來以高效推論成本達到更大模型的品質。

StarCoder

BigCode / HuggingFace

使用寬鬆授權原始碼訓練的開放存取程式碼生成模型，提供 3B、7B 和 15B 三種規格，具備透明的訓練資料治理和強大的多語言程式設計支援。

StepFun Step-3.5-Flash

StepFun

StepFun 於 2026 年 2 月推出的小型巨人——擁有 1960 億參數、110 億活躍參數的專家混合模型，以小於 3-5 倍的規模在代理、推理和編碼基準測試上勝過 Kimi K2.5（1T）和 DeepSeek V3.2（671B）。Apache 2.0 授權，在 Hopper GPU 上於 128K 上下文下可達每秒 100 token。

Tencent Hy3 (Hunyuan 3) Preview

Tencent

Tencent 於 2026 年 4 月 23 日發布的回歸版本——一個 2,950 億參數的專家混合模型，具備 21B 活躍參數加上 3.8B 多 token 預測模組，由前 OpenAI 研究員 Shunyu Yao 領導下，在完成混元基礎設施完整重建後僅 90 天內打造完成。256K 上下文，並具備強大的數學、程式編寫與多語言表現。

295B-A21B + 3.8B MTP

TinyLlama

TinyLlama Team

緊湊的 11 億參數模型，使用 3 兆個 token 進行訓練——遠超其規格的典型資料量——為邊緣部署、行動應用和資源受限環境提供出人意料的強勁效能。

Vicuna

LMSYS

LMSYS 的指令微調模型家族，提供 7B、13B 和 33B 三種規格，基於 Llama 在 ShareGPT 對話上微調，因開創開源聊天機器人評估方法論而廣受認可。

xLAM

Salesforce AI Research

Salesforce 的開源權重 Large Action Model 家族——專門為規劃、呼叫工具與執行多步驟動作而訓練的小模型,在 vLLM、llama.cpp 與 Berkeley Function Calling Leaderboard 生態系中具備一級支援。

Yi

01.AI

01.AI 的中英雙語模型家族，提供 6B、9B 和 34B 三種規格，以在中英文基準測試上的強勁效能和出色的指令跟隨能力著稱。

Zephyr

HuggingFace

HuggingFace 基於 Mistral 7B 使用蒸餾直接偏好最佳化（dDPO）微調的 70 億參數模型，展示了對齊技術無需人類偏好資料也能產生高效的聊天模型。