為什麼中國實驗室如今主導開源 AI

如果在 2024 年初，你跟某個從事 AI 基礎設施工作的人說「兩年後，每一個主要智慧基準的開放權重前五名都會來自中國實驗室」，他大概會懷疑你。當時主導的開放權重名字是 Llama、Mistral 與 Falcon——Meta、一家法國新創、一家阿聯研究機構。DeepSeek 才剛釋出 V2；Qwen 2 還在浮現；Kimi 仍是 Moonshot 一個以中文為主、英語 AI 圈大致看不見的產品。

到了 2026 年 4 月，畫面已根本不同。目前的開放權重排行榜：

DeepSeek V4 Pro（BenchLM 87）
Kimi K2.6（BenchLM 86）
MiMo V2.5 Pro（小米，綜合分約 86）
GLM-5 / 5.1（Z.ai，BenchLM 83）
Qwen 3.5-397B-A17B（阿里巴巴，BenchLM 約 82）

前五名——其實前十名的多數——如今全是中國實驗室的釋出。Mistral Small 4、Hermes 4、Llama 4，以及 OpenAI 的 GPT-OSS，構成了非中國選項的頂層陣容，但差距在 2025-2026 年間持續擴大。

這不是偶然，也不是單季的離群值。這個格局反映的是中美 AI 發展之間，經過多年才浮現的策略性、結構性與經濟性差異。理解原因，對任何在 2026 年及以後做模型選擇決策的人都有幫助。

策略選擇：開放權重作為地緣槓桿

最重要的因素也是最簡單的：中國 AI 公司把開放權重釋出視為策略性優先事項，這一點美國 AI 公司普遍不一樣。背後的邏輯是地緣與經濟的。中國實驗室在封閉 API 的競爭上面臨結構性劣勢——它們不易服務西方企業客戶、面臨限制獲取前沿硬體的出口管制、也不像 OpenAI 與 Anthropic 那樣在全球企業買家中具備等量的品牌認知。

開放權重把這個槓桿翻轉過來。一家釋出最強開放權重模型的中國實驗室，會成為以下任一團隊的預設選擇：偏好自架部署、不能或不願使用美國專有 API，或需要對自家 AI 基礎設施擁有主權的團隊。這個模型會被全球部署——包括被評估自架替代方案的美國企業採用——而該實驗室將累積生態影響力，最終轉化為長期的市場地位。

美國 AI 公司的算盤恰好相反。OpenAI、Anthropic 與 Google 從封閉 API 賺取龐大營收，沒有太多誘因釋出會蠶食該營收的競爭力開放權重模型。例外情況——Meta 的 Llama 系列、OpenAI 在 2025 年 8 月的 GPT-OSS 釋出——之所以值得注意，正是因為它們是對美國主流策略的偏離，而非常態。

這不是任何一方的道德判斷。考量各自的競爭位置，兩種策略都合理。但這產生了一個結構性格局：中國實驗室更積極投資開放權重釋出、美國實驗室更積極投資封閉 API，而開放權重排行榜反映的就是這種努力分配。

經濟性格局：較低的訓練成本

第二個因素是訓練經濟性。DeepSeek 在 2024 年底發表的 V3 論文之所以引起轟動，正是因為該模型的訓練成本據稱僅是同級西方模型的一小部分——根據 DeepSeek 自述約 560 萬美元，而 GPT-4 等級訓練的估計值則在數億美元。成本結構的差異來自幾個來源：

工程效率。 中國實驗室一直被迫圍繞西方實驗室不必面對的限制做硬性最佳化。對先進 GPU 的出口管制意味著中國實驗室無法像西方前沿實驗室那樣，單純對問題堆硬體。架構創新——DeepSeek 的多頭潛在注意力（Multi-Head Latent Attention）、Qwen 的混合 MoE 設計、Kimi 的專家路由最佳化——部分都是針對西方實驗室不必設法繞過的硬體限制所做的回應。

訓練資料策展。 中國實驗室通常重金投入策展性的合成資料生成，而非主要依賴公開網路資料。累積效應是更高效的訓練：每個 token 的訊號更強、重複更少、資料品質更高。西方實驗室也在做這件事，但中國實驗室相對於總訓練預算的邊際投入更高。

較低的算力機會成本。 西方前沿實驗室執行一次 2 億美元的訓練，等於放棄了原本可服務付費 API 客戶的 2 億美元算力。中國實驗室面對的是不同的算力經濟——本土的中國雲端與晶片生態、政府支持的基礎設施投資，以及更低的實驗性訓練機會成本。這讓積極實驗的期望值成本更便宜。

結果是中國實驗室每單位投入推出更多模型釋出、迭代更快，且能負擔釋出中間檢查點，而西方實驗室會視這些檢查點為太有價值而不願贈送。Qwen、DeepSeek 與 Kimi 在 2025-2026 年間維持的釋出節奏，西方實驗室在開放權重類別中根本跟不上。

結構性優勢：本土算力技術棧

第三個因素是中國本土 AI 算力技術棧的成熟。在 2025-2026 年間，中國晶片發展——華為 Ascend、競爭力日增的本土替代品，以及圍繞它們日益成熟的軟體棧——已達到不必主要依賴 NVIDIA 硬體即可進行前沿規模訓練的程度。

由 Z.ai 在 2026 年 2 月釋出的 GLM-5，據報導是在 8 張華為 Ascend H20 晶片上訓練出來的。這不只是個獵奇——這是首個有文件記載、在非 NVIDIA 基礎設施上完成訓練的前沿規模開放權重模型。其影響相當實際：能在本土硬體上訓練並服務前沿模型的中國實驗室，擁有一條美國出口管制限制不易輕易擾亂的前進路線。

對於中國以外的部署團隊，這影響沒那麼直接。但這意味著「中國開放權重釋出可能因出口管制或晶片取得而突然中斷」的結構性風險已經降低。2026 年的中國開放權重生態系比 2024 年更具韌性，且發展軌跡是朝向「更不依賴西方算力供應鏈」，而非更依賴。

人才模式：不同的職涯路徑

中國 AI 研究員的勞動市場與美國根本不同。在美國，頂尖 AI 研究員面對的是由前沿實驗室（OpenAI、Anthropic、Google DeepMind）加上資金充裕的新創生態主導的競爭市場。薪資期待極高；研究員通常期待大量現金薪酬或大量股權上漲空間。

在中國，市場結構則不同。頂尖 AI 人才流經較少數的公司（阿里巴巴、騰訊、ByteDance，以及 DeepSeek、Moonshot、Z.ai 等主要 AI 新創），絕對薪資天花板較低——雖然購買力與生活方式考量讓比較不像表面數字那麼乾淨。結果是中國 AI 實驗室能以西方前沿實驗室無法負擔（在等量品質下）的總薪酬成本，組建出大型研究團隊。

加上對開放發表態度的文化差異（中國 AI 實驗室通常比西方前沿實驗室更積極發表，部分是為了國際能見度），這形成了一個邊際開放權重釋出成本比美國更低的研究生態。一家中國實驗室釋出前沿開放權重模型，平均而言研究員們把開放發表視為其工作正常預期的產出——而不是放棄競爭優勢的犧牲。

含意：一個持續性的格局

自然會有人問：這是暫時的領先，還是結構性的格局？我們的解讀是，至少在未來幾年是結構性的。策略一致（開放權重作為地緣槓桿）、經濟結構（更低的訓練與人力成本）、基礎設施獨立（發展中的本土算力棧）、文化模式（更積極的開放發表）這些組合，會形成不會在任何單一產品週期反轉的持續性優勢。

美國 AI 公司不太可能突然開始釋出會蠶食其封閉 API 營收的競爭力開放權重模型。OpenAI 在 2025 年 8 月的 GPT-OSS 釋出是一個值得注意的偏離，但被刻意定位為次前沿釋出，而非具競爭力的開放權重旗艦。Meta 的 Llama 4 反應好壞參半、Behemoth 已暫停。產生目前中國實驗室主導的結構性條件並未反轉。

對於在 2026 年做基礎設施決策的團隊，這個格局有實際的含意。建構一個依賴美國開發開放權重模型保持競爭力的部署策略，風險日益增加。未來 24 個月的基準情境是中國實驗室開放權重釋出持續主導排行榜，間或出現 Mistral（在歐洲）、Nous Research（以 Hermes 風格的可引導微調）以及 GPT-OSS 這類值得注意的美國釋出做出競爭性回應，但整體生態位置不會出現持續性的轉移。

這對生產部署代表什麼

對多數團隊的實務答案：習慣把中國實驗室的開放權重模型作為主要基礎設施選項。授權普遍允許商用（多數現役旗艦為 Apache 2.0 或同等授權）、部署基礎設施（vLLM、Ollama、llama.cpp、TensorRT-LLM）將其支援為一級選項，而模型品質在所有有排行榜資料的參數規模上，都確實優於西方替代方案。

在特定情境下偏好非中國替代方案有合理理由：監管限制（部分產業基於合規不能使用中國開發的模型）、資料主權偏好（歐洲部署因為歐盟定位常選擇 Mistral），或刻意納入非中國選項的供應鏈分散策略。這些都是有效的考量，且會持續驅動相當比例的部署決策朝向 Mistral、Hermes 4，以及類似的非中國選項。

但預設值——當沒有特定結構性原因把你推往別處時你選的模型——在 2026 年大概應該是中國實驗室的開放權重選項。多數生產部署選 Qwen 3.6、多 GPU 伺服器部署選 DeepSeek V4、長時程代理工作負載選 Kimi K2.6、代理化編碼選 MiMo V2.5 Pro。產生這個領先的結構性條件短期內不會反轉，把基礎設施對齊到這個現實，產出的結果會比和它對抗來得更好。

結語

西方 AI 評論圈傾向把中國實驗室主導框架為令人警覺、或地緣顧慮的證據。我們不這麼看。開放權重釋出——無論來源——讓 AI 基礎設施對更廣泛的部署團隊可用，這比僅有封閉 API 的格局所形成的生態更健康、更具韌性，遠勝於由少數美國專有提供者主導的格局。

2026 年最強開放權重模型恰好來自中國實驗室，是當下時刻特定策略與經濟動態的結果。這不是生態系的永久特徵。但對於今日做部署決策的團隊，務實的指引很清楚：最佳的開放權重選項是中國實驗室的釋出、授權支援商業部署，把基礎設施策略對齊這個現實所產生的結果，會比等待美國實驗室追上來得更好。它們大概不會追上，至少在開放權重這條軸線上不會。

為什麼中國實驗室如今主導開源 AI

策略選擇：開放權重作為地緣槓桿

經濟性格局：較低的訓練成本

結構性優勢：本土算力技術棧

人才模式：不同的職涯路徑

含意：一個持續性的格局

這對生產部署代表什麼

結語

Ship AI that runs on your users' devices.

Keep reading

The 2026 Open Source AI Model Landscape

Mixture of Experts in 2026: From Mixtral to DeepSeek V4

Open-Source Models for OpenClaw: Llama 3, Qwen 2.5, and Which to Fine-Tune