Back to blog
    為什麼中國實驗室如今主導開源 AI
    industryopen-sourceqwendeepseekkimichinaanalysis

    為什麼中國實驗室如今主導開源 AI

    到了 2026 年 4 月,中國實驗室在綜合智慧基準上拿下開放權重模型的前五名。這個格局並非偶然——它反映的是中美 AI 發展之間,經過多年才顯現的策略性、結構性與經濟性差異。

    EErtas Team·

    如果在 2024 年初,你跟某個從事 AI 基礎設施工作的人說「兩年後,每一個主要智慧基準的開放權重前五名都會來自中國實驗室」,他大概會懷疑你。當時主導的開放權重名字是 Llama、Mistral 與 Falcon——Meta、一家法國新創、一家阿聯研究機構。DeepSeek 才剛釋出 V2;Qwen 2 還在浮現;Kimi 仍是 Moonshot 一個以中文為主、英語 AI 圈大致看不見的產品。

    到了 2026 年 4 月,畫面已根本不同。目前的開放權重排行榜:

    • DeepSeek V4 Pro(BenchLM 87)
    • Kimi K2.6(BenchLM 86)
    • MiMo V2.5 Pro(小米,綜合分約 86)
    • GLM-5 / 5.1(Z.ai,BenchLM 83)
    • Qwen 3.5-397B-A17B(阿里巴巴,BenchLM 約 82)

    前五名——其實前十名的多數——如今全是中國實驗室的釋出。Mistral Small 4、Hermes 4、Llama 4,以及 OpenAI 的 GPT-OSS,構成了非中國選項的頂層陣容,但差距在 2025-2026 年間持續擴大。

    這不是偶然,也不是單季的離群值。這個格局反映的是中美 AI 發展之間,經過多年才浮現的策略性、結構性與經濟性差異。理解原因,對任何在 2026 年及以後做模型選擇決策的人都有幫助。

    策略選擇:開放權重作為地緣槓桿

    最重要的因素也是最簡單的:中國 AI 公司把開放權重釋出視為策略性優先事項,這一點美國 AI 公司普遍不一樣。背後的邏輯是地緣與經濟的。中國實驗室在封閉 API 的競爭上面臨結構性劣勢——它們不易服務西方企業客戶、面臨限制獲取前沿硬體的出口管制、也不像 OpenAI 與 Anthropic 那樣在全球企業買家中具備等量的品牌認知。

    開放權重把這個槓桿翻轉過來。一家釋出最強開放權重模型的中國實驗室,會成為以下任一團隊的預設選擇:偏好自架部署、不能或不願使用美國專有 API,或需要對自家 AI 基礎設施擁有主權的團隊。這個模型會被全球部署——包括被評估自架替代方案的美國企業採用——而該實驗室將累積生態影響力,最終轉化為長期的市場地位。

    美國 AI 公司的算盤恰好相反。OpenAI、Anthropic 與 Google 從封閉 API 賺取龐大營收,沒有太多誘因釋出會蠶食該營收的競爭力開放權重模型。例外情況——Meta 的 Llama 系列、OpenAI 在 2025 年 8 月的 GPT-OSS 釋出——之所以值得注意,正是因為它們是對美國主流策略的偏離,而非常態。

    這不是任何一方的道德判斷。考量各自的競爭位置,兩種策略都合理。但這產生了一個結構性格局:中國實驗室更積極投資開放權重釋出、美國實驗室更積極投資封閉 API,而開放權重排行榜反映的就是這種努力分配。

    經濟性格局:較低的訓練成本

    第二個因素是訓練經濟性。DeepSeek 在 2024 年底發表的 V3 論文之所以引起轟動,正是因為該模型的訓練成本據稱僅是同級西方模型的一小部分——根據 DeepSeek 自述約 560 萬美元,而 GPT-4 等級訓練的估計值則在數億美元。成本結構的差異來自幾個來源:

    工程效率。 中國實驗室一直被迫圍繞西方實驗室不必面對的限制做硬性最佳化。對先進 GPU 的出口管制意味著中國實驗室無法像西方前沿實驗室那樣,單純對問題堆硬體。架構創新——DeepSeek 的多頭潛在注意力(Multi-Head Latent Attention)、Qwen 的混合 MoE 設計、Kimi 的專家路由最佳化——部分都是針對西方實驗室不必設法繞過的硬體限制所做的回應。

    訓練資料策展。 中國實驗室通常重金投入策展性的合成資料生成,而非主要依賴公開網路資料。累積效應是更高效的訓練:每個 token 的訊號更強、重複更少、資料品質更高。西方實驗室也在做這件事,但中國實驗室相對於總訓練預算的邊際投入更高。

    較低的算力機會成本。 西方前沿實驗室執行一次 2 億美元的訓練,等於放棄了原本可服務付費 API 客戶的 2 億美元算力。中國實驗室面對的是不同的算力經濟——本土的中國雲端與晶片生態、政府支持的基礎設施投資,以及更低的實驗性訓練機會成本。這讓積極實驗的期望值成本更便宜。

    結果是中國實驗室每單位投入推出更多模型釋出、迭代更快,且能負擔釋出中間檢查點,而西方實驗室會視這些檢查點為太有價值而不願贈送。Qwen、DeepSeek 與 Kimi 在 2025-2026 年間維持的釋出節奏,西方實驗室在開放權重類別中根本跟不上。

    結構性優勢:本土算力技術棧

    第三個因素是中國本土 AI 算力技術棧的成熟。在 2025-2026 年間,中國晶片發展——華為 Ascend、競爭力日增的本土替代品,以及圍繞它們日益成熟的軟體棧——已達到不必主要依賴 NVIDIA 硬體即可進行前沿規模訓練的程度。

    由 Z.ai 在 2026 年 2 月釋出的 GLM-5,據報導是在 8 張華為 Ascend H20 晶片上訓練出來的。這不只是個獵奇——這是首個有文件記載、在非 NVIDIA 基礎設施上完成訓練的前沿規模開放權重模型。其影響相當實際:能在本土硬體上訓練並服務前沿模型的中國實驗室,擁有一條美國出口管制限制不易輕易擾亂的前進路線。

    對於中國以外的部署團隊,這影響沒那麼直接。但這意味著「中國開放權重釋出可能因出口管制或晶片取得而突然中斷」的結構性風險已經降低。2026 年的中國開放權重生態系比 2024 年更具韌性,且發展軌跡是朝向「更不依賴西方算力供應鏈」,而非更依賴。

    人才模式:不同的職涯路徑

    中國 AI 研究員的勞動市場與美國根本不同。在美國,頂尖 AI 研究員面對的是由前沿實驗室(OpenAI、Anthropic、Google DeepMind)加上資金充裕的新創生態主導的競爭市場。薪資期待極高;研究員通常期待大量現金薪酬或大量股權上漲空間。

    在中國,市場結構則不同。頂尖 AI 人才流經較少數的公司(阿里巴巴、騰訊、ByteDance,以及 DeepSeek、Moonshot、Z.ai 等主要 AI 新創),絕對薪資天花板較低——雖然購買力與生活方式考量讓比較不像表面數字那麼乾淨。結果是中國 AI 實驗室能以西方前沿實驗室無法負擔(在等量品質下)的總薪酬成本,組建出大型研究團隊。

    加上對開放發表態度的文化差異(中國 AI 實驗室通常比西方前沿實驗室更積極發表,部分是為了國際能見度),這形成了一個邊際開放權重釋出成本比美國更低的研究生態。一家中國實驗室釋出前沿開放權重模型,平均而言研究員們把開放發表視為其工作正常預期的產出——而不是放棄競爭優勢的犧牲。

    含意:一個持續性的格局

    自然會有人問:這是暫時的領先,還是結構性的格局?我們的解讀是,至少在未來幾年是結構性的。策略一致(開放權重作為地緣槓桿)、經濟結構(更低的訓練與人力成本)、基礎設施獨立(發展中的本土算力棧)、文化模式(更積極的開放發表)這些組合,會形成不會在任何單一產品週期反轉的持續性優勢。

    美國 AI 公司不太可能突然開始釋出會蠶食其封閉 API 營收的競爭力開放權重模型。OpenAI 在 2025 年 8 月的 GPT-OSS 釋出是一個值得注意的偏離,但被刻意定位為次前沿釋出,而非具競爭力的開放權重旗艦。Meta 的 Llama 4 反應好壞參半、Behemoth 已暫停。產生目前中國實驗室主導的結構性條件並未反轉。

    對於在 2026 年做基礎設施決策的團隊,這個格局有實際的含意。建構一個依賴美國開發開放權重模型保持競爭力的部署策略,風險日益增加。未來 24 個月的基準情境是中國實驗室開放權重釋出持續主導排行榜,間或出現 Mistral(在歐洲)、Nous Research(以 Hermes 風格的可引導微調)以及 GPT-OSS 這類值得注意的美國釋出做出競爭性回應,但整體生態位置不會出現持續性的轉移。

    這對生產部署代表什麼

    對多數團隊的實務答案:習慣把中國實驗室的開放權重模型作為主要基礎設施選項。授權普遍允許商用(多數現役旗艦為 Apache 2.0 或同等授權)、部署基礎設施(vLLM、Ollama、llama.cpp、TensorRT-LLM)將其支援為一級選項,而模型品質在所有有排行榜資料的參數規模上,都確實優於西方替代方案。

    在特定情境下偏好非中國替代方案有合理理由:監管限制(部分產業基於合規不能使用中國開發的模型)、資料主權偏好(歐洲部署因為歐盟定位常選擇 Mistral),或刻意納入非中國選項的供應鏈分散策略。這些都是有效的考量,且會持續驅動相當比例的部署決策朝向 Mistral、Hermes 4,以及類似的非中國選項。

    但預設值——當沒有特定結構性原因把你推往別處時你選的模型——在 2026 年大概應該是中國實驗室的開放權重選項。多數生產部署選 Qwen 3.6、多 GPU 伺服器部署選 DeepSeek V4、長時程代理工作負載選 Kimi K2.6、代理化編碼選 MiMo V2.5 Pro。產生這個領先的結構性條件短期內不會反轉,把基礎設施對齊到這個現實,產出的結果會比和它對抗來得更好。

    結語

    西方 AI 評論圈傾向把中國實驗室主導框架為令人警覺、或地緣顧慮的證據。我們不這麼看。開放權重釋出——無論來源——讓 AI 基礎設施對更廣泛的部署團隊可用,這比僅有封閉 API 的格局所形成的生態更健康、更具韌性,遠勝於由少數美國專有提供者主導的格局。

    2026 年最強開放權重模型恰好來自中國實驗室,是當下時刻特定策略與經濟動態的結果。這不是生態系的永久特徵。但對於今日做部署決策的團隊,務實的指引很清楚:最佳的開放權重選項是中國實驗室的釋出、授權支援商業部署,把基礎設施策略對齊這個現實所產生的結果,會比等待美國實驗室追上來得更好。它們大概不會追上,至少在開放權重這條軸線上不會。

    Ship AI that runs on your users' devices.

    Early bird pricing starts at $14.50/mo — locked in for life. Plans for builders and agencies.

    Keep reading