Hermes 4
拒答模式: 極少(設計使然)
Nous Research 的 Hermes 4 是合理用途遭 主流安全訓練阻擋時最明確的選擇。該模型明確採取「中性對齊」立場——Nous 刻意避免施加重手的 RLHF 拒答訓練,產生一個不會出現當代他款模型常見過度拒答模式、能夠遵循指令的微調版本。Hermes 4 以 Llama 3.1 為基礎,並透過 Atropos RL 後訓練搭配約 1,000 個任務專屬驗證器,在對齊取向之外亦展現強大的推理能力。對於資安研究、紅隊評估、成熟向創意寫作以及涉及敏感議題的教育內容,Hermes 4 是出色之選。
Strengths
- 明確中性對齊——無重手拒答訓練
- Atropos RL 後訓練帶來強勁推理能力
- 混合 <think> 推理模式可彈性調整深度
- 繼承 Llama 3.1 的部署生態系
Trade-offs
- 繼承 Llama Community License 條款(非 Apache)
- 最小版本為 14B(無 8B 選項)
- 面向消費者的應用需搭配產品層級的安全控管