月之暗面發布萬億參數開源模型Kimi K2,多位研發工程師在知乎“親自答”
7月11日晚,國內大模型獨角獸月之暗面正式發布并開源了其最新一代MoE架構基礎模型Kimi K2,總參數量達到1萬億(1T),Kimi內部則將K2研發群戲稱為“接生群”。多位參與“接生”的Kimi研發人員隨后在知乎展開“親自答”,從多個角度深入講述了其背后研發歷程。作為月之暗面 Infra側推理方面研發人員,知乎答主劉少偉稱K2模型是在DeepSeek V3結構的框架之下,如何選擇合適的參數,使得模型在訓練、推理成本與v3相當的前提下,獲得明顯更低的loss。
下載投資界APP