近期,百度宣布了一項重大決策,計劃在未來數月內推出其文心大模型的最新版本——4.5系列,并定于6月30日正式向公眾開放源代碼。這一消息引發了業界的廣泛關注。

百度此次決定開源文心大模型,背后有著深刻的行業背景。近年來,DeepSeek作為一股新興力量迅速崛起,給百度等AI巨頭帶來了不小的挑戰。DeepSeek的旗艦產品——DeepSeek V3,憑借其高達6710億參數的規模、創新的MoE架構,以及每秒60個Token的處理速度,在知識類任務、數學競賽等多個領域展現出了卓越的性能。DeepSeek還通過強化學習、知識蒸餾等先進技術,不斷提升模型的效能。

更為重要的是,DeepSeek選擇了開源之路,將其模型和技術論文全面公開。這一舉措極大地激發了開發者的創新熱情,使得基于DeepSeek技術的各種新應用、新服務如雨后春筍般涌現。相比之下,那些仍然堅持閉源的大模型顯得愈發捉襟見肘,難以跟上開源社區快速發展的步伐。

有趣的是,百度此次開源決策與其創始人李彥宏此前的言論形成了鮮明對比。在2024年4月的Create 2024百度AI開發者大會上,李彥宏曾表示:“在大模型場景下,開源實際上是最昂貴的選擇。因此,開源模型往往會逐漸落后。”然而,面對DeepSeek的強勁勢頭和開源生態的蓬勃發展,百度不得不調整策略,選擇開源其最新的文心大模型。這一轉變無疑是對當前AI行業發展趨勢的一種深刻反思和積極應對。












