智東西(公眾號:zhidxcom)
作者 | 王涵
編輯 | 漠影

智東西9月9日報道,今天上午,在百度Wave Summit深度學習開發者大會上,百度正式發布深度思考模型文心大模型X1.1、大模型開發框架飛槳框架V3.2、智能代碼助手文心快碼3.5S以及一系列開發組件更新。

相比于深度思考模型文心X1,文心大模型X1.1的事實性能力提升34.8%,指令遵循能力提升12.5%,智能體能力提升9.6%,在多項基準測試中超越DeepSeek-R1-0528

百度最強深度思考模型來了!性能追平GPT-5

目前,用(yong)戶可以在文心一(yi)言官網(wang)、文小言APP使用(yong)文心大模型X1.1。文心大模型X1.1已正(zheng)式上線百度智能(neng)云(yun)千帆(fan)平(ping)臺,對企業(ye)客戶及開(kai)發者全面開(kai)放(fang)使用(yong)。

一、超越DeepSeek,對標GPT-5!百度文心大模型X1.1多項基準測試獲SOTA

會(hui)上,百(bai)度(du)(du)(du)首席技(ji)(ji)術(shu)官、深度(du)(du)(du)學習技(ji)(ji)術(shu)及應用(yong)國家工程研究中心主(zhu)任王海峰正(zheng)式發布了文心大模(mo)型X1.1深度(du)(du)(du)思考模(mo)型。

據王海峰分享,文心大模型X1是基于文心大模型4.5訓練而來的深度思考模型,相比文心X1,文心大模型X1.1的事實性提升34.8%,指令遵循能力提升12.5%,智能體能力提升9.6%

在權威基準評測中,文心大模型X1.1在多個任務上超越DeepSeek-R1-0528,取得第一名的成績。同時,與(yu)國際頂尖模型GPT-5和Gemini 2.5 Pro相比,效(xiao)果基(ji)本持平。

百度最強深度思考模型來了!性能追平GPT-5

文心大模(mo)型X1.1主要采(cai)用了迭(die)代式混合(he)強化學(xue)習訓練框架,一(yi)方(fang)面(mian)通過混合(he)強化學(xue)習,同時(shi)提升通用任務(wu)(wu)和智能體任務(wu)(wu)的效(xiao)果;另一(yi)方(fang)面(mian)通過自蒸餾數據的迭(die)代式生(sheng)產(chan)及訓練,不斷提升模(mo)型整(zheng)體效(xiao)果。

在客服場景,文心大模型(xing)X1.1可以識別用戶客訴的情緒和(he)需求,通(tong)過思考和(he)調(diao)用后臺多(duo)個工具,自(zi)動完成客訴處(chu)理的服務流程。

基于文心大模型X1.1的基礎,百度開發劇本驅動多模協同的數字人技術,可(ke)以通過(guo)大語言模型(xing)生成(cheng)劇本(ben),驅動語音(yin)語調和數(shu)字人的形(xing)(xing)象,最終形(xing)(xing)成(cheng)完善的數(shu)字人。

百度最強深度思考模型來了!性能追平GPT-5

百(bai)度(du)(du)集團副總裁、深(shen)度(du)(du)學(xue)習技術(shu)應用(yong)及國家工(gong)程研究中心副主任吳甜透露,今年(nian)6月15日(ri),在(zai)百(bai)度(du)(du)電(dian)商平臺,羅(luo)永浩數字人直播(bo)的GMV已(yi)經超過其(qi)本人直播(bo)的GMV表現。

數字人主播的問答轉化率問答接待率都可以超越真人,其超長待機能力在70分鐘以上的場直播中優勢明顯。

百度最強深度思考模型來了!性能追平GPT-5

二、飛槳文心生態開發者超2千萬,百度內部45%新代碼由AI生成

文心(xin)大模型的能力拓展和效率提(ti)升,得(de)益于飛槳文心(xin)的聯合優化。

大會現場,百度發布了飛槳核心框架3.2版本,該版本(ben)在大模型(xing)訓練(lian)、硬件適配(pei)和生態支持上全面(mian)升(sheng)級。

百度最強深度思考模型來了!性能追平GPT-5

百度飛槳同步升級了大模型開發套件ERNIEKit高效部署套件FastDeploy,還發布了AI科學套件,包括智能流體力學開發套件和智能材料科學開發套件,以及大規模計算圖數據集GraphNet

據最新數據披露,飛槳文心生態開發者達到2333萬位,服務企業達到76萬家

百度最強深度思考模型來了!性能追平GPT-5

AI編程方面,百度還發布了文心快碼3.5S,新版本的代碼生成準確率提升26%,其中復雜場景提升38%。可(ke)以駕馭更復雜的任(ren)務。

據悉,目前,百度中有45%的新增代碼是AI生成的,文心快碼已累計服務超過1000萬位開發者上千家企業。

結語:飛槳文心聯合優化,降低開發與技術落地門檻

飛槳與(yu)文心(xin)的(de)(de)(de)深度聯合優化,持續推(tui)動著文心(xin)大模型能力的(de)(de)(de)拓展(zhan)與(yu)效(xiao)率的(de)(de)(de)提(ti)高。文心(xin)快碼3.5S的(de)(de)(de)發(fa)布(bu)進一(yi)步降低了(le)AI編(bian)程(cheng)的(de)(de)(de)門檻,為(wei)開發(fa)者與(yu)企業帶來了(le)高效(xiao)且(qie)強大的(de)(de)(de)工具。

在產業(ye)(ye)落地(di)層面,無論是數字人直播還是文心快(kuai)碼的落地(di),這些(xie)實(shi)踐(jian)為AI與實(shi)體(ti)(ti)經濟融合提(ti)供了具體(ti)(ti)參考路(lu)徑,在電商、編程開(kai)發等領(ling)域對行業(ye)(ye)智能化(hua)轉型(xing)產生(sheng)了實(shi)際影響。