智東西(公眾號:zhidxcom)
作者 | 王涵
編輯 | 漠影

智東西8月4日報道,今天,騰訊混元一口氣開源4款小尺寸模型,參數分別為0.5B、1.8B、4B、7B,消費級顯卡即可運行

在(zai)(zai)性能上,Hunyuan 7B在(zai)(zai)不僅在(zai)(zai)數學能力上超(chao)越(yue)了OpenAI o1-mini和Qwen 3-8B,在(zai)(zai)除IFEVal榜單外,均超(chao)越(yue)OpenAI o1-mini。

模型(xing)原生上下(xia)文256k,可(ke)以(yi)一次讀完3本《哈利(li)波特》。目前已在(zai)微信讀書、騰訊會議等多個騰訊應用中落地。

這4款小尺寸模型單卡就可以部署,適用于筆記本電腦、手機、智能座艙、智能家居等低功耗場景,且支持垂直領域低成本微調(diao)

目前,4個模型均在Github和Hugging Face等(deng)開源社區上線,Arm、高通(tong)、Intel、聯(lian)發(fa)科技等(deng)多個(ge)消費級終端(duan)芯片平臺也都宣(xuan)布支持部署(shu)。

騰訊一口氣開源4款模型!最小僅0.5B,增強agent能力,手機就能跑

騰訊混元官(guan)網體驗地址(zhi)://hunyuan.tencent.com/

Github地(di)址://github.com/Tencent-Hunyuan

Hugging Face地(di)址(zhi)://huggingface.co/tencent

一、數學能力超越Qwen3-8B,能一口氣讀3本《哈利波特》

騰訊新開源的4個模型屬于融合推理模型,并且具(ju)備(bei)快(kuai)思(si)考(kao)(kao)和(he)慢(man)思(si)考(kao)(kao)兩種(zhong)模(mo)式。其中快(kuai)思(si)考(kao)(kao)模(mo)式提供(gong)簡潔、高效的(de)輸(shu)出;而慢(man)思(si)考(kao)(kao)涉及(ji)解決復雜問題,具(ju)備(bei)更全面的(de)推理步驟。

效果上,4個模型均實現了跟業界同尺寸模型的對標,其中Hunyuan 7B在數學推理測試DROP上取得85.9分的成績,在AIME2024和AIME2025兩個數學榜單上得分分別為81.1分和75.3分,均排名第一超過OpenAI o1-miniQwen3-8B

騰訊一口氣開源4款模型!最小僅0.5B,增強agent能力,手機就能跑

對比Hunyuan 0.5B、1.8B和4B,在推(tui)理(li)能(neng)力BBH測評中,1.8B的模型的成績只與(yu)4B的成績相(xiang)差0.9分,推(tui)理(li)能(neng)力不相(xiang)上下(xia)。

騰訊一口氣開源4款模型!最小僅0.5B,增強agent能力,手機就能跑

這四(si)個模型(xing)的亮(liang)點在(zai)于agent和長文能力,跟此(ci)前開(kai)源的Hunyuan-A13B模型(xing)一(yi)樣(yang),騰訊團隊在(zai)技術上通過數(shu)據構建和強化學習獎(jiang)勵信號設計(ji),提升了模型(xing)在(zai)任務規劃(hua)、工具調用和復雜(za)決策以及反思(si)等agent能力上的表(biao)現,讓模型(xing)實際應用中可以更好地(di)完成深(shen)度搜索、Excel操作、旅行(xing)攻略規劃(hua)等任務。

此外,模型原生長上下文窗口達到了256k,意味著模型可以一次性記住并處理相當于40萬中文漢字或50萬英文單詞的超長內容,相當于一口氣讀完3本《哈利波特》,并且能記(ji)住所有人(ren)物關系、劇情細節,還能根據這些內(nei)容討論后續故(gu)事(shi)發展。

部署上,4個模型均只需單卡即可部署,部分PC、手機、平(ping)板(ban)等設備可(ke)直接接入。并且,模型(xing)具有較強的開放性(xing),主流(liu)推理框架(例如,SGLang,vLLM and TensorRT-LLM)和多(duo)種(zhong)量化格式均能夠支(zhi)持。

二、已應用到微信讀書、智能座艙和金融AI助手

應用層(ceng)面,這4款(kuan)小尺寸模型都(dou)能夠(gou)滿足從端(duan)側到云(yun)端(duan)、從通用到專業的多樣化需求(qiu),并(bing)且(qie)已(yi)經在騰訊多個業務中應用。

例如,依托模(mo)型原(yuan)生的超(chao)長上(shang)下文能力(li),騰訊會議AI小助手、微信讀書AI問書AI助手均實(shi)現對完整會議內(nei)容、整本書籍的一次性(xing)理解和(he)處理。

在端側應用上,騰訊(xun)手機(ji)管家(jia)利(li)用小尺寸模型(xing)提升垃圾(ji)短信識別準確率,實現毫秒(miao)級攔(lan)截,保護(hu)用戶隱(yin)私;騰訊(xun)智能座艙助手通過(guo)雙模型(xing)協作架(jia)構解決車載環境痛(tong)點,充分發(fa)揮模型(xing)低功耗、高效推理(li)的特(te)性。

在(zai)高并發場景中,搜狗輸入(ru)(ru)法(fa)基(ji)于模型(xing)的多模態聯合訓(xun)練機制使嘈雜(za)環境下提升識別準確率;騰(teng)訊地圖(tu)采用(yong)(yong)多模型(xing)架構,利用(yong)(yong)意圖(tu)分類和推理能力提升了用(yong)(yong)戶交(jiao)互體驗;微(wei)信輸入(ru)(ru)法(fa)「問(wen)AI」基(ji)于模型(xing)實現輸入(ru)(ru)框與AI即(ji)問(wen)即(ji)答的無縫銜(xian)接。

在(zai)(zai)垂直行業應(ying)用中(zhong),金融AI助手通過(guo)Prompt優(you)化和少量數據微調實現超95%意圖識別準確率。依托模(mo)型的理解(jie)能力,騰(teng)訊游戲翻譯(yi)和QQ飛車手游NPC,在(zai)(zai)多語言理解(jie)能力、方(fang)言翻譯(yi)和智(zhi)能對(dui)話方(fang)面,有明顯(xian)優(you)化,這些能力在(zai)(zai)專業客服、內容出海以及電(dian)商直播(bo)等場景有較大應(ying)用潛力。

三、騰訊開源活躍,覆蓋多模態

最近(jin),全球開源(yuan)領域異常熱鬧,中國大(da)模型表現搶眼(yan)。騰訊混(hun)元大(da)語言模型也在持續推進開源(yuan),其開源(yuan)模型已覆(fu)蓋文本、圖像、視頻和3D生成等多個模態。

在(zai)(zai)大(da)語言(yan)模型領(ling)域,騰訊(xun)混(hun)元此前陸續開(kai)源了激活參(can)數量(liang)達(da)52B的Hunyuan large和混(hun)合推理MoE(混(hun)合專家)模型Hunyuan-A13B,這些模型憑借(jie)架(jia)構上的創新以及在(zai)(zai)性能和效(xiao)果上的不錯(cuo)表現,在(zai)(zai)開(kai)源社區受到廣泛關注。

多(duo)模(mo)態方面,混元還(huan)開(kai)放了完(wan)整多(duo)模(mo)態生(sheng)(sheng)成能(neng)力(li)(li)及工具集(ji)插件,陸續(xu)開(kai)源了文生(sheng)(sheng)圖、視頻生(sheng)(sheng)成和3D生(sheng)(sheng)成能(neng)力(li)(li),提(ti)供接近商業(ye)模(mo)型(xing)性能(neng)的開(kai)源基座,方便社區基于業(ye)務和使(shi)用場景(jing)定制,圖像、視頻衍生(sheng)(sheng)模(mo)型(xing)數(shu)量達到3000個。

上周,騰訊發布(bu)(bu)并開源(yuan)混元3D世(shi)界模型(xing)1.0,這一(yi)(yi)模型(xing)一(yi)(yi)經發布(bu)(bu)即迅速(su)登上Hugging Face趨勢榜(bang)(bang)第二,下載量(liang)飆到(dao)近9k,混元3D世(shi)界模型(xing)技術報告(gao)還拿下了Hugging Face論(lun)文熱榜(bang)(bang)第一(yi)(yi)。

結語:騰訊開源、應用兩手抓

當(dang)前全球(qiu)AI開(kai)源生態持續(xu)升溫,各大(da)科技公司(si)都在加碼模(mo)型開(kai)源,騰訊此次動作是其(qi)開(kai)源戰略(lve)的(de)延(yan)續(xu)。

騰訊混元(yuan)此次(ci)開源4款(kuan)小(xiao)尺寸模型,覆蓋了(le)從(cong)0.5B到(dao)7B的(de)參數范(fan)圍,為(wei)不(bu)同算力需求的(de)場(chang)景提(ti)供(gong)了(le)適(shi)配方案,為(wei)AI開發者社(she)區提(ti)供(gong)了(le)更多(duo)選擇。