咨詢電話(微信同號)
18905829229

阿里凌晨開源新模型:性能對標DeepSeek-R1,股票強勢走強。

來源:網(wǎng)絡(luò)轉(zhuǎn)載作者:界面新聞時間:2025-03-06

3月6日凌晨3點,阿里巴巴發(fā)布并開源全新的推理模型通義千問QwQ-32B。阿里巴巴稱,這是一款擁有320億參數(shù)的模型,其性能可與具備6710億參數(shù)(其中370億被激活)的DeepSeek-R1媲美,但二者在參數(shù)量上相差將近20倍。


據(jù)悉,QwQ-32B 在一系列基準測試中進行了評估,測試了數(shù)學推理、編程能力和通用能力,并與OpenAI的o1-mini以及DeepSeek滿血版及蒸餾版進行了比較。


在測試數(shù)學能力的AIME24評測集上,以及評估代碼能力的LiveCodeBench 中,千問 QwQ-32B表現(xiàn)與DeepSeek-R1相當,遠勝于o1-mini及相同尺寸的R1蒸餾模型。


在由Meta首席科學家楊立昆領(lǐng)銜的“最難LLMs評測榜”LiveBench、谷歌等提出的指令遵循能力IFEval評測集、由加州大學伯克利分校等提出的評估準確調(diào)用函數(shù)或工具方面的BFCL測試中,千問QwQ-32B的得分均超越了DeepSeek- R1。


官方介紹稱,這一成果突顯了將強化學習應用于經(jīng)過大規(guī)模預訓練的強大基礎(chǔ)模型的有效性。此外,阿里團隊還在推理模型中集成了與Agent相關(guān)的能力,使其能夠在使用工具的同時進行批判性思考,并根據(jù)環(huán)境反饋調(diào)整推理過程。


除了性能上的大幅提升,QwQ-32B的另外一個亮點是大幅降低了部署使用成本,開發(fā)者和企業(yè)可以在消費級硬件上輕松將其部署到本地設(shè)備中。


資料顯示,從2023年至今,阿里通義團隊已開源200多款模型,包含大語言模型千問Qwen及視覺生成模型萬相Wan等兩大基模系列,覆蓋從0.5B到110B等參數(shù),實現(xiàn)了全模態(tài)、全尺寸大模型的開源。


開源社區(qū)Hugging Face此前的榜單顯示,開源僅6天的阿里萬相大模型已反超DeepSeek-R1,登頂模型熱榜、模型空間榜兩大榜單,成為近期全球開源社區(qū)最受歡迎的大模型。根據(jù)最新數(shù)據(jù),萬相2.1(Wan2.1)在Hugging Face及魔搭社區(qū)的總下載量已超百萬,在Github的Star數(shù)超6k。


在通義千問最新推理模型發(fā)布并開源后,阿里巴巴股價應聲大漲。隔夜美股收盤漲8.61%,報收141.03美元。截至發(fā)稿,阿里巴巴港股漲超7%。今年以來,阿里巴巴股價累計漲幅已近70%。



聲明:文章來源于網(wǎng)絡(luò)轉(zhuǎn)載,是作者獨立觀點,不代表浙北數(shù)據(jù)立場
如有不合適或侵權(quán)等問題請及時聯(lián)絡(luò)我們0572-2100075,會第一時間刪除,保障作者權(quán)益
?

微信公眾號