科技日報記者 崔爽
4月29日凌晨,阿里巴巴宣布其開源的新一代大模型,在參數量僅為DeepSeek-R1的1/3,成本大幅下降的同時,性能全面超越OpenAI-o1等全球頂尖模型,登頂全球最強開源模型。消息引發業界熱議。通義千問模型Qwen3(千問3)是國內首個“混合推理模型”,可對簡單需求“秒回”,大大節省算力。
諾貝爾經濟學獎得主丹尼爾·卡尼曼曾提出一個著名觀點:人類思維分為慢思考和快思考;慢思考包括邏輯推理、復雜計算和批判性思考;快思考則基于直覺和情感,消耗認知資源極少,適合日常簡單任務。
傳統的AI大模型,回復用戶發來的“謝謝”“再見”等寒暄,也要耗費大量計算能力。AI研究者一直試圖模擬人腦,做到“簡單任務不假思索,復雜任務深思熟慮”。然而要融合快與慢兩種思考方式,做到互不干擾,并不容易,就好像“左手畫圓、右手畫方”,需要極其精細、創新的設計及訓練方法?;旌贤评砟P褪穷^部公司爭相攻關的前沿技術,目前全球熱門模型中只有千問3、Claude 3.7以及Gemini 2.5 Flash可以做到。
用戶可為千問3設置“思考預算”,讓機器知道該耗費多少“心力”。推理模式下,千問3執行更多中間步驟——分解問題、推導、驗證、給出深思熟慮的答案;非推理模式下,模型直接生成答案。推理模式的計算成本大致是非推理模式的2到5倍。
阿里方面宣布,節省算力的同時,千問3各方面表現也大幅增強:考察奧數水平的AIME25測評中,千問刷新開源大模型紀錄;考察代碼能力的LiveCodeBench評測中,千問3表現超過Grok3;評估模型人類偏好對齊的ArenaHard測評中,千問3超越OpenAI-o1。千問3在全球開發者社區GitHub發布后四個小時獲得1.7萬個星標,刷新了開源大模型的熱度紀錄。
據介紹,僅需4張H20(一款常用的AI芯片)即可部署“滿血版”千問3,其顯存占用僅為性能相近模型的三分之一。由于算力門檻低,未來的手機、智能眼鏡、智能駕駛、人形機器人都更可能應用這種大模型。
此外,千問3宣布支持119種語言,包括斯瓦希里語、意第緒語、亞美尼亞語、爪哇語、海地語等小語種。阿里方面表示,許多國家和地區迄今沒有技術能力開發自己語種的大模型,千問3的開源解決了這一問題。