簡單任務不假思索，復雜任務深思熟慮——國產“混合推理”大模型領先全球

2025-04-29 20:12:53 來源: 科技日報點擊數：

科技日報記者崔爽

4月29日凌晨，阿里巴巴宣布其開源的新一代大模型，在參數量僅為DeepSeek-R1的1/3，成本大幅下降的同時，性能全面超越OpenAI-o1等全球頂尖模型，登頂全球最強開源模型。消息引發業界熱議。通義千問模型Qwen3（千問3）是國內首個“混合推理模型”，可對簡單需求“秒回”，大大節省算力。

諾貝爾經濟學獎得主丹尼爾·卡尼曼曾提出一個著名觀點：人類思維分為慢思考和快思考；慢思考包括邏輯推理、復雜計算和批判性思考；快思考則基于直覺和情感，消耗認知資源極少，適合日常簡單任務。

傳統的AI大模型，回復用戶發來的“謝謝”“再見”等寒暄，也要耗費大量計算能力。AI研究者一直試圖模擬人腦，做到“簡單任務不假思索，復雜任務深思熟慮”。然而要融合快與慢兩種思考方式，做到互不干擾，并不容易，就好像“左手畫圓、右手畫方”，需要極其精細、創新的設計及訓練方法?；旌贤评砟Ｐ褪穷^部公司爭相攻關的前沿技術，目前全球熱門模型中只有千問3、Claude 3.7以及Gemini 2.5 Flash可以做到。

用戶可為千問3設置“思考預算”，讓機器知道該耗費多少“心力”。推理模式下，千問3執行更多中間步驟——分解問題、推導、驗證、給出深思熟慮的答案；非推理模式下，模型直接生成答案。推理模式的計算成本大致是非推理模式的2到5倍。

阿里方面宣布，節省算力的同時，千問3各方面表現也大幅增強：考察奧數水平的AIME25測評中，千問刷新開源大模型紀錄；考察代碼能力的LiveCodeBench評測中，千問3表現超過Grok3；評估模型人類偏好對齊的ArenaHard測評中，千問3超越OpenAI-o1。千問3在全球開發者社區GitHub發布后四個小時獲得1.7萬個星標，刷新了開源大模型的熱度紀錄。

據介紹，僅需4張H20（一款常用的AI芯片）即可部署“滿血版”千問3，其顯存占用僅為性能相近模型的三分之一。由于算力門檻低，未來的手機、智能眼鏡、智能駕駛、人形機器人都更可能應用這種大模型。

此外，千問3宣布支持119種語言，包括斯瓦希里語、意第緒語、亞美尼亞語、爪哇語、海地語等小語種。阿里方面表示，許多國家和地區迄今沒有技術能力開發自己語種的大模型，千問3的開源解決了這一問題。

責任編輯：郭炘蔚

中文字幕区一区二_免费欧美一区_久久精品视频免费播放_一级毛片免费的_亚洲AV永久无码天堂网毛片_免费在线影视观看入口

簡單任務不假思索，復雜任務深思熟慮——國產“混合推理”大模型領先全球

友情鏈接

抱歉，您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式，這會影響您正常瀏覽本網頁

您可以進行以下操作:

1.將瀏覽器切換回極速模式

2.點擊下面圖標升級或更換您的瀏覽器

3.暫不升級，繼續瀏覽

中文字幕区一区二_免费欧美一区_久久精品视频免费播放_一级毛片免费的_亚洲AV永久无码天堂网毛片_免费在线影视观看入口

簡單任務不假思索，復雜任務深思熟慮——國產“混合推理”大模型領先全球

友情鏈接

抱歉，您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式，這會影響您正常瀏覽本網頁

您可以進行以下操作:

1.將瀏覽器切換回極速模式

2.點擊下面圖標升級或更換您的瀏覽器

3.暫不升級，繼續瀏覽

簡單任務不假思索，復雜任務深思熟慮——國產“混合推理”大模型領先全球

抱歉，您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式，這會影響您正常瀏覽本網頁

3.暫不升級，繼續瀏覽