欧美大逼网_免费午夜视频_91精品国产91久久久_日韩99_在线视频 日韩_国产一级毛片高清

阿里巴巴,登頂全球開源模型!
來源:證券時報網作者:周春媚2025-04-29 10:35

4月29日,阿里巴巴開源了備受期待的新一代通義千問模型Qwen3(簡稱千問3),在GPQA、AIME24/25、LiveCodeBench等多個權威基準測試中全面超越R1、OpenAI-o1等全球頂尖模型,表現出極具競爭力的結果,登頂全球開源模型。

其中,在奧數水平的AIME25測評中,千問3獲得81.5分,刷新開源紀錄;在考察代碼能力的Live Code Bench測評中,千問3突破70分大關,表現超過Grok3;在評估模型人類偏好對齊的Arena Hard測評中,千問3以95.6分超越OpenAI-o1及DeepSeek-R1。

千問3采用混合專家架構,總參數量為235B,激活參數量僅需22B,在推理、指令遵循、工具調用、多語言能力等方面均大幅增強。

千問3具有以下主要亮點:

一是“快思考”與“慢思考”結合。作為國內首個“混合推理模型”,Qwen3將“快思考”與“慢思考”集成進同一個模型,可以在思考模式(用于復雜的邏輯推理、數學和編碼等任務)與與非思考模式(用于聊天等簡單實時交互)之間無縫切換,既可以對簡單需求進行“秒答”,也能夠對復雜問題進行多步驟“深度思考”,從而大幅節省算力消耗。

二是提供8種參數大小的模型。千問3提供了8款不同尺寸的豐富的模型版本,包含2款30B、235B的混合專家模型,以及0.6B、1.7B、4B、8B、14B、32B等6款稠密模型,每款模型均斬獲同尺寸開源模型SOTA(最佳性能)。這為本地測試與科研、手機端側應用、電腦或汽車端、企業落地、云端高效部署等不同場景與任務提供了能夠滿足要求的尺寸模型,最大程度平衡性能與成本。

二是推理能力顯著提升。千問3在數學、代碼生成和常識邏輯推理方面超越QwQ(在思考模式下)和Qwen2.5 instruct models(在非思考模式下)。其中,Qwen3-235B-A22B表現尤為突出,刷新了開源模型的智能水平新高,顯存占用僅為性能相近模型的三分之一。無論是數學推理、代碼生成還是綜合邏輯分析,Qwen3均展現出卓越能力,穩居全球開源模型前列。

四是支持MCP協議,具備強大的工具調用能力。在評估模型智能體能力的BFCL評測中,千問3拿下70.8的新高,超越谷歌Gemini2.5-Pro、OpenAI-o1等頂尖模型,大幅降低智能體調用工具的門檻。千問3還支持MCP(模型上下文協議),并具備強大的工具調用能力,能夠實現高效的手機及電腦智能體操作等任務。

五是部署成本大幅下降。在性能大幅提升的同時,千問3的部署成本大大降低。滿血版671B參數量的DeepSeek-R1需要8張H20(價格大約100萬元)進行部署,適合低并發場景;一般推薦使用16張H20部署,總價約200萬元。而千問3的旗艦模型僅需3張H20(大約36萬元)即可部署,推薦使用4張H20部署,總價約50萬。因此,從部署成本角度看,千問3旗艦模型是滿血版R1的25%—35%,部署成本大降75%—65%。

據了解,千問3系列模型依舊采用寬松的Apache2.0協議開源,并首次支持119多種語言。目前,千問3已上線魔塔社區、HuggingFace、Github等平臺,全球開發者、研究機構和企業均可免費下載模型并商用。此外,個人用戶可通過通義APP直接體驗千問3,同時夸克也即將全線接入千問3。

當下,AI產業已將關注點從模型訓練轉向以智能體為核心的AI應用,性能更強、成本更優的模型將有越來越大的應用價值。通義千問團隊表示:“千問3的發布和開源將極大地推動大型基礎模型的研究與開發。我們的目標是為全球的研究人員、開發者和組織賦能,幫助他們利用這些前沿模型構建創新解決方案。”

此次開源的千問3型以更小的參數規模實現了更高的智能水平,為開發者提供了更加多樣的模型尺寸及思考模式選擇,有助于開發者更好地平衡及控制預算成本。

通義千問團隊的技術負責人林俊旸在其個人社交平臺上表示,花了一些時間來找方法解決一些并不花哨的問題,比如如何通過穩定的訓練來擴展強化學習、如何平衡來自不同領域的數據、如何增強對更多語言的支持等。他還表示,團隊正邁向下一個階段,即訓練智能體來擴展長程推理,同時更多地關注現實世界的任務。

據悉,作為與DeepSeek并成為“開源雙子星”的另外一星,阿里通義已開源200余個模型,全球下載量超3億次,千問衍生模型數超10萬個,已超越Meta的Llama,成為全球第一開源模型。通過持續的模型迭代及開源開放,阿里在推動AI技術普及的同時,也增強了中國在全球開源AI生態中的影響力。

校對:楊立林

圖片

責任編輯: 冉超
聲明:證券時報力求信息真實、準確,文章提及內容僅供參考,不構成實質性投資建議,據此操作風險自擔
下載“證券時報”官方APP,或關注官方微信公眾號,即可隨時了解股市動態,洞察政策信息,把握財富機會。
網友評論
登錄后可以發言
發送
網友評論僅供其表達個人看法,并不表明證券時報立場
暫無評論
為你推薦
時報熱榜
換一換
    熱點視頻
    換一換
    主站蜘蛛池模板: 亚洲特黄| 国产精品区一区二区三区 | 国产精品久久久久久久久久久久午夜 | 羞羞电影在线观看 | 毛片网站视频 | 羞羞视频免费入口网站 | 亚洲成人免费网站 | 日本一区二区视频在线观看 | 午夜免费网 | 欧美日韩免费一区二区三区 | 精品国产一区二区三区四区在线 | 国产精品久久久久久久久久大牛 | 欧美一级黄色免费看 | 国产精品色综合 | 国产精品一区网站 | 综合网天天射 | 欧美性videofree精品 | 精品一区二区中文字幕 | 最新中文在线视频 | 一级免费a | 亚洲成人高清在线观看 | 精品久久久久久久久久中出 | 999精品国产 | 一级黄色毛片a | 成人福利视频导航 | 欧美性生交zzzzzxxxxx | 亚洲片在线 | 亚洲精品欧美二区三区中文字幕 | 男人的天堂色偷偷 | 国产亚洲精品久久久久久大师 | 亚洲成人国产 | 久色porn| 在线观看免费av网 | 中文字幕综合在线观看 | 日韩欧美中文字幕视频 | 小视频免费在线观看 | 成人不卡免费视频 | 成人 精品| 免费国产一级淫片 | www.成人免费视频 | 毛片电影网址 |