大廠AI之戰(zhàn),激烈度陡然升級。
馬化騰在騰訊年會上罕見地公開反思,直言“AI速度慢了”,還點評了“千問全面接入阿里生態(tài)”,稱騰訊會一體化考慮大模型和AI產(chǎn)品,試圖以“元寶派”打開新空間;百度智能云將“2026年AI相關(guān)收入增速”上調(diào)到200%,全力沖刺AI云市場第一;字節(jié)跳動更是激進,豆包手機試圖直接搶占硬件終端,二代豆包AI手機正在緊鑼密鼓準(zhǔn)備中。
就在所有人都以為戰(zhàn)局會在春節(jié)后進入高潮時,1月26日深夜,甚至沒有一場發(fā)布會,阿里放出了最強模型。
千問旗艦推理模型Qwen3-Max-Thinking正式發(fā)布。
根據(jù)披露的數(shù)據(jù),Qwen3-Max-Thinking是目前阿里規(guī)模最大、能力最強的推理模型,其性能指標(biāo)媲美GPT-5.2和Gemini 3 Pro,在19個公認的大模型基準(zhǔn)測試中,刷新了數(shù)項最佳表現(xiàn)(SOTA)紀錄。千問PC和網(wǎng)頁端隨即絲滑接入,支持深度邏輯推演與自我校驗。
還有一則有意思的動態(tài)。
1月26日,國星宇航披露成功把千問3(Qwen3)大模型部署到了“星算”計劃01組太空計算中心,這是全球首次將通用大模型從地面上注至在軌運行的衛(wèi)星,并執(zhí)行端到端推理任務(wù)。網(wǎng)友調(diào)侃,千問這回真“上天”了。
開年以來,在關(guān)乎未來輸贏的“超級入口”之爭上,阿里全面進擊,從千問接入阿里生態(tài),到阿里旗下芯片子公司平頭哥計劃單獨上市,再到Qwen模型發(fā)布最強版本,芯片層、模型層、應(yīng)用層動作接連不斷。
AI進入下半場,各家策略各異?!罢l都知道以后AI重要,不管起步早晚,大廠都在做AI生態(tài)了,但現(xiàn)在方向都沒定,阿里做生態(tài)、騰訊做社交、百度押注云、字節(jié)做硬件,還不到分野的時候。”一位AI產(chǎn)業(yè)資深觀察人士表示。
千問推理再進化
Qwen3-Max-Thinking模型被官方稱為“迄今為止最接近國際頂尖模型的國內(nèi)最強AI大模型”。它的目標(biāo)非常明確,在推理技術(shù)上進行系列創(chuàng)新,最終完成模型性能的大幅飛躍。
根據(jù)阿里發(fā)布的詳細資料,該模型總參數(shù)超過萬億,在涵蓋事實知識、復(fù)雜推理、指令遵循、人類偏好對齊、Agent能力等19項權(quán)威基準(zhǔn)測試中刷新了全球紀錄。
在關(guān)鍵的模型推理能力提升中,千問新模型采用了一種全新的測試時擴展(Test-time Scaling)機制,推理性能提升的同時更經(jīng)濟。
業(yè)界推理時計算,通常是簡單增加并行推理路徑,重復(fù)推導(dǎo)已知結(jié)論,造成冗余推理效率低下。千問采用的測試時擴展新機制,可以對此前推理的結(jié)果進行“經(jīng)驗提取”式的提煉,并據(jù)此進行多輪自我迭代,在相同的上下文中實現(xiàn)更高效的推理計算,獲得更智能的推理結(jié)果。
簡單理解,就是類似于讓AI在解題時不再“一張草稿紙算到底”,而是能像人類一樣,對前面的思考步驟進行回顧、提煉“經(jīng)驗”,并在后續(xù)步驟中更聰明地調(diào)用這些經(jīng)驗,從而實現(xiàn)更高效、更準(zhǔn)確的復(fù)雜推理。
基于這一推理技術(shù)創(chuàng)新,千問推理性能和推理效率有明顯提升,比如在被稱為“人類最后的測試”HLE測試中,千問得分58.3,超過GPT-5.2-Thinking的45.5、Gemini 3 Pro的45.8,錄得當(dāng)前所有模型的最高分。
面向即將到來的智能體Agent時代,Qwen3-Max-Thinking還大幅增強了自主調(diào)用工具的原生Agent能力。具體而言,在完成初步的工具使用微調(diào)后,通義團隊對模型進一步在大量多樣化任務(wù)上進行了基于規(guī)則獎勵與模型獎勵的聯(lián)合強化學(xué)習(xí)訓(xùn)練,使得Qwen3-Max-Thinking擁有更智能結(jié)合工具進行思考的能力。
這種自適應(yīng)的工具調(diào)用能力可以在QwenChat上完整體驗,模型自主選用搜索、個性化記憶和代碼解釋器等三個核心的Agent工具功能,提供專業(yè)人士一樣水平的回答。同時,模型幻覺也大為降低,為解決真實復(fù)雜任務(wù)打下基礎(chǔ)。
為什么業(yè)界如此看重推理和智能體能力?因為這直接關(guān)系到AI能否從“聊天玩具”進化為真正的“生產(chǎn)力工具”乃至“個人助理”。一個能進行深度推理、自主調(diào)用工具的AI才有能力處理復(fù)雜任務(wù),比如規(guī)劃旅行、編寫專業(yè)報告、分析數(shù)據(jù)等。
或許阿里的這個“旗艦推理模型”,目的就是走出“僅對話”階段,開始為物理AI的“超級入口”做準(zhǔn)備。
平頭哥獨立,千問融入生態(tài)
同期,阿里還在做兩個看似相反的動作,讓芯片獨立出去,把千問無縫整合到阿里生態(tài)。
平頭哥的單飛,是觀察中國互聯(lián)網(wǎng)巨頭AI戰(zhàn)略縱深的一個切片。作為源自阿里達摩院的芯片公司,平頭哥最早是為阿里云及內(nèi)部生態(tài)提供自主算力的,其推出的含光、倚天等系列AI芯片,已經(jīng)成了阿里云算力基礎(chǔ)的一部分。
市場解讀阿里推動平頭哥獨立運營并尋求上市,是希望把芯片從成本中心轉(zhuǎn)化為收入中心。
其實不只阿里,百度也在推動昆侖芯獨立上市,這也是一種行業(yè)必然。
大模型參數(shù)規(guī)模進入萬億時代,訓(xùn)練與推理的成本指數(shù)級上升,算力成了AI時代的“水電煤”。對于互聯(lián)網(wǎng)大廠內(nèi)部來說,自研芯片不僅能優(yōu)化性能、降低對英偉達等國際巨頭的依賴,還能在架構(gòu)層面與自家的AI框架、模型進行深度協(xié)同,形成從底層硬件到上層應(yīng)用的垂直優(yōu)化閉環(huán)。
而讓芯片公司獨立出來,則是出于營收的考量。既能通過外部壓力倒逼技術(shù)迭代,也能通過資本市場為長期的芯片研發(fā)“輸血”。一方面支撐自家云業(yè)務(wù),另一方面向外輸出、形成行業(yè)標(biāo)準(zhǔn)的基礎(chǔ)設(shè)施,順便把外部的資金賺回來,支撐研發(fā)。
在算力層、模型層都有積淀之后,阿里最終的目的開始變得清晰,把千問融入龐大的商業(yè)生態(tài)里,搶奪AI的“超級入口”。
近段時間以來,阿里進行了一系列緊湊的生態(tài)調(diào)整。2025年12月,集團整合資源,成立了千問C端事業(yè)群,直接面向消費者打造AI產(chǎn)品體驗。2026年1月15日,千問APP推出重大版本更新,正式宣布從“聊天工具”升級邁入“辦事時代”,深度接入淘寶、支付寶、淘寶閃購、高德、飛豬等阿里生態(tài)核心業(yè)務(wù),實現(xiàn)了點外賣、購物、訂機票酒店等AI全流程辦事服務(wù),一次性上線超400項AI辦事功能,串起了需求表達、任務(wù)執(zhí)行到支付履約的閉環(huán)。
比如,用戶對千問說“周末我想去郊外露營,預(yù)算人均500元”。千問在理解這個模糊意圖后,其背后的“智能體”能力可以同時調(diào)動多個插件,通過高德查詢合適的露營地與實時路況,通過飛豬或本地生活板塊預(yù)訂營地,通過淘寶推薦并比價帳篷、睡袋等裝備,再通過支付寶整合優(yōu)惠套餐并完成支付。用戶不需要在多個APP之間頻繁操作,通過自然對話可以完成從想法到消費的全流程。
未來千問還將繼續(xù)接入優(yōu)酷、大麥、菜鳥驛站、阿里健康、1688、盒馬等其他阿里旗下核心業(yè)務(wù)條線,進一步提升生態(tài)協(xié)同和場景覆蓋度。
也就是說,以千問作為入口,能夠無縫串聯(lián)起“電商交易”“本地生活”“文娛內(nèi)容”“支付金融”等場景,千問本身可以成為覆蓋用戶生活的“AI管家”。
國海證券在研報中指出,千問的生態(tài)整合模式重新定義了“入口”價值邏輯,促使行業(yè)競爭從單一模型能力,轉(zhuǎn)向“模型+生態(tài)+場景”全維度比較。
大廠路徑各異
同期,其他互聯(lián)網(wǎng)巨頭也在加碼進攻。
騰訊,正如馬化騰所言,在通用大模型的激進發(fā)布上顯得謹慎。但其優(yōu)勢在于社交產(chǎn)品矩陣和深厚的產(chǎn)業(yè)互聯(lián)網(wǎng)基礎(chǔ)。騰訊的AI戰(zhàn)略更傾向于“滲透”與“結(jié)合”,把AI能力深度融入微信、QQ、企業(yè)微信等國民級應(yīng)用以及游戲、金融科技等優(yōu)勢業(yè)務(wù)中。騰訊更喜歡用不打擾用戶的方式,做“潤物細無聲”的生態(tài)融合。
百度開年第一個發(fā)聲是“AI云”,文心大模型是底層模型能力,商業(yè)化在于提供AI解決方案,并且業(yè)務(wù)增速和招投標(biāo)數(shù)據(jù)表現(xiàn)很不錯。百度的“入口”思維更偏向于B端,成為企業(yè)和機構(gòu)智能化轉(zhuǎn)型的首選合作伙伴。
字節(jié)跳動以敏捷和務(wù)實著稱。豆包在字節(jié)內(nèi)部應(yīng)用非常廣泛,包括抖音的內(nèi)容推薦、創(chuàng)作工具,飛書的辦公協(xié)同等等。推出“豆包AI手機”、研發(fā)“豆包AI耳機”,顯示字節(jié)開始觸碰硬件層。字節(jié)潛在的AI超級入口可能是抖音,可能是豆包,也可能是尚未完全成型的新硬件。
相比之下,阿里從平頭哥的底層芯片,到千問的模型層,再到千問APP上層應(yīng)用、夸克AI眼鏡硬件,試圖搭建起一個完整閉環(huán)。這種模式的優(yōu)點是自主可控、協(xié)同潛力大,但是戰(zhàn)線長,每一環(huán)都需要巨大的投入,對公司的資源整合與戰(zhàn)略定力要求非常高。
尤其在千問宣布全面接入阿里生態(tài)之后,外界也有質(zhì)疑聲音,不少用戶表示:“我不想被限定在阿里的圈子里,就想有更多選擇權(quán)?!边@對于阿里能否把千問做成“超級入口”是有挑戰(zhàn)的,用戶意愿和用戶習(xí)慣往往最難左右。
(21世紀經(jīng)濟報道記者陶力對本文亦有貢獻)
(作者:孔海麗 編輯:朱益民)