在AI編程能力的全球競(jìng)技場(chǎng)上,中國(guó)大模型正以強(qiáng)勁勢(shì)頭嶄露頭角。近日,國(guó)際權(quán)威盲測(cè)平臺(tái)LMArena旗下Code Arena榜單公布最新排名,阿里巴巴自主研發(fā)的Qwen 3.6-Plus大語(yǔ)言模型以1452分的成績(jī)躍居全球第二,在React專項(xiàng)技術(shù)方向上超越OpenAI、Google等國(guó)際科技巨頭,成為該榜單中排名最高的中國(guó)模型。
作為AI領(lǐng)域最具公信力的性能評(píng)估平臺(tái)之一,LMArena通過真實(shí)用戶盲測(cè)與實(shí)時(shí)對(duì)抗機(jī)制,為全球大模型提供客觀對(duì)比。隨著AI Agent技術(shù)興起,編程能力已成為衡量模型綜合實(shí)力的核心指標(biāo)。本次React專項(xiàng)榜單聚焦Web開發(fā)場(chǎng)景下的自主編碼能力,要求模型獨(dú)立完成從項(xiàng)目初始化到調(diào)試運(yùn)行的全流程,對(duì)工程思維與端到端開發(fā)能力提出極高要求。Qwen 3.6-Plus的突破性表現(xiàn),標(biāo)志著中國(guó)大模型在復(fù)雜工程任務(wù)處理領(lǐng)域達(dá)到世界領(lǐng)先水平。
該模型于4月2日正式發(fā)布,具備原生多模態(tài)理解與推理能力,尤其在代碼生成與Agent技術(shù)方面表現(xiàn)卓越。在多項(xiàng)權(quán)威評(píng)測(cè)中,Qwen 3.6-Plus以更少的參數(shù)量超越參數(shù)量達(dá)其2-3倍的GLM-5、Kimi-K2.5等模型,展現(xiàn)出高效能的技術(shù)架構(gòu)。發(fā)布首日即引發(fā)全球開發(fā)者社區(qū)廣泛關(guān)注,次日便以顯著優(yōu)勢(shì)登頂React榜單次席,僅落后于Anthropic的Claude-Opus-4.6-Thinking(1540分),領(lǐng)先OpenAI最新發(fā)布的GPT-5.0-High(1448分)4分,較Google的Gemini 3.1 Pro Preview(1440分)高出12分。
在全面評(píng)估AI編程能力的Code Arena總榜單中,Qwen 3.6-Plus同樣穩(wěn)居中國(guó)模型首位。這一成績(jī)推動(dòng)阿里巴巴在全球AI實(shí)驗(yàn)室排名中升至第四,緊隨Anthropic、OpenAI和Google之后。據(jù)技術(shù)團(tuán)隊(duì)透露,Qwen 3.6-Plus作為千問3.6系列的首發(fā)模型,后續(xù)將開源不同參數(shù)規(guī)模的版本,性能更強(qiáng)的旗艦?zāi)P蚎wen3.6-Max也計(jì)劃于近期發(fā)布,為開發(fā)者提供更豐富的技術(shù)選擇。






















