91精品国产成人久久-777米奇色狠狠俺去啦-91亚洲欧美强伦三区-成年午夜av在线免费观看-欧美性视频欧美欧一欧美-午夜剧场在线观看高清-国产自拍视频在线观看网址-亚洲日韩精品无码专区97-麻豆国产成人免费视频

智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

馬斯克xAI再發(fā)力:Grok 4.1發(fā)布,情商智商雙提升,團(tuán)隊或成“全華班”

   發(fā)布時間:2025-11-21 02:07 作者:沈如風(fēng)

馬斯克旗下人工智能公司xAI近日推出新一代大模型Grok 4.1,以"智商情商雙突破"的定位向行業(yè)頭部發(fā)起沖擊。該模型分為Thinking(推理版)和標(biāo)準(zhǔn)版兩個版本,現(xiàn)已通過Grok官網(wǎng)及X平臺向全球用戶開放,移動端iOS和Android應(yīng)用同步更新,用戶可免費體驗。

在權(quán)威評測平臺LMArena的最新榜單中,Grok 4.1 Thinking以1483分登頂全球大模型排行榜,較第二名Gemini 2.5 Pro高出31分。其標(biāo)準(zhǔn)版同樣表現(xiàn)亮眼,直接占據(jù)榜單次席。更引人注目的是情商專項測試EQ-Bench3的結(jié)果:Thinking版以1586分刷新紀(jì)錄,標(biāo)準(zhǔn)版緊隨其后,國產(chǎn)模型Kimi K2位列第三。

實測反饋顯示,新模型在交互體驗上實現(xiàn)質(zhì)的飛躍。相比前代產(chǎn)品,Grok 4.1展現(xiàn)出更強(qiáng)的共情能力,回復(fù)中不僅增加耐心傾聽的表述,還會在結(jié)尾添加愛心符號等情感化設(shè)計。創(chuàng)作能力方面,其文本生成評分較前代提升600分,敘事流暢度與畫面感顯著增強(qiáng)。技術(shù)團(tuán)隊通過優(yōu)化訓(xùn)練方法,將模型幻覺率從12.09%壓縮至4.22%,降幅達(dá)65%。

xAI后訓(xùn)練負(fù)責(zé)人Dustin Tran透露,技術(shù)突破主要源于強(qiáng)化學(xué)習(xí)框架的革新。團(tuán)隊開發(fā)了基于智能體推理模型的獎勵機(jī)制,通過分析數(shù)萬條真實對話數(shù)據(jù),將RLHF(人類反饋強(qiáng)化學(xué)習(xí))技術(shù)推向新高度。"我們擴(kuò)大了10倍訓(xùn)練規(guī)模,讓模型在自主評估與迭代響應(yīng)中實現(xiàn)指數(shù)級進(jìn)化。"他舉例說明,新系統(tǒng)能像人類評委般分析對話質(zhì)量,并據(jù)此優(yōu)化回答策略。

值得關(guān)注的是,xAI近期因團(tuán)隊構(gòu)成引發(fā)討論。社交平臺流傳的合影顯示,其核心研發(fā)團(tuán)隊以亞裔工程師為主。有消息稱,公司近期調(diào)整了人員結(jié)構(gòu),但官方未對此作出回應(yīng)。這種技術(shù)團(tuán)隊的國際化特征,或許正是其能快速突破技術(shù)瓶頸的關(guān)鍵因素。

關(guān)于備受期待的Grok 5,馬斯克在最新訪談中給出明確時間表。這款規(guī)劃中的6萬億參數(shù)模型將推遲至明年發(fā)布,原因在于需要更強(qiáng)大的算力支撐訓(xùn)練過程。"這將是通往通用人工智能的重要里程碑,"他強(qiáng)調(diào),"我們寧愿延遲也要確保其成為世界上最智能的系統(tǒng)。"與此同時,谷歌即將推出的Gemini 3.0被行業(yè)視為Grok 4.1的有力競爭者,大模型領(lǐng)域的軍備競賽正進(jìn)入白熱化階段。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
 
智快科技微信賬號
微信群

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群