近期,一場圍繞華為技術(shù)的爭議風(fēng)暴正在科技界迅速蔓延。爭議的焦點(diǎn)在于,華為最新發(fā)布的盤古Pro MoE模型與阿里巴巴的Qwen-2.5L4B模型之間,存在高達(dá)0.927的相似度,這一數(shù)值遠(yuǎn)遠(yuǎn)超過了行業(yè)內(nèi)通常認(rèn)定的閾值0.7。更為引人注目的是,在華為的代碼庫中,竟然出現(xiàn)了“Copyright 2024 Alibaba Group”的版權(quán)聲明,這無疑為這場爭議火上澆油。
6月30日,華為宣布在華為云上開源了包括盤古Pro MoE在內(nèi)的多項(xiàng)技術(shù)成果,這些成果迅速吸引了業(yè)界的廣泛關(guān)注,并收獲了大量贊美。然而,僅僅幾天之后,質(zhì)疑的聲音便接踵而至。7月4日,一位研究者在GitHub上發(fā)布了一份名為“LLM?Fingerprint”的研究報(bào)告,報(bào)告指出,通過模型指紋技術(shù)分析,發(fā)現(xiàn)盤古Pro MoE模型的注意力層參數(shù)與阿里Qwen模型存在顯著的重疊,甚至在部分模塊達(dá)到了逐層復(fù)現(xiàn)的程度。
面對質(zhì)疑,華為迅速做出了回應(yīng)。7月5日,華為諾亞方舟實(shí)驗(yàn)室發(fā)表聲明,堅(jiān)稱盤古Pro MoE是基于昇騰硬件自主研發(fā)的,并非基于其他廠商的模型進(jìn)行增量訓(xùn)練。同時(shí),華為也承認(rèn),在模型開發(fā)過程中,部分基礎(chǔ)組件代碼確實(shí)參考了開源實(shí)踐,但這一切都是嚴(yán)格遵循開源許可證要求的。然而,華為的這一聲明并未能平息質(zhì)疑,反而引發(fā)了更多的爭議。
事實(shí)上,這并非華為首次面臨抄襲的質(zhì)疑。回顧華為的技術(shù)史,不難發(fā)現(xiàn),類似的爭議曾多次上演。從2009年被指控抄襲Quintel的專利技術(shù),到2016年被質(zhì)疑購買土耳其教授的Polar碼專利并宣稱自研,再到2021年鴻蒙系統(tǒng)被指“套殼安卓”,華為似乎總是處于爭議的漩渦之中。此次“抄襲門”事件,更是被網(wǎng)友戲稱為“歷史重演”。
此次事件不僅揭示了AI行業(yè)“偽創(chuàng)新”的現(xiàn)狀,也引發(fā)了關(guān)于開源合規(guī)和行業(yè)自律的討論。有業(yè)內(nèi)人士指出,開源不等于無主之地,華為的行為暴露了其對開源精神的誤解。合規(guī)不是擋箭牌,尊重原創(chuàng)才是底線。同時(shí),也有聲音呼吁加快構(gòu)建“開源合規(guī)指引”和“行業(yè)自律標(biāo)準(zhǔn)”,以避免“套殼炒模”的負(fù)面路徑。
隨著爭議的持續(xù)發(fā)酵,華為可能面臨前所未有的信任危機(jī)。若華為無法通過技術(shù)細(xì)節(jié)公開、第三方審計(jì)等方式證明其清白,將進(jìn)一步削弱其“技術(shù)自研”的公信力。長期以來,華為一直以“技術(shù)自研”和“民族脊梁”的形象示人,這一形象本質(zhì)上是一種營銷策略,旨在爭取政策支持和用戶認(rèn)同。然而,在AI技術(shù)高度復(fù)雜化和競爭激烈的當(dāng)下,技術(shù)爭議可能成為其人設(shè)的“軟肋”。
更為諷刺的是,華為創(chuàng)始人任正非曾在內(nèi)部講話中強(qiáng)調(diào)創(chuàng)新的重要性,而華為高管余承東也曾痛斥抄襲行為。然而,如今這些言論卻被網(wǎng)友拿來反諷,質(zhì)疑華為所謂的“創(chuàng)新”是否只是“抄作業(yè)”。開源不是抄襲的溫床,技術(shù)自信更不該建立在別人的代碼之上。我們期待華為能夠給出經(jīng)得起推敲的解釋,而非用“合規(guī)”二字掩蓋創(chuàng)新惰性。























