開源代碼爭議背景
盤古Pro MoE的開源與質(zhì)疑
2025年6月30日,華為正式開源了部分盤古大模型體系,包括70億參數(shù)的盤古稠密模型和720億參數(shù)的盤古Pro MoE混合專家模型,以及配套的昇騰模型推理技術(shù)體系。這一舉措被華為視為構(gòu)建昇騰生態(tài)的關(guān)鍵步驟。然而,僅僅四天之后,爭議便隨之而來。
GitHub上的一項(xiàng)研究指出,華為盤古Pro MoE模型與阿里通義千問Qwen-2.5模型的注意力參數(shù)分布高度相似,平均相關(guān)性達(dá)到了0.927,這一數(shù)值遠(yuǎn)高于同行模型間的對比范圍。同時(shí),研究者在盤古開源代碼文件中發(fā)現(xiàn)了標(biāo)注有“Copyright 2024 The Qwen team, Alibaba Group”的版權(quán)聲明,這進(jìn)一步引發(fā)了“非獨(dú)立開發(fā)”的質(zhì)疑。
華為的正式回應(yīng)
面對這些質(zhì)疑,華為諾亞方舟實(shí)驗(yàn)室于7月5日發(fā)布了正式聲明。聲明中,華為強(qiáng)調(diào)盤古Pro MoE是基于昇騰硬件平臺開發(fā)、訓(xùn)練的基礎(chǔ)大模型,并非基于其他廠商模型增量訓(xùn)練而來。華為還特別提到了其創(chuàng)新的分組混合專家(MoGE)架構(gòu),這是全球首個(gè)面向昇騰硬件設(shè)計(jì)的同規(guī)格混合專家模型,有效解決了大規(guī)模分布式訓(xùn)練的負(fù)載均衡難題,提升了訓(xùn)練效率。
對于代碼相似性的問題,華為表示部分基礎(chǔ)組件代碼參考了業(yè)界開源實(shí)踐,并嚴(yán)格遵循了開源協(xié)議,標(biāo)注了版權(quán)信息。華為強(qiáng)調(diào),這不僅是開源社區(qū)的通行做法,也符合業(yè)界倡導(dǎo)的開源協(xié)作精神。
回應(yīng)中的關(guān)鍵點(diǎn)解析
MoGE架構(gòu)的創(chuàng)新性
MoE(Mixture of Experts)模型是一種將大模型拆分成多個(gè)“專家”(子網(wǎng)絡(luò)或模塊)的架構(gòu)。華為盤古團(tuán)隊(duì)聲稱其MoGE架構(gòu)在專家分組、路由機(jī)制等方面有顯著創(chuàng)新。這意味著,即便某些基礎(chǔ)組件(如每個(gè)專家內(nèi)部的Transformer塊)的實(shí)現(xiàn)參考了開源代碼,也不能完全等同于對整個(gè)模型的抄襲。
開源協(xié)議的遵循
在開源社區(qū)中,使用開源項(xiàng)目需要遵循一定的規(guī)則。華為在回應(yīng)中明確指出了其嚴(yán)格遵循了開源許可證的要求,在開源代碼文件中清晰標(biāo)注了開源代碼的版權(quán)聲明。這是開源社區(qū)的通行做法,也是尊重第三方知識產(chǎn)權(quán)、提倡開源協(xié)作精神的重要體現(xiàn)。
爭議中的技術(shù)細(xì)節(jié)
雖然華為進(jìn)行了詳盡的回應(yīng),但爭議并未完全平息。一些業(yè)內(nèi)人士指出,導(dǎo)致參數(shù)相關(guān)性高的原因很多,類似的訓(xùn)練目標(biāo)、相近的模型規(guī)模,或設(shè)計(jì)上采用了類似的注意力機(jī)制等都可能產(chǎn)生參數(shù)的高相關(guān)性。此外,對于“LLM-Fingerprint”分析方法的科學(xué)性也存在爭議。華為認(rèn)為該方法不科學(xué),而質(zhì)疑方則堅(jiān)持其有效性。
待厘清的問題與挑戰(zhàn)
開源模型邊界的界定
此次爭議再次暴露了AI大模型開源定義模糊、協(xié)議規(guī)則與法律界定不清晰的問題。開源并不代表沒有版權(quán),任何第三方使用都應(yīng)該遵循其開源許可協(xié)議。然而,在實(shí)際操作中,如何界定開源模型的邊界、如何確保開源技術(shù)的健康有序發(fā)展仍是一個(gè)亟待解決的難題。

開源協(xié)作與商業(yè)化的平衡
開源協(xié)作精神與商業(yè)化需求之間往往存在一定的張力。一方面,開源社區(qū)倡導(dǎo)開放、共享、協(xié)作的理念;另一方面,企業(yè)則需要通過商業(yè)化來實(shí)現(xiàn)可持續(xù)發(fā)展。如何在保持開源協(xié)作精神的同時(shí),合理平衡商業(yè)化需求是當(dāng)前面臨的一個(gè)重要挑戰(zhàn)。
技術(shù)驗(yàn)證與透明度的提升
在爭議中,技術(shù)驗(yàn)證的透明度和說服力成為了關(guān)鍵。華為雖然進(jìn)行了回應(yīng),但缺乏官方GitHub或其他平臺的完整聲明,也未能提供足夠的反證數(shù)據(jù)支撐其觀點(diǎn)。這引發(fā)了對于如何提升技術(shù)驗(yàn)證透明度、增強(qiáng)說服力的思考。未來,或許需要更加開放、透明的驗(yàn)證機(jī)制來確保技術(shù)的公正性和可信度。
結(jié)語
華為盤古團(tuán)隊(duì)回應(yīng)開源代碼爭議的事件不僅揭示了開源社區(qū)中的復(fù)雜問題,還引發(fā)了對于如何推動AI大模型健康有序發(fā)展的廣泛討論。在開源協(xié)作與商業(yè)化需求之間尋求平衡、界定開源模型邊界、提升技術(shù)驗(yàn)證透明度等方面仍需進(jìn)一步努力。我們相信,在各方共同努力下,開源技術(shù)將能夠更好地服務(wù)于社會發(fā)展和人類進(jìn)步。
1 條評論