Copyright 2015-2024 多趣味 版權所有 京ICP備2015051670號
近日,GitHub上一項研究引發業界熱議。研究作者稱,華為盤古大模型與阿里巴巴通義千問Qwen - 2.514B模型在參數結構上“驚人一致”。 作者實證比較發現,PanguProMoE模型與Qwen - 2.514B模型在注意力參數分布上平均相關性達 0.927,遠超其他模型對比正常范圍,網友質疑PanguProMoE存在抄襲。 盤古大模型團隊在GitHub回應,否認抄襲指控,認為作者評估方法不科學。 截止發稿前,華為官方暫未置評。