16篇文章组成的综述报告部分存问题：网友呼吁不应抹杀全部价值

16篇文章组成的综述报告部分存问题：网友呼吁不应抹杀全部价值

作者 | 物联网智库2022-04-15

近日，一篇由国内外多位AI专家学者参与署名的论文，在国内人工智能（AI）学术圈里引起了不小的震动。

这篇在今年3月26日发表于预印本网站 arXiv的关于“大模型”的综述报告《大模型路线图》（A Roadmap for Big Model），是由北京智源人工智能研究院（以下简称“智源研究院”，或“研究院”）发起的，旨在尽可能涵盖国内外该领域的所有重要文献。

据了解，该报告由多达16篇独立稿件组成，每篇文章都分别邀请了一组作者撰写并单独署名，有国内外多家高校和企业参与了该报告的完成，报告全文长达200多页，涉及来自清华大学、北京大学、中国人民大学、上海交通大学、哈尔滨工业大学、哥伦比亚大学、蒙特利尔大学等国内外高校，以及字节跳动、华为、京东、腾讯等企业以及中科院、微软亚洲研究院和北京智源AI研究院等机构的100多名作者。

而谷歌大脑（Google Brain）团队著名科学家Nicholas Carlini 在其近日的一篇博客中指出，该文章涉嫌抄袭。

Nicholas Carlini举出的证据是“大规模文本重叠”，并在文章中详细列举了该团队论文存在抄袭其他论文的出处，其中也包括他本人更早发布的《去重训练数据使语言模型更好》（Deduplicating Training Data Makes Language Models Better）。

16篇文章组成的综述报告部分存问题：网友呼吁不应抹杀全部价值

4月13日晚，该报告的组织方——智源研究院连夜发表了《关于“A Roadmap for Big Model”综述报告问题的致歉信》。在道歉信中，智源研究院首先明确表示，已对报告进行了逐项核查，经查重确认，共16篇文章中的5篇文章章节，共759词的内容，与其他论文重复，应属抄袭。智源研究院表示，已从报告中删除相应内容，报告修订版在13日当天，将提交arXiv进行更新。目前，研究院已通知所有文章的作者对所有内容进行全面审查，后续经严格审核后再发布新版本。

该事件在国内AI学术社群中，也引发了不同的反响。

事件爆出后，尽管有很多网友在第一时间发起群嘲，但也有一些网友从客观角度对事件进行了分析。首先，有来自AI学术圈的网友表示，此次事件虽然属于“抄袭”，但也并不是很多圈外人所想象的那种“抄袭”。

16篇文章组成的综述报告部分存问题：网友呼吁不应抹杀全部价值

从性质上看，“大模型”一文属于综述报告，和一般意义上的科研论文相比，“综述”是一种“总结”，资料来自文献；而“科研论文”的数据是由研究者通过科研设计，自己收集而来。因此，综述论文与科研论文无论从性质上还是构成上，都不可同日而语。另外，本次被指抄袭的报告由多达16篇文章构成，且由不同组织机构分别独立撰写，因此为什么会出现所谓“抄袭”的原因，还需要进一步调查。

还有网友表示，《大模型路线图》的内容涉及从“大模型”构建前提条件开始，到“大模型”应用结束的全流程研究工作，为大模型发展的历史和应用流程梳理出了清晰的脉络，本来可以帮助读者更好理解“大模型”的发展历史和研究现状，对于大模型领域的未来发展也能起到指引性的作用，原本应当是一篇极具价值的研究综述，但目前由于抄袭事件，该文章的重要性恐怕要大打折扣，这对于国内外大模型研究，乃至人工智能学术研究来说，都不失为一件憾事。

有网友表示，该报告是由“百名作者、16篇文章”组成的综述报告，是对大量原始文献的归纳、总结、分析，再添加作者观点而形成，但过多的作者和机构参与，庞大的创作团队规模显然容易出现各种“难以预料的问题”。

16篇文章组成的综述报告部分存问题：网友呼吁不应抹杀全部价值

最初发起指控的Nicholas Carlini本人近日也更新评论发出呼吁，“不要把这变成一场猎巫行动。” Carlini在评论中表示，“这篇论文有100位作者，任何事情都有可能发生。” “跨度这么大的涉嫌抄袭行为，绝对不止涉及个别作者。一小部分作者的不当行为，不应该被用来指责大多数行为良好的作者。”

16篇文章组成的综述报告部分存问题：网友呼吁不应抹杀全部价值

还有一些网友则直接认为，该文章的署名作者“都有责任”。网友表示，原则上来说，一篇文章的所有署名人员必须：对研究工作的思路或设计有重要贡献，或者为研究获取、分析或解释数据；起草研究论文或者在重要的智力性内容上对论文进行修改；对将要发表的版本作最终定稿；同意对研究工作的各个方面承担责任以确保与论文任何部分的准确性或诚信有关的问题得到恰当的调查和解决。换句话说，其所有署名的作者都负有责任。

另外，还有部分媒体，对该事件可能对未来国内AI研究前景产生的负面影响表示担心。有媒体撰文表示，该篇论文之所以得到关注，正是因为作者署名多达100人，且其中不乏国内AI业界和学界的知名学者，供职机构更是把中国知名高校和互联网巨头几乎一网打尽。此次事件，或许会给中国 AI 学术研究热潮造成一定打击。

16篇文章组成的综述报告部分存问题：网友呼吁不应抹杀全部价值

不过，也有一些网友指出，作为世界上最大的预印本网站，arXiv上发表的论文有“占坑”性质，谁的论文在arXiv 挂的早，谁就拥有了这个论文的权力，因此为了抢先占住idea，有些论文的正规性欠缺打磨和推敲，此次“论文抄袭事件”，在某种程度上也反映出一些AI学术研究机构本不应有的急躁情绪，应引以为戒。

没有关键词

默认最早最热评分最高

0条

您可能感兴趣

搞懂物联网产业链其实很简单！《2023年中国AIoT产业全景图谱》重磅发布！

2022挚物·AIoT产业领袖峰会【线上直播】

理想辟谣发行数字货币：冒用名义发布不实信息，将追究法律责任

达实智能刘磅：物联网时代，安防企业应良知驱动、创新成长

智能养宠，小家电的出路

美的楼宇科技亮相碳博会，iBUILDING两大数智平台应对“双碳”新变局

热门文章

1

端侧AI领袖之声：比邻智联--无AI，不物联

1天前

2

万字回顾中国生成式AI大会！50+大咖演讲精华干货爆棚，来没来都值得收藏

1天前

3

针对极端天气的巨灾保险，物联网能够发挥什么作用？

1天前

4

蜂拥的人流量背后，这场展会凭什么号称“行业资源库”？

2天前

5

华为携手菲尼克斯，共推工业数智化

2天前

6

2025电子产业四大猜想，慕尼黑上海电子展带你一站了解政策、技术、市场的多维破局？

6天前

7

“具身智能十五大重点方向”明确产业发展热点，上下游合力推动具身时代到来

6天前

8

广和通亮相火山引擎“AIoT智变浪潮”，共探AI智能硬件全球化机遇

6天前

9

康盈半导体徐州测试基地投产，为存储产品品质护航

7天前

10

郭元强书记莅临格创东智调研人工智能产业发展情况

1周前

11

开放自动化OPA完成"量子跃迁"进入"实战元年",过程自动控制迎来全面安卓化

1周前

12

第二届“金灵光杯”中国互联网创新大赛“低空经济”专题赛报名即将开启

1周前

13

从消费到车规，华大电子携Qi2无线充全栈方案亮相亚洲充电展

1周前

14

提振消费政策背景下消费物联网的发展趋势

1周前

15

2025 SEMICON China首日，格创东智大模型 × Agent研讨会引爆半导体AI智造新浪潮

1周前

16

小米/京东/阿里/腾讯齐入局,大厂打响具身智能"军备竞赛"

1周前

17

华大电子闪耀亮相Auto CS，赋能智能网联安全新生态

1周前

18

2025边缘AI报告:实时自主智能,从范式创新到AI硬件的技术基础

1周前

19

共筑AI产业新未来 2025人工智能基础设施峰会成功召开

1周前

20

格创东智亮相SEMICON China 2025，以创新方案引领中国半导体产业智能化升级

1周前

英特尔中国研究院“双轮驱动，融合创新”，解锁智能发展新机遇

4月12日，以“智探索·汇无界”为主题的“2022英特尔中国研究院探索创新日”在北京举行...

2022-04-15

智次方·物联网智库 —— 研究型智能产业服务平台

关于智次方

友情链接

ITES深圳工业展

极客邦科技

智联车智库

智吱屋小程序

本站由阿里云提供计算与安全服务违法和不良信息举报电话：010-88884220 举报邮箱：liuzong@zzw.com 网上有害信息举报

©2022 北京英维塔科技有限公司京ICP备16012223号-1

京ICP备16012223号

智次方·物联网智库 —— 研究型智能产业服务平台

X