发表论文时,该不该引用arXiv上未出版的论文?

雷锋网
AI科技评论按:7月、8月接二连三的机器学习会议的论文评选中,论文的作者往往会被评委的一个问题激怒——评委在评选论文时,往往会说论文里引用的参考论文只是arXiv上的预印本。究其原因,目前arXiv上论文的水平参差不齐,很多论文都没有得出结果,或者引用别人错误的成果。在这种情况下,到底该不该引用arXiv上只是预印版的论文?

Zachary C. Lipton在Approximately Correct上的一篇文章中发表了对在arXiv上引用论文的看法:该引用时当然要引用。他是加州大学圣地亚哥分校计算机科学与工程系的博士生,即将成为卡内基梅隆大学的助理教授,对理论基础和机器学习的应用感兴趣。他的文章下面,也有很多人对该不该引用arXiv上的论文以及arXiv这个平台进行了讨论。雷锋网(公众号:雷锋网) AI 科技评论将他们的看法进行了整理编辑。

下面是Zachary C. Lipton的观点:

在刚刚过去的机器学习会议的论文提交高峰,许多业内人士对同行评审机制有了印象。一个特别热门的话题是arXiv预印服务。计算机科学家经常在正式发表论文前,将论文发表在arXiv上,以分享他们的想法并扩大影响。

尽管arXiv很受欢迎,许多论文作者还是被评审员的说法所激怒,产生很强烈的不满情绪,因为评审员说他们引用的论文只是arXiv上的预印本。

“真的要引用arXiv上的论文吗?”,他们抱怨到。

“算了吧,这些论文都没有出版!”,他们大声叫嚷。

让他们不满的源头是由于一些很幼稚的人越来越多的使用arXiv(滥用文献)。现在,深度学习的工具已经变得很强大,很容易复制一个repo,在新的数据集上运行它,改动一些超参数,然后就可以开始写论文的草稿了。那些只懂跟风的人会上传一些低质量的论文到 arXiv上,现在那种低质量的论文太多,搞得会议上都像完全充斥着由论文搬运工提交的低质量论文。

尤其令人担忧的是当研究人员预测一个研究领域将会成为热点,他们会先在这个领域占个坑。为了避免被人抢先一步,作者们可能会匆忙地把一份还没有完成研究的论文传到arXiv上,以保住他们的地盘:我们是第一个在X上进行研究的人,所有后续的研究者都得引用我们的论文。

NLP/ML 研究员Yoav Goldberg早前在Medium上发了篇博文,很不客气的批评了这种做法。

他严厉地痛斥了MILA研究小组的一篇论文,该论文中声称他们已经将生成对抗网络的方法运用到语言上。

他谈到论文里产生语言的方法是可笑的,比现在的任何技术都要糟糕得多。他推测他们是想先在那个领域占个坑,这样无论谁先研究出来,都需要引用他们这篇论文,因为他们这个想法在这个领域是开创性的。

在这种混乱的情况下,一些人对引用预印本论文的企业提出了质疑。所以,如果arXiv被滥用得这么严重,还要引用那些只出现在arXiv上的论文吗?

是的,当然。

不管什么时候,当我们知道自己的成果是遵循、复制或借鉴他人的想法时,我们就应该引用之前相关的研究。

有很多影响深远的研究都从未出版过,例如目前最伟大的数学论文。arXiv上的每一篇论文并不是都需要写出参考文献,但很多都会需要。断然地拒绝引用未出版的论文,这种想法有点儿荒谬。我们太过于相信会议组织者和过度工作的审稿专家了,这些审稿专家中大约有30%的人甚至无法理解论文的基本概要。

如果在回顾文献的时候想到了与自己的研究相类似的方法,就应该引用;如果我们明知自己的研究成果是建立在别人的工作之上,我们也应该引用;如果我们把别人分享的一个不太明显的想法发展成一篇论文,也应该提及到;如果有人临死前在餐巾纸上写了一个理论,这个理论开启了对机器学习的新的子领域的科学探索,我们应该把这个人写下的理论发表出来,转换成pdf传到arXiv上,然后再引用它。

当然,无稽之谈肯定不应该引用。许多评审员都在滥用arXiv系统,并荒谬的要求将论文与最近发布的预印本论文进行比较。厚颜无耻的占坑行为不值得奖励。评审不应该指责我们没有将自己的研究与两周前发表的不知道是否有用的算法进行比较。

我们不需要引用arXiv上的论文——这种观点太过于看重科研论文产生的过程,而对论文中想法本身的关注太少了。

对于该不该引用arXiv上的论文,也有更多人分享了他们的精彩观点:

  • 完全同意引用arXiv上的论文……你的观点中的所有来源都应该得到认可!
  • 佩雷尔曼发表了三篇论文证明了几何猜想(Geometrisation Conjecture),这些论文都很有名,但是你只能在arXiv上找到这些论文。你都不需要引用这些文章,因为谈起这些东西时人人都知道。有一条基本原则,我们不能因为论文只是发表在arXiv上就不去引用他们。
  • 不用多说,我并不信任匿名的同行评审机制。我认为所有的评审都应该是公开和公立的。当然,一开始可能会产生一些不必要的讨论和冲突。但是如果评审非常有把握,认为自己在这种顶级会议上接收或拒绝论文是有理可依的,那么你就应该光明正大的承认自己是评审。
  • 学术界的某些部分由赞助/支持网组成。这种网络助长了某些人的事业,维持了一些大机构的运作。但这对科学来说不是一件好事。有时候使用arXiv可能会助长这种不好的风气。

并不是所有人都同意提倡使用arXiv,大家的争论很多。arXiv一方面让人们能更加自由的发表论文和观点,另一方面,也让更多投机者想要先占个坑,趁机吹嘘自己并不成熟的结论。不过,当你的论文中的观点是站得住脚的,并且引用的论文有理可依,那么,该引用时就引用吧!

via:Approximately Correct

雷锋网 AI科技评论编译整理。

本文作者:思颖

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-10-17 09:24:27

发表论文时,该不该引用arXiv上未出版的论文?的相关文章

Linq查询中类型的转化以及序列化XXX对象时检测到循环引用

  我有一个Studen类型,有5个字段,num,name,birth,idcard,classId,我们一般写Linq查询的时候就是这样写 List<Student> stus =  from Student s in dc.Student select s;   那么其实我只想用其中的两个字段num,name,我就需要写一个dto StudentDto: num,name List<Student> stus =  from Student s in dc.Student   

.net-ef6 codefirst 多对多关系如何在查询时包含实体的引用对象

问题描述 ef6 codefirst 多对多关系如何在查询时包含实体的引用对象 例如有3个实体 public class A { public string Id {get; set;} public List<B> BList {get; set;} } public class B { public string Id {get; set;} [ForeignKey("CObj")] public string CId {get; set;} public C CObj

为什么我在朋友圈只发表文字时不能选择表情呢?

今天有网友问为什么我在朋友圈只发表文字时不能选择表情呢?她说看了之前的文章微信朋友圈怎么只发文字,然后测试长按拍照键可以发文字但没找到可以添加表情的地方,猜测她用的手机输入法没有默认表情的功能. ytkah的手机是装sg输入法(没有广告的意思),亲测表示微信朋友圈可以发表情 输入法中调用默认表情,还是有很多可以选择的,也能收藏一些漂亮的表情保存起来 如上图,微信朋友圈发文字和表情成功了,看截图红框部分.小伙伴们,你们也去试试吧!不会的朋友不用来找我了,祝你们好运!

序列化类型 System.Data.Entity.DynamicProxies 的对象时检测到循环引用

序列化类型 System.Data.Entity.DynamicProxies 的对象时检测到循环引用   详细错误内容为: 不应为数据协定名称为BlogArticle_8F5767B5CA34AC0BBFE8F59DB428937035A9A77CC2917A318A2808A379392602: http://schemas.datacontract.org/2004/07/System.Data.Entity.DynamicProxies"的类型"System.Data.Enti

奇点到来,超越人类 《Nature论文:人工智能从0-1自学打败阿法狗 》论文翻译

本文讲的是奇点到来,超越人类 <Nature论文:人工智能从0-1自学打败阿法狗 >论文翻译, 翻译前言 阿法狗 ZERO以100:0打败阿法狗 ,引起轰动,论文在Nature发表. 阿法狗 ZERO引起轰动的原因: 1.完全自学,超越人类. 2.发展出超越人类认知的新知识,新策略. 3.能够快速移植到新领域 纽约客杂志封面 本文是我和好友春(机器学习在读博士,研究方向为自然语言处理,机器学习,深度学习,微信号:zyc973950709)一同翻译,感谢.其中第三章考虑篇幅去掉,具体查看原文,或

“史上最牛硕士论文”是“替换键”搞定

东北财经大学2007年某篇硕士学位论文严重抄袭,与南京财经大学2006年一篇硕士学位论文惊人相似,被 网友称之"史上最牛硕士论文抄袭事件". 5月21日中午12时31分,有网友在某论坛杂谈版发表一篇题为<史上最牛硕士论文抄袭,直接用替换键搞定,我无语了>的帖子:"昨晚在期刊网上查资料的时候,无意中下载两篇硕士论文,打开细看原来真是抄袭,而且抄的特别夸张,直接用替换键搞定--" 两篇论文内容几乎一样 发帖人小萧所指的"史上最牛硕士论文抄袭&quo

实现整个网站系统只有一个connection对象,可是对象只能使用一次,再次调用时提示:connection对象的connectionstring属性未初始化?内含代码

问题描述 实现整个网站系统只有一个connection对象,可是对象只能使用一次,再次调用时提示:connection对象的connectionstring属性未初始化???????..................为什么????????创建connection对象publicclassPubConn{privatePubConn(){}privatestaticOracleConnectionDALPubConnection;publicstaticOracleConnectionPubCo

【商汤科技23篇论文横扫CVPR】林达华教授重磅揭秘冠军论文

国际计算机视觉与模式识别大会 (CVPR) 是人工智能尤其是计算机视觉领域的顶级学术会议.今年CVPR的文章录取率大约29%.在CVPR上发表的论文被公认为代表了该领域科技发展的最高水平.从今年7月21日开始这个一年一度的盛会就在美丽的夏威夷火奴鲁鲁召开.本届CVPR大会商汤科技与香港中大-商汤科技联合实验室共发表了23篇论文,超过了以人工智能技术著称的科技巨头Google (21篇)和FacebookAI Research (7篇).这23篇论文涵盖了计算机视觉的多个领域,不仅提出了很多新型的

崔永元自称11年未评上职称只因论文数没凑够

崔永元 (资料图) 华商网-华商报2月11日报道 昨日,崔永元在网上对某报发表的"中国论文总数多"的言论进行评论,并称自己论文就不多,还因此没评上职称. 崔永元在网上写道:"报纸上说,中国论文总数超美国居世界第一.闭着眼都知道里面瞎话有几多.俺就因为论文凑不够四篇,11年没评上职称."从留言中可以看出,大多 网友力挺崔永元,"恭王府"说:"那是因为崔老师不屑于写吧."不过有网友觉得崔永元此言过于片面,网友"宝宝&qu