【机器学习圈子里的裙带关系】学术“朋友圈”罪与罚

机器学习领域的裙带关系:不知名大学的好论文 VS 顶级实验室的好论文

今天Reddit发出了一个讨论,有用户指出他观察到的奇怪现象:

这可能是个带点争议性的话题。我最近注意到领域里存在很多裙带关系,我觉得需要指出一下。

今年NIPS的深度强化学习研讨会(Deep RL Symposium),12个演讲中有7个都来自伯克利的两个研究组。虽然这个研讨会上确实有这两个组的很多篇论文,但这个研讨会一共接收了80多篇论文,来自不同的研究组,这些论文原本也该得到关注。论文的选择过程是双盲的,但我忍不住怀疑演讲的选择不是。尤其是研讨会组的织者中,有一半(6人中的3人)与前面说的那两个实验室有着某种关联。

我很高兴强化学习终于有了比较高的认知度,但我也认为我们应该在研究传播的过程中保持谨慎。

对此,用户duh_cats表示,正是因为机器学习现在火了,这种学术圈早已普遍存在的现象也开始在机器学习领域凸显。“WELCOME!热烈欢迎来到一个蓬勃发展的学科,这里还有更多趣事等你来体验。”

用户metacurse给出了如下总结:

  • 不知名大学的好论文:只有审稿人看过,仔细评分,然后发表
  • 顶级实验室(Bengio/DeepMind/etc)的好论文审稿人看过,适度评一评。作者,往往在Twitter上拥有几千乃至几万粉丝,在Twitter上把文章一发,论文在Twitter上得到更多关注。大家从论文的表述而非实际贡献来判断工作是否具有原创性(Novelty)。MIT科技评论、纽约时报等媒体,从最简单的概念里推导出最泛泛(generic)的功能,然而写标题党文章。论文作者成了领域中很小一处地盘的“思想领袖”,然后受邀到世界各地发表演讲。

metacurse甚至指名道姓地举出两个Twitter大V,说不知怎的他们如今成了元学习(meta-learning)的领袖,实际上两人的研究并不是很具原创性。

metacurse的评论显然将问题过分简化,并且描述了极端情况。同时,考虑到Reddit社区论坛的特性,这里更多是在闲聊。但是,不可否认,他确实戳到了一个痛点。

而且在这里,我们都甚至不需要展开去谈双盲评审的有效性。

知名学者和大V在论文传播中的“影响因子”

讨论中还引出了前不久谷歌大脑的一项工作。出身于谷歌大脑,并且还有GAN发明人,也是Twitter大V的Ian Goodfellow转发评述,这篇文章很快获得了很多关注。

谷歌大脑团队的研究者在ArXiv上传了题为“Are GANs Created Equal? A Large-Scale Study”的论文,对MM GAN、NS GAN、WGAN、WGAN GP、LS GAN、DRAGAN、BEGAN等近期出现的优秀GAN模型进行了比较,然后在摘要中写道:“我们没有发现本研究所测试的任何一个算法一直优于原始算法的证据。”

GAN的发明人Ian Goodfellow(他本人并没有参与这项工作)在Twitter评论称:ML的研究人员、审稿人和有关ML的新闻报道,需要对结果的统计稳健性和超参数的效果进行更认真的研究。这项研究表明,过去一年多的很多论文只是观察抽样误差,而不是真正的改进。论文:https://arxiv.org/pdf/1711.10337.pdf

但是,有人很快就指出了这篇文章的缺点。

Reddit用户NichG评论:

“这篇论文宣称要纠察GAN研究方法中的不足,也即专门挑选好的结果来展示(cherry-picking),然而自己在方法上恰恰就犯了这样的错误。”

NichG评论说,广泛的超参数搜索要查找包括学习率在内的很多东西的值。这导致论文中Frechet Inception Distance(FID)分数看起来令人绝望。狭义搜索的结果更为合理,也能显示出系统性的差异,但是这个数字被淹没在附录D中。

在分析实际数字的时候,第6.2节末尾有一个表格,用来比较模型和数据集。尽管论文的摘要声称没有找到证据表明任何测试的算法“总是胜过”原始数据,但该表显示平均FID得分实际上相差好几个标准偏差,而且最高排名也并不稳定。除MNIST外,每个数据集的最高排名都是WGAN或WGAN-GP,与下一个排名的差异在5到10个标准差之间。对于MNIST,WGAN和WGAN-GP也在最高排名的NS GAN的误差范围内。看平均排名,结果也一样。WGAN-GP的平均值比WGAN的平均值低了一个标准差,而WGAN的平均值比DRAGAN低一个多标准差。

这样看,谷歌大脑论文摘要中所说的“没有证据”就很奇怪了。我猜这是因为这总比说,“我们发现了系统性差异的证据,但这些差异取决于可用的计算资源”(WGAN收敛的速度明显要慢)要好。

这篇论文真正展示的是,不同的GAN在不同的情况下需要权衡,如果作者得出这个结论,那我不会有任何问题。然而,这篇论文却把自己定位成对GAN研究方法标准的批评,而这些标准并没有被它实际发现的东西所支持。就这一点而言,这有点像是有人先写出了结论,然后试图通过数据呈现的方式来支持这些结论。

这实在令人遗憾,因为本文中的实验对这些GAN进行了彻底的描述,这对研究社区来说是切实有用的。但它却被掩埋在了过分夸大的声明下面。我原本并不会这么恼火,但是有太多的人,在看完摘要后说“我就知道是这样!”也不去检查实际的结果,实在忍不住才写下这段话。

结语

裙带关系任何一个研究领域都有,依靠论文发表数量和引用的时候这种情况尤甚。“吸引人”和“真实可靠”之间难免存在权衡。而科学传播就更是一门科学,欢迎留下评论,说说你的看法。

原文发布时间为:2017-12-4

本文作者:闻菲

原文链接:【机器学习圈子里的裙带关系】学术“朋友圈”罪与罚

时间: 2024-08-03 16:44:23

【机器学习圈子里的裙带关系】学术“朋友圈”罪与罚的相关文章

一个微信群里做了关于朋友圈营销的分享

昨天在一个微信群里做了关于朋友圈营销的分享,总结成如下文章,可能有点乱,凑合着看下吧: 开始先和大家分享两个小故事吧,都是我在朋友圈发过的. 第一个故事: [非常励志:做朋友圈营销的创业故事]有个哥们儿在朋友圈卖东西,开始的时候完全没人搭理他,但功夫不负有心人,他每天坚持上货.拍照.修图.发到朋友圈,坚持了整整三个月,终于有了回报--所有人都把他拉黑了!拉黑了!!拉黑了!!! 第二个故事: [朋友圈10天8W销售额]聪明+实践人,有粉丝把我写的<小客栈如何做微信营销>的方法(这篇文章在我微信公

九度题目1526:朋友圈

  题目1526:朋友圈 时间限制:1 秒 内存限制:128 兆 特殊判题:否 提交:934 解决:278 题目描述: 假如已知有n个人和m对好友关系(存于数字r).如果两个人是直接或间接的好友(好友的好友的好友...),则认为他们属于同一个朋友圈,请写程序求出这n个人里一共有多少个朋友圈. 假如:n = 5 , m = 3 , r = {{1 , 2} , {2 , 3} , {4 , 5}},表示有5个人,1和2是好友,2和3是好友,4和5是好友,则1.2.3属于一个朋友圈,4.5属于另一个

微信朋友圈视频变长从6秒增加为10秒

微信iOS版本发布更新了,"大视频"允许拍摄更长时间的视频:从原来的6秒增加为10秒.新版微信还支持从相册里分享视频到朋友圈,不再强制要求只有直接拍摄的"小视频"才能发布.其实更大的改变是视频的形式,新版本中,不管是在聊天界面,还是在朋友圈,微信支持相机直接拍摄的竖版视频,而不再是强制的正方形. 这是一个顺应移动拍摄习惯的改变,我们早就习惯了竖持手机拍摄视频:在手机观看视频时,能填满屏幕的竖版视频也能提供更强的沉浸感. 对了,还有个小彩蛋,在微信拍视频时可以切换前置

朋友圈营销过犹不及 分享和营销要相得益彰

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 微信的朋友圈可以说是提升微信在移动互联网上优势重要功能,朋友圈同样也因此被深度挖掘,利用朋友圈进行营销,卖东西已经成了一件非常火爆的事情,甚至一度还出现了一些商家还因此在朋友圈中赚了大量的金钱,因为他们能够在朋友圈中竟然实现了月销售百万的奇迹,然而随着支付体系的崩溃以及淘宝向微信说不之后,使用朋友圈运营淘宝的作用已经被消除干净,而利用微信进行

最近和很多圈子里的朋友在讨论2014年的行业发展趋势

最近和很多圈子里的朋友在讨论2014年的行业发展趋势,有一点共识是移动电子商务市场会有一个大的爆发.但分歧主要在于腾讯(具体是微信)能否在移动电商(包括O2O)市场完成对电子商务领域的逆袭.笔者的意见倾向于不能,而朋友的意见大多是看好,最不济也是可以一战. 虽然说很多人把腾讯当做国内互联网行业的霸主,剿灭了不少中小同行,但其实实从腾讯这么多年的发展来看,有好几个领域是腾讯花了很大力气却没有做好的,电商就是其中最大的一个分支.对于马化腾的腾讯来说,电商如此庞大规模的市场中毫无建树是一件难以接受的失

朋友圈营销30天:开始容易,坚持难!

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 9月12日,我写过一篇文章<微信朋友圈营销5天实操手记>,经过大家的微博丶微信转发,收到了很好的反响,我也增加了100多个微信粉丝!有买枸杞的丶有找我做代理的丶有咨询经验的丶有请我帮忙推送产品的丶有问我是不是单身要做菜给我吃的...总之,我发现,写文章是一件很有意思的事情!分享经验的同时,还可以找到很多认同!但是话又说回来,我从来

你的微信朋友圈变味了!

互联网固然"唯快不破""一招鲜吃遍天",但不能忘了为什么出发. 新媒体是一个需要大胆实践.不断探索的领域,充满未知和变数,但有一点永远不会变,那就是以人为本:以人的需求为核心,以人的体验为关键,以人的发展为目标 几天前,微信宣布清理营销账户,对部分通过大量添加好友从事商业营销的个人微信号联系人数量进行控制.这项旨在保护用户体验.净化平台环境的行动,引来一片叫好声. 叫好的是那些深受营销宣传轰炸之苦的用户.从海外代购童装到泰国神奇减肥茶,从明星化妆品到私人蛋糕店--各

朋友圈营销鱼龙混杂 微信商业化谨慎前行

今年3月底,微信月活跃用户达到3.96亿.在这个比网络社区更为封闭.人与人关系更为紧密的微信朋友圈里,一些人利用朋友圈的熟人经济营销商品,他们的标签是"微商".在这个圈子有的商品物美价廉,有的则有假冒嫌疑,有的让购买者欢喜不已,有的让人买完就后悔. 微商的做法引起了腾讯的关注.5月6日,微信事业群正式成立;5月16日,腾讯开展"雷霆行动"打击微信公众号和朋友圈的假货以及假海外代购.这或许标志着,鱼龙混杂的"微商"走到了"十字路口&quo

微信朋友圈营销30天实操手记:微信卖枸杞案例总结

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 9月7日-10月15日,借助微信朋友圈营销,卖了38988元的枸杞.3600多元的蜂蜜,合计42588元零售额!这就是大雨和蝴蝶(hd12306),借助微信做朋友圈营销,实战30天的可量化结果! 之前看<赢在中国蓝天碧水间>,记得马云在点评碧水队失败的时候说过一句话:"我们赢,要思考我们侥幸在哪里!我们输,要思考我们哪些