【机器学习圈子里的裙带关系】学术“朋友圈”罪与罚

机器学习领域的裙带关系：不知名大学的好论文 VS 顶级实验室的好论文

今天Reddit发出了一个讨论，有用户指出他观察到的奇怪现象：

这可能是个带点争议性的话题。我最近注意到领域里存在很多裙带关系，我觉得需要指出一下。

今年NIPS的深度强化学习研讨会（Deep RL Symposium），12个演讲中有7个都来自伯克利的两个研究组。虽然这个研讨会上确实有这两个组的很多篇论文，但这个研讨会一共接收了80多篇论文，来自不同的研究组，这些论文原本也该得到关注。论文的选择过程是双盲的，但我忍不住怀疑演讲的选择不是。尤其是研讨会组的织者中，有一半（6人中的3人）与前面说的那两个实验室有着某种关联。

我很高兴强化学习终于有了比较高的认知度，但我也认为我们应该在研究传播的过程中保持谨慎。

对此，用户duh_cats表示，正是因为机器学习现在火了，这种学术圈早已普遍存在的现象也开始在机器学习领域凸显。“WELCOME！热烈欢迎来到一个蓬勃发展的学科，这里还有更多趣事等你来体验。”

用户metacurse给出了如下总结：

不知名大学的好论文：只有审稿人看过，仔细评分，然后发表
顶级实验室（Bengio/DeepMind/etc）的好论文：审稿人看过，适度评一评。作者，往往在Twitter上拥有几千乃至几万粉丝，在Twitter上把文章一发，论文在Twitter上得到更多关注。大家从论文的表述而非实际贡献来判断工作是否具有原创性（Novelty）。MIT科技评论、纽约时报等媒体，从最简单的概念里推导出最泛泛（generic）的功能，然而写标题党文章。论文作者成了领域中很小一处地盘的“思想领袖”，然后受邀到世界各地发表演讲。

metacurse甚至指名道姓地举出两个Twitter大V，说不知怎的他们如今成了元学习（meta-learning）的领袖，实际上两人的研究并不是很具原创性。

metacurse的评论显然将问题过分简化，并且描述了极端情况。同时，考虑到Reddit社区论坛的特性，这里更多是在闲聊。但是，不可否认，他确实戳到了一个痛点。

而且在这里，我们都甚至不需要展开去谈双盲评审的有效性。

知名学者和大V在论文传播中的“影响因子”

讨论中还引出了前不久谷歌大脑的一项工作。出身于谷歌大脑，并且还有GAN发明人，也是Twitter大V的Ian Goodfellow转发评述，这篇文章很快获得了很多关注。

谷歌大脑团队的研究者在ArXiv上传了题为“Are GANs Created Equal? A Large-Scale Study”的论文，对MM GAN、NS GAN、WGAN、WGAN GP、LS GAN、DRAGAN、BEGAN等近期出现的优秀GAN模型进行了比较，然后在摘要中写道：“我们没有发现本研究所测试的任何一个算法一直优于原始算法的证据。”

GAN的发明人Ian Goodfellow（他本人并没有参与这项工作）在Twitter评论称：ML的研究人员、审稿人和有关ML的新闻报道，需要对结果的统计稳健性和超参数的效果进行更认真的研究。这项研究表明，过去一年多的很多论文只是观察抽样误差，而不是真正的改进。论文：https://arxiv.org/pdf/1711.10337.pdf

但是，有人很快就指出了这篇文章的缺点。

Reddit用户NichG评论：

“这篇论文宣称要纠察GAN研究方法中的不足，也即专门挑选好的结果来展示（cherry-picking），然而自己在方法上恰恰就犯了这样的错误。”

NichG评论说，广泛的超参数搜索要查找包括学习率在内的很多东西的值。这导致论文中Frechet Inception Distance（FID）分数看起来令人绝望。狭义搜索的结果更为合理，也能显示出系统性的差异，但是这个数字被淹没在附录D中。

在分析实际数字的时候，第6.2节末尾有一个表格，用来比较模型和数据集。尽管论文的摘要声称没有找到证据表明任何测试的算法“总是胜过”原始数据，但该表显示平均FID得分实际上相差好几个标准偏差，而且最高排名也并不稳定。除MNIST外，每个数据集的最高排名都是WGAN或WGAN-GP，与下一个排名的差异在5到10个标准差之间。对于MNIST，WGAN和WGAN-GP也在最高排名的NS GAN的误差范围内。看平均排名，结果也一样。WGAN-GP的平均值比WGAN的平均值低了一个标准差，而WGAN的平均值比DRAGAN低一个多标准差。

这样看，谷歌大脑论文摘要中所说的“没有证据”就很奇怪了。我猜这是因为这总比说，“我们发现了系统性差异的证据，但这些差异取决于可用的计算资源”（WGAN收敛的速度明显要慢）要好。

这篇论文真正展示的是，不同的GAN在不同的情况下需要权衡，如果作者得出这个结论，那我不会有任何问题。然而，这篇论文却把自己定位成对GAN研究方法标准的批评，而这些标准并没有被它实际发现的东西所支持。就这一点而言，这有点像是有人先写出了结论，然后试图通过数据呈现的方式来支持这些结论。

这实在令人遗憾，因为本文中的实验对这些GAN进行了彻底的描述，这对研究社区来说是切实有用的。但它却被掩埋在了过分夸大的声明下面。我原本并不会这么恼火，但是有太多的人，在看完摘要后说“我就知道是这样！”也不去检查实际的结果，实在忍不住才写下这段话。

结语

裙带关系任何一个研究领域都有，依靠论文发表数量和引用的时候这种情况尤甚。“吸引人”和“真实可靠”之间难免存在权衡。而科学传播就更是一门科学，欢迎留下评论，说说你的看法。

原文发布时间为：2017-12-4

本文作者：闻菲

原文链接：【机器学习圈子里的裙带关系】学术“朋友圈”罪与罚

时间： 2024-08-03 16:44:23

【机器学习圈子里的裙带关系】学术“朋友圈”罪与罚的相关文章

一个微信群里做了关于朋友圈营销的分享

昨天在一个微信群里做了关于朋友圈营销的分享,总结成如下文章,可能有点乱,凑合着看下吧: 开始先和大家分享两个小故事吧,都是我在朋友圈发过的. 第一个故事: [非常励志:做朋友圈营销的创业故事]有个哥们儿在朋友圈卖东西,开始的时候完全没人搭理他,但功夫不负有心人,他每天坚持上货.拍照.修图.发到朋友圈,坚持了整整三个月,终于有了回报--所有人都把他拉黑了!拉黑了!!拉黑了!!! 第二个故事: [朋友圈10天8W销售额]聪明+实践人,有粉丝把我写的<小客栈如何做微信营销>的方法(这篇文章在我微信公

九度题目1526：朋友圈

题目1526:朋友圈时间限制:1 秒内存限制:128 兆特殊判题:否提交:934 解决:278 题目描述: 假如已知有n个人和m对好友关系(存于数字r).如果两个人是直接或间接的好友(好友的好友的好友...),则认为他们属于同一个朋友圈,请写程序求出这n个人里一共有多少个朋友圈. 假如:n = 5 , m = 3 , r = {{1 , 2} , {2 , 3} , {4 , 5}},表示有5个人,1和2是好友,2和3是好友,4和5是好友,则1.2.3属于一个朋友圈,4.5属于另一个

微信朋友圈视频变长从6秒增加为10秒

微信iOS版本发布更新了,"大视频"允许拍摄更长时间的视频:从原来的6秒增加为10秒.新版微信还支持从相册里分享视频到朋友圈,不再强制要求只有直接拍摄的"小视频"才能发布.其实更大的改变是视频的形式,新版本中,不管是在聊天界面,还是在朋友圈,微信支持相机直接拍摄的竖版视频,而不再是强制的正方形. 这是一个顺应移动拍摄习惯的改变,我们早就习惯了竖持手机拍摄视频:在手机观看视频时,能填满屏幕的竖版视频也能提供更强的沉浸感. 对了,还有个小彩蛋,在微信拍视频时可以切换前置

朋友圈营销过犹不及分享和营销要相得益彰

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅微信的朋友圈可以说是提升微信在移动互联网上优势重要功能,朋友圈同样也因此被深度挖掘,利用朋友圈进行营销,卖东西已经成了一件非常火爆的事情,甚至一度还出现了一些商家还因此在朋友圈中赚了大量的金钱,因为他们能够在朋友圈中竟然实现了月销售百万的奇迹,然而随着支付体系的崩溃以及淘宝向微信说不之后,使用朋友圈运营淘宝的作用已经被消除干净,而利用微信进行

最近和很多圈子里的朋友在讨论2014年的行业发展趋势

最近和很多圈子里的朋友在讨论2014年的行业发展趋势,有一点共识是移动电子商务市场会有一个大的爆发.但分歧主要在于腾讯(具体是微信)能否在移动电商(包括O2O)市场完成对电子商务领域的逆袭.笔者的意见倾向于不能,而朋友的意见大多是看好,最不济也是可以一战. 虽然说很多人把腾讯当做国内互联网行业的霸主,剿灭了不少中小同行,但其实实从腾讯这么多年的发展来看,有好几个领域是腾讯花了很大力气却没有做好的,电商就是其中最大的一个分支.对于马化腾的腾讯来说,电商如此庞大规模的市场中毫无建树是一件难以接受的失

朋友圈营销30天：开始容易，坚持难!

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅 9月12日,我写过一篇文章<微信朋友圈营销5天实操手记>,经过大家的微博丶微信转发,收到了很好的反响,我也增加了100多个微信粉丝!有买枸杞的丶有找我做代理的丶有咨询经验的丶有请我帮忙推送产品的丶有问我是不是单身要做菜给我吃的...总之,我发现,写文章是一件很有意思的事情!分享经验的同时,还可以找到很多认同!但是话又说回来,我从来

你的微信朋友圈变味了！

互联网固然"唯快不破""一招鲜吃遍天",但不能忘了为什么出发. 新媒体是一个需要大胆实践.不断探索的领域,充满未知和变数,但有一点永远不会变,那就是以人为本:以人的需求为核心,以人的体验为关键,以人的发展为目标几天前,微信宣布清理营销账户,对部分通过大量添加好友从事商业营销的个人微信号联系人数量进行控制.这项旨在保护用户体验.净化平台环境的行动,引来一片叫好声. 叫好的是那些深受营销宣传轰炸之苦的用户.从海外代购童装到泰国神奇减肥茶,从明星化妆品到私人蛋糕店--各

朋友圈营销鱼龙混杂微信商业化谨慎前行

今年3月底,微信月活跃用户达到3.96亿.在这个比网络社区更为封闭.人与人关系更为紧密的微信朋友圈里,一些人利用朋友圈的熟人经济营销商品,他们的标签是"微商".在这个圈子有的商品物美价廉,有的则有假冒嫌疑,有的让购买者欢喜不已,有的让人买完就后悔. 微商的做法引起了腾讯的关注.5月6日,微信事业群正式成立;5月16日,腾讯开展"雷霆行动"打击微信公众号和朋友圈的假货以及假海外代购.这或许标志着,鱼龙混杂的"微商"走到了"十字路口&quo

微信朋友圈营销30天实操手记：微信卖枸杞案例总结

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅 9月7日-10月15日,借助微信朋友圈营销,卖了38988元的枸杞.3600多元的蜂蜜,合计42588元零售额!这就是大雨和蝴蝶(hd12306),借助微信做朋友圈营销,实战30天的可量化结果! 之前看<赢在中国蓝天碧水间>,记得马云在点评碧水队失败的时候说过一句话:"我们赢,要思考我们侥幸在哪里!我们输,要思考我们哪些

猜你喜欢

JSP表单自动数据验证组件简介

js|数据从jsp到servlet或者action过程中还有很多需要处理的事情:数据有效性验证包括jsp页面的javascript验证和服务器端的验证.对文件上传的处理.文件上传大小的控制.防止二次 ...

做网站月入7000的网站赚钱经验

网站赚钱在落伍注册了快四年的时间了,也没少在这里逛,感受到众多站长们的辛酸和劳苦.前一阵看到ddz写了一篇<放眼落伍到处是疲惫的大小站长们怎么了?>,我看了深有感触.中国互联网络赚钱 ...

asp.net面试题收集

asp.net 1.new有几种用法第一种:new Class(); 第二种:覆盖方法 public new XXXX(){} 第三种:new 约束指定泛型类声明中的任何类型参数都必须有公共的无参数 ...

增加网站相关性不发外链做排名

大家都知道网站排名的重要因素,Google看重外链,而百度更加看重网站相关性.什么是网站相关性呢?当用户搜索关键词的时候,搜索引擎会尽可能地返回与这个关键词更相关的结果.当网页内容布局充分合理的时候, ...

Linux系统关机和重启命令简介

Linux有如下的关机和重启命令:shutdown, reboot, halt, poweroff,那么它们有什么区别呢? shutdown - 建议使用的命令 shutdown是最常用也是最安全的关 ...

使用icon fonts来辅助CSS处理图片

由于移动端设备拥有不同分辨率,PPI 等引起的问题, 常常需要针对不同屏幕分辨率来调整优化,如使用 @2x 图片, max-width 限制等. 采用 css @font-face 用来显示 ic ...

利用滤镜快速制作逼真的水波

教程介绍水波纹理的制作方法,前期需要用多种滤镜制作出黑白水纹效果,然后调色即可.运用滤镜的时候参数设置比较重要,具体需要根据实际图片大小来设置. 最终效果 1.新建一个640 * 480像素的文档, ...

photoshop制作彩色光效应教程

上星期,我像往常一样在机场等待登记,一副横幅上的标志吸引了我的注意,它是索尼的一款称为Xperia的手机广告.真正吸引我注意的是手机的墙纸.这是一个横穿屏幕的多彩光线.我真的很喜欢这个效果,因此写出了 ...

怎么解决win7系统aliedit.dll文件丢失

首先按"Win+R"组合键打开"运行"提示窗口,并输入:regsvr32 c:windowssystem32alieditaliedit.dll,然后按回车 ...

eMule怎么设置最好

eMule的最佳设置与使用的互联网连接类型.速度以及操作系统密切相关.请尽量使用向导来选择合理的预设值.其中最重要的是提供关于互联网连接和操作系统的正确信息. 常见的DSL 512/128(数字用 ...

如何解救被劫持的路由器

一.案例再现--路由器被劫持了! 1.故障描述某公司的内网是在三层交换处划分的VLAN,最后通过路由器与远程连接,网内有近二百台主机.前段时间网络出现了这样一个故障:公司网络网速缓慢,且出现延 ...

PS教你简单8步打造双重曝光效果

双重曝光效果在很多海报和图片上都可以看到.这种效果由两张叠加的图片构成.通过复杂的叠加做出惊艳的效果,这种例子已经很多,通常是人脸同自然景观的叠加.我一直想在PS中做一次尝试,现在终于有时间来做一 ...

枚举类型-json 转化带枚举属性的对象

问题描述 json 转化带枚举属性的对象我在后台定义了一个实体,这个实体里面有一个属性是枚举类型的, 现在需要前台将这个对象通过ajax传递到后台这个枚举类型要怎么传啊或者说,这个js的对象要怎 ...

移动APP渗透测试方案展示5个方面总结3种常见漏洞—转载绿盟科技

移动APP渗透测试方案展示5个方面总结3种常见漏洞发布时间:2017年10月26日 10:47 浏览量:1193 绿盟科技这几天连出渗透测试文章,真是干货啊.之前安全加介绍了金融行业实 ...

谈谈我的企业网站营销

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅今天来谈谈网站2508.html& ...

visual studio-vs2013 未能正确加载eurekapackage

问题描述 vs2013 未能正确加载eurekapackage vs2013 未能正确加载eurekapackage 怎么解决啊!!! 解决方案未能正确加载程序集或它的依赖项解决方案二: http ...

编程-注释掉后出问题了，怎么回事？

问题描述注释掉后出问题了,怎么回事? 解决方案 28行也要注释. 另外,不用C币悬赏也能提问哦解决方案二: 你是用的是IDE,它可能自动为你创建了相应的代码,就像用VS写程序一样. 检查一下界面文 ...

javascript正则式表单验证，求大神帮看看问题出在那。

问题描述 javascript正则式表单验证,求大神帮看看问题出在那. 为什么我function show函数组为什么不起作用,输入错了也能跳转到2.html.提示也没有. 解决方案 show函数怎么 ...

现代Linux的五大初始化系统（1992-2015）

在 Linux 和其他类 Uniux 系统中,init(初始化)进程是系统启动时由内核执行的第一个进程,其进程 ID(PID)为 1,并静默运行在后台,直到系统关闭. init 进程负责启动其他所有的 ...

基于 Docker 开发 NodeJS 应用

这是两篇文章的第一篇.本文涵盖了有关在使用Express框架开发一个Node应用时,用Docker 替代Vagrant 的比较详细的教程, 应用将使用 connect-redis 中间件将会话信息持久 ...

GPDB · 特性分析 · Segment 修复指南

问题背景 GPDB是中央控制节点式的架构,在一个 GreenPlum 集群中,有一个 Master 节点和多个 Segment 节点.Master 是中央控制节点,Segment 是数据存放节点.所有 ...

MySQL二进制日志（binary log）总结

原文:MySQL二进制日志(binary log)总结本文出处:http://www.cnblogs.com/wy123/p/7182356.html (保留出处并非什么原创作品权利,本人拙作还 ...

jxl(java Excel Api)-apache POI(HSSF - XSSF - SXSSF) selenium数据源--Excel

Apache POI API 性能分析图: 资本在有些人眼里,他自己是一颗珍珠:在有些人眼里,他自己是一块石头.有的时候,人必须明白自己是普通的石头,而不是价值连城的珍珠.要出人头地问鼎成功,需要 ...

hive中partition如何使用

网上有篇关于hive的partition的使用讲解的比较好,转载了: 一.背景 1.在Hive Select查询中一般会扫描整个表内容,会消耗很多时间做没必要的工作.有时候只需要扫描表中关心的一部分数 ...

ubuntu 10.4 The APR based Apache Tomcat not found

问题描述 The APR based Apache Tomcat Native library which allows optimal performance in production envir ...

Nginx模块参考手册：uWSGI模块(uWSGI)

这些模块默认会全部编译进Nginx,除非手工指定某个模块在configure时排除. 为uwsgi协议提供支持.示例配置: location / { uwsgi_pass unix:///var/ru ...

error-.net websocket 实现报错

问题描述 .net websocket 实现报错 Error during WebSocket handshake: Unexpected response code: 200 chrome控制台报 ...

商场成网购一族“试验间”

近来在年轻白领和学生中兴起了这样的一群网购一族,他们在大商场.专卖店里频频试穿.试用,但却不买,只记下货号或者拍下照片,然后到网上去淘货.在实体经济与虚拟经济的较量中,不少商场成为网购一族的" ...

java-求大神指教，跪求，跪求大神。

问题描述求大神指教,跪求,跪求大神. java怎么实现:当鼠标和键盘10分钟不动,然后我把登陆用户的头像改为离线,(只要说出怎么判断鼠标和键盘十分钟不动就可以) 解决方案跪求大神解答应届毕业生跪求 ...

《C和C++代码精粹》导读

前言 C和C++代码精粹本书适合于那些C和C++的职业程序员.假如你已熟悉这两种语言的语法和基本结构,这本书能够为你创建有效的.实用的程序提供实践性的指导.每一个代码范例或程序范例均标明行之有效的用 ...

热搜