Facebook 基于十亿单词量构建高效神经网络模型

使用神经网络进行序列预测是众所周知的计算机科学问题，在语音识别、机器翻译、语言建模和其他领域中都有着广泛的应用。这种预测使用的模型对计算能力要求很高，这限制了它们的实际应用。

Facebook AI Research的科学家设计了自适应的softmax算法，这是一种为GPU定制的近似算法，可在庞大的单词量基础上高效地训练神经网络。如公开发表的论文中所描述的，自适应softmax利用单词在大语料库中的不均衡分布，形成可以最小化计算复杂度的群集。完全softmax与词汇库大小线性相关，而自适应softmax是次线性相关的，并且针对GPU进行了优化。

在开发softmax的同时，Facebook研究人员发布了开源库torch-rnnlib，帮助研究人员设计和测试GPU中的递归模型。有了torch.cudnn，可以使用NVIDIA CUDA Deep Neural Network库轻松访问基线。RNN、LSTM、GRU和其他递归神经网络都有具体的实现，研究人员可以很容易地把它们用于递归神经网络的设计。

Facebook研究人员在单个GPU上对该算法进行测试，速度达到了每秒12500个单词，同时保持精确度接近完全softmax。从基准困惑度来看，谷歌公司的Jozefowicz等人在2016年使用32个GPU训练了3个星期得到30的困惑度（越低越好），同时使用18个GPU训练了几天得到44的困惑度。Google使用Tensorflow实现的LSTM模型发布在Github上，它的主要作者在Reddit的相关话题中提出了一个有趣的方法来解释困惑度。相反地，自适应softmax可以在大约14小时内达到50的困惑度，在一两天内达到43.9的困惑度以及在六天内达到39.8的困惑度。如果没有CuDNN库，性能下降约30％。所有工具和技术都针对EuroParl和十亿字语料库进行过测试，这些语料库是当前可获得的最大的几个语料库。

文章转载自开源中国社区 [http://www.oschina.net]

时间： 2024-08-31 20:30:17

Facebook 基于十亿单词量构建高效神经网络模型的相关文章

Facebook通过10亿单词构建有效的神经网络语言模型

由于在语言识别.机器翻译和语言建模等领域表现出了优异的性能,为序列预测而设计的神经网络最近再次引起了人们的兴趣,但是这些模型都是计算密集型的,成本非常高.比如在语言建模领域,最新的成果依然需要在大规模GPU集群上训练几周的时间,虽然效果不错,但是这些计算密集型的实践对大规模计算基础设施的依赖性非常强,这限制了其在学术和生产环境中的研究速度与应用. 针对这一计算瓶颈,Facebook AI 研究院(FAIR)设计了一个新的.几乎是为GPU量身定制的softmax函数,能够非常有效地通过大规模词库训

Facebook:应用内链崛起 APP Link链接超十亿

硅谷网讯在年初的F8开发大会上,社交网络http://www.aliyun.com/zixun/aggregation/1560.html">Facebook,推出了一个让移动应用软件的内容相互链接的技术标准体系App-Link,这可以让移动应用实现类似互联网网页的相互跳转.日前,Facebook宣布,基于这一技术的链接数量,已经超过十亿个. 经常使用APP的网民会发现,从一个应用内部跳转到其他应用,十分麻烦,每一个APP,甚至正在形成一个信息孤岛,这违背了互联网的开放精神.而Faceb

D1net阅闻：Facebook聊天工具Messenger用户突破十亿人

Facebook聊天工具Messenger用户突破十亿人 PC互联网时代的社交网络霸主Facebook,正在成为移动互联网时代的移动聊天霸主.继WhatsApp用户已经超过十亿人之后,其另外一款聊天工具Facebook Messenger用户规模也超过了十亿人. 英特尔第二财季净利润13.3亿美元同比降51% 7月21日消息,英特尔发布了该公司截至7月2日的2016财年第二财季财报.财报显示,英特尔第二财季营收为135亿美元,同比增长3%:净利润为13.3亿美元,同比下滑51%.

《江南Style》成YouTube首个点击量破十亿视频

12月22日消息,韩国艺人PSY"鸟叔"的<http://www.aliyun.com/zixun/aggregation/9960.html">江南Style>视频点击量,首次突破了十亿大关. 这成为YouTube首个点播量突破十亿的视频.该视频也是被最多人标注"Like"的视频. "鸟叔"此前曾经发行了五张专辑,但是直到7月15日其发布"骑马舞"视频之后,他才被全世界所熟知. 7月28日,该段视

继WhatsApp后 Facebook聊天工具Messenger用户也突破十亿人

PC互联网时代的社交网络霸主Facebook,正在成为移动互联网时代的移动聊天霸主.继WhatsApp用户已经超过十亿人之后,其另外一款聊天工具Facebook Messenger用户规模也超过了十亿人. 据美国科技新闻网站CNET报道,Facebook周三对外宣布了这一里程碑的消息.这意味着Facebook一家,拥有了两款月活跃用户超过十亿人的手机聊天工具. 在两款工具中,WhatsApp是Facebook当年斥资220亿美元收购而来,目前已经成为全球手机聊天的霸主.统计显示WhatsApp

Oculus和Facebook合作研发MMO游戏用户可达十亿

Oculus的CEO布伦丹?艾瑞比(Brendan Iribe)今日透露,未来与http://www.aliyun.com/zixun/aggregation/1560.html">Facebook合作的宏大前景之一:创建一款十亿用户可同时参与虚拟现实的MMO(大型多人在线)游戏.当Facebook斥资20亿美元购买虚拟现实(VR)设备开发商Oculus时,两者对将来的目标均守口如瓶.人们曾预测这笔钱将帮助Oculus研发价格更便宜.质量更优的虚拟现实耳机,而Facebook将拥有引领新

【转贴】两年内从零到每月十亿 PV 的发展来谈 Pinterest 的架构设计

来源: http://www.oschina.net/translate/scaling-pinterest-from-0-to-10s-of-billions-of-page-views 英文原文:Scaling Pinterest - From 0 to 10s of Billions of Page Views a Month in Two Years 标签: <无> 45人收藏此文章, 我要收藏oschina 推荐于 5天前 (共 17 段, 翻译完成于 04-19) (7评)

如何做到“恰好一次”地传递数十亿条消息

在分布式领域中存在着三种类型的消息投递语义,分别是:最多一次(at-most-once).至少一次(at-least-once)和恰好一次(exactly-once).本文作者介绍了一个利用Kafka和RocksDB来构建的"恰好一次"消息去重系统的实现原理. 对任何一个数据流水线的唯一要求就是不能丢失数据.数据通常可以被延迟或重新排序,但不能丢失. 为了满足这一要求,大多数的分布式系统都能够保证"至少一次"的投递消息技术.实现"至少一次"的投递

云计算用1.5KB内存为十亿对象计数方法

为了更好地理解已经明确基数的大数据集的挑战,我们假设你的日志文件包含16个字符的ID,并且你想统计不同ID的数量.例如: 4f67bfc603106cb2 这16个字符需要用128位来表示.6万5千个ID将需要1MB的空间.我们每天收到30多亿条事件记录,每条记录都有一个ID.这些ID需要3840亿位或45GB的存储.而这仅仅是ID字段需要的空间.我们采取一种简单的方法获取日常事件记录中以ID为基数的数据.最简单的办法就是使用哈希集合且存放到内存中,其中哈希集包含唯一ID的列表(即输入文件中可能

猜你喜欢

一次入侵网校的经历

一前言我们hacking时有时是靠运气的比如我说的这次.是什么网校我就先不说了.对方的asp系统我没有找到任何的漏洞.连注入都没有,又没有论坛.不知道是真还是假的我竟然扫到了对方有ida漏洞 ...

实战经验分享如何恢复site首页不在第一位现象

对于site首页不在第一页情况,遇到的这样情况站长不在少数.包括我在内也之前困扰着site首页不在第一页的烦恼.特别是新站长,或者是新学习SEO的站长们,都会遇到这样的情况,对于这样情况是不是冷静对待 ...

SEO加速器促使网页搜索排序加速提升的原理

第一个是有趣的事情新做网站的站长,都发现过一个有趣的事情:访问量会从几十人一下子飙升到1000多人. 网站上线后,自己每天辛辛苦苦地增加内容,每天勤勤快快地宣传,想让更多人来欣赏自己的网站,也算不白 ...

用Win PE安装Windows 7的注意事项

由于Windows 7 安装"载体无关性"的新特性,可以让我们灵活地.随心所欲地来安装或部署 Windows 7.目前在网上盛传着各类介绍 Windows 7 安装方式的资讯,如: ...

Office 2010试用（一）从精简版无法升级

今天看到小松发的Office2010活动凑热闹也下回来看了看. 试用版文件大小793M,以1M的带宽来说,下载用时2小时15分左右.还算可以接受. 提供一个MAK: 83CM4-GC4TF-HPVX ...

Fireworks 制作倾慕系列图标

效果图如下: 1.画一个233*172 的圆角矩形并填充#400000 -#999999 的线性渐变,然后设定其参数如图: 2.对第一步绘制的矩形添加滤镜,参数如下. 3.将第一.二步绘制的矩形复 ...

迅雷快鸟该产品正式上线后是否和天翼光速一样绑定宽带?

全国平台地区(贵州.北京.辽宁.天津.西藏.浙江.四川.福建.湖南.安徽.江西.重庆.新疆.海南.宁夏.山东.广西.山西太原.湖北武汉)不需要绑定宽带. 广东及江苏地区暂未有通知,建议您后续留意.

打印机经常卡纸怎么办

对于上班族来说,遇到打印机卡纸是一件比较头疼的事情.究竟打印机卡纸是什么原因?其实出现打印机卡纸问题有很多原因,比如所选纸张质量不符合打印机要求,装纸盘安装不得当,打印机里面含有纸屑.正在打印时抽 ...

android-调用安卓摄像头摄像的一系列问题

问题描述调用安卓摄像头摄像的一系列问题 1 怎么样才能保存到手机默认的图库里啊2 自定义的路径在文件管理里找不到3怎么压缩图片和视频啊网上的代码自己用不起来谁有能跑起来的源代码啊! 多谢终身感 ...

跟我学Nodejs（一）--- Node.js简介及安装开发环境_javascript技巧

学习资料 1.深入浅出Node.js 2.Node.js开发指南简介(只捡了我觉得重要的) Node.js是让Javascript脱离浏览器运行在服务器的一个平台,不是语言: Nod ...

STL实现哈夫曼算法

用C++ std::priority_queue 实现哈夫曼算法我想每个计算机专业的学生或多或少都接触过哈夫曼编码,数据结构中的老问题了.大体就是给出一些字符,和这些字符的出现频率,让你为这些字符设计 ...

Struts2的包导入的目录位置不同，效果影响使用的问题？

问题描述 Struts2的包导入的目录位置不同,效果影响使用的问题? 我把包导入到Java Resources下libraries里时运行文件时一直出现404错误,提示org.apache.strut ...

mysql5.9安装出错-Myaql安装是在check requirments时出错

问题描述 Myaql安装是在check requirments时出错 ![ check时没有安装visual studio1.2.5和connector/Python 求高手指点,急等,跪求!!!!! ...

Python OOP知识积累

前言 Python是一个功能非常强大的编程语言.玩法很多.但是在我们享受Python带来的编程乐趣之前,我们必须要掌握OOP编程技能,这样才能够更好的应用Python高级功能.OOP我曾经在<P ...

宏正CL5716 KVM多电脑首创指纹辨识功能

每个人包括指纹在内的皮肤纹路在图案.断点和交叉点上各不相同,呈现惟一性且终生不变.据此,我们就可以把一个人同他的指纹对应起来,通过将他的指纹和预先保存的指纹数据进行比较,就可以验证它的真实身份,这就是 ...

java 指纹识别-利用电脑上自带指纹识别嵌入程序中

问题描述利用电脑上自带指纹识别嵌入程序中我毕设做的基于指纹识别的银行卡业务系统,用java开发,但是我不知道如何用java获取电脑上获得指纹,并把它嵌入到数据库内,求大神指点!!

visual studio 2010-vs2010中，怎么批量地用_T(&amp;quot;aaa&amp;quot;)，替换&amp;quot;aaa&amp;quot;。aaa表示字符串

问题描述 vs2010中,怎么批量地用_T("aaa"),替换"aaa".aaa表示字符串 30C 现在升级一个MFC工程项目,从VC6.0升级到VS2010, ...

数据结构c++语言-数据结构C++语言解决迷宫问题

问题描述数据结构C++语言解决迷宫问题标题: 迷宫问题时限: 100000 ms 内存限制: 100000 K 总时限: 3000 ms 描述: 迷宫问题迷宫是一个二维矩阵,其中1为墙,0为 ...

基本数据类型数据对象包装类小结

Java提供两种不同的类型:引用类型和原始类型(或内置类型).Int是java的原始数据类型,Integer是java为int提供的封装类.Java为每个原始类型提供了封装类. 原始类型封装类 b ...

android-求教：Android socket通信，发送多条，下面是代码

问题描述求教:Android socket通信,发送多条,下面是代码个人写了一个Android Socket的简单通信代码,就是客户端往服务端发送两条数据,但是服务端在接收第二条数据的时候提示so ...

解密勒索软件遭到疯狂报复 Enjey勒索软件在攻击 cloudflare防护在等待

勒索软件Enjey对ID Ransomware在线服务实施了DDoS攻击, 因为 ID Ransomware索引了勒索软件作者刚发布的软件,而且居然还发现了方法,解密他的勒索软件. ID Ransom ...

jQuery给元素添加样式的方法详解_jquery

本文实例讲述了jQuery给元素添加样式的方法.分享给大家供大家参考,具体如下: 1.获取和设置样式 $("#tow").attr("class")//获取ID ...

国外工程机械新技术、新结构与发展趋势

摘要:自90年代以来,国外工程机械进入了一个新的发展时期,在广泛应用新技术的同时,不断涌现出新结构和新产品.继完成提高整机可靠性任务之后,技术发展的重点在于增加产品的电子信息技术含量,努力完善产品的标 ...

Elon Mask又搞大事情：新公司要将人脑与机器连接，给大脑上传想法不再是科幻

百万富翁,传奇创业人物,未来主义者Elon Musk是我们很多人心中神一样的人物.据报道,除了准备着送人类上月球旅游和开发新一代特斯拉之外,他正在支持一家名为Neuralink的链接人脑和机器的创业公 ...

用cublas库求矩阵范数，求各位大神看看代码哪里不对

问题描述用cublas库求矩阵范数,求各位大神看看代码哪里不对 void *device_numofduanyuan; cublasHandle_t handler; cudaEvent_t cub ...

谷歌联手时光网开启电影搜索新服务

"五一"期间,搜索巨头谷歌(Google)联手国内专业的电影与影院资讯平台时光网推出了"电影院Onebox"产品.业内人士指出,"电影院Onebox& ...

《CCNP TSHOOT 300-135认证考试指南》——5.9节复习所有考试要点

5.9 复习所有考试要点 CCNP TSHOOT 300-135认证考试指南请复习本章所有的考试要点,在页边距中我们已使用图标"考试要点"进行了标注.表5-5列出了这些考试要点.

《数据库原理与应用（第3版）》——习题

习题 1.?解释数据模型的概念.为什么要将数据模型分成两个层次? 2.?概念层数据模型和组织层数据模型分别是针对什么进行的抽象? 3.?实体之间的联系有哪几种?请为每一种联系举出一个例子. 4.?说明 ...

Core Data浅谈系列之九：使用Mapping Model

通常,我们都会尽量使数据模型的变化尽量简单.但有些情况下,不得不进行大的改动,甚至是重新设计数据模型.在这种情况下,之前提过的简单数据迁移已经无法适应了,需要引入Mapping Model这个中间层. ...

招SAP Basis工程师~~外资！500强企业

问题描述某外企招聘SAPBasis工程师任职条件:1.SAPtechnical2.Oracledatabasetechnologyand/orSQLServer3.UNIXand/orWindows ...

热搜

Facebook 基于十亿单词量构建高效神经网络模型

文章转载自 开源中国社区 [http://www.oschina.net]

Facebook 基于十亿单词量构建高效神经网络模型的相关文章

文章转载自开源中国社区 [http://www.oschina.net]