上海交大CS系博士生李泽凡：利用高阶残差量化（HORQ）方法进行网络加速

本文讲的是上海交大CS系博士生李泽凡：利用高阶残差量化（HORQ）方法进行网络加速，

神经网络的压缩和加速现在已经成为一个热门课题，这个领域有多种研究方法，网络量化就是其中之一。网络量化分为输入量化和权值量化两种。而同时将输入和权值量化会造成网络精度的大幅下降。在Performance Guaranteed Network Acceleration via High-Order Residual Quantization (性能保障的高阶残差量化网络加速方法)一文中，作者针对这个问题，提出了高阶残差量化（HORQ）的方法，既能够利用网络量化带来的大幅计算加速，又能够保证网络的精度不会大幅下降。

在近期雷锋网 AI研习社的线上分享会上，该论文第一作者李泽凡为我们详细解读了HORQ方法及相关推导过程。

李泽凡，上海交大 CS 系二年级博士生，师从高文院士和张文军教授。研究方向为神经网络理论、网络加速和压缩。

分享内容：

大家好，今天我将为大家带来我们在ICCV 2017上发表的文章——Performance Guaranteed Network Acceleration via High-Order Residual Quantization (性能保障的高阶残差量化网络加速方法)。

这篇文章的研究领域是网络加速和网络压缩。主要的网络加速和网络压缩方法可以分为如下三种类型，第一种是网络剪枝，第二种是低阶分解和低阶近似，第三种是网络量化和二值化。这篇文章的关注点在网络的二值化方法上。

什么是网络的二值化/量化？这里以CNN的一个卷积层为例。

卷积层的二值化有两个优点，第一个优点是可以实现模型大小的压缩。

第二点是能加速计算。

接下来介绍这篇文章的motivation，之前的XNOR网络虽然能实现58倍的加速，但网络精度出现大幅下降。我们希望既能利用二值化带来的便利，也避免网络精度的大幅度下降。

说到这篇文章的方法之前，我们再来看看如何进行网络二值化。由浅入深，先来谈谈如何进行向量二值化。

向量二值化的目标如下：

求解如下最小二乘估计：

相当于求解如下问题，可以转化为如何最大化X转置乘以H的问题。

求解完H之后再来求解β，求解过程如下：

由此得到前面图中该最优化问题的解析解形式如下：

下面举个例子，如何运用向量二值化来二值化向量的內积。如下是四维向量相乘的例子：

求解X和W內积的式子如下所示：

估算值为1.27875，与实际值0.76相比有很大误差。这也表示，用这样的方法进行向量二值化会带来很大误差，信息损失巨大。

由此，我们的工作提出高阶残差量化，利用泰勒展开的方法，具体如下：

如图左所示是原来二值化方法的信息损失，我们定义量化残差的概念来描述信息损失：

由此可以上升到二阶残差量化估计：

下面是从三维空间来看：

以此类推，我们可以定义K维残差估计：

接下来利用HORQ（高阶残差）方法来逼近我们刚才XW=0.76的例子：

下面求得X的二阶量化值，对W不用进行二阶二值估计，因为在之前网络中对权值进行二阶二值估计对网络的影响不是很大，我们只讨论对输入进行高阶残差估计方法。XW的值如下：

最后的结果如下：

同理作出三阶二值估计：

三阶量化的结果如下，在0.81左右。

同理可以做四阶二值估计，有一个很有意思的结论，对于n维向量X，它最多只有n阶二值估计。

把这些残差估计做一个汇总，如下：

这是一些HORQ框架下理论上比较有趣的结果。结论一：二值的残差一定是跟相应阶数下的二值向量垂直。

推导过程如下，另外还有一些小结论：

下面这张图中可以应用上面推导出来的定理。

结论二：随着i的增加信息损失是逐渐减少的。

第三个结论如下图：

接下来讲一下如何将HORQ的方法应用到矩阵乘法中。

实际上矩阵乘法可以看成一个行向量和一个列向量的乘积。

话说回来，如何利用HORQ的方法计算卷积层呢？

这里涉及到tensor reshape过程，具体的过程如下：

下面是原始的卷积网络以及对权值和输入二值化来进行卷积操作，这样带来的信息损失巨大。

HORQ提出了下面这样一个框架模型。

下面是一些实验结果，可以看到在一些小数据集上都有不错的表现，基本上可以降低一半的误差。图中也给出了不同阶数的加速比。

下面是加速比的一些理论分析，加速比与三个因素有关，公式如下：

可以看到参数之间的相关关系：

接下来是一些问题。实际上HORQ网络模型依赖于二值化矩阵乘法的计算，需要一些比较合适的框架，二值模型的存储和载入与浮点数的存储和载入不一样。

本文作者：Non

本文转自雷锋网禁止二次转载，原文链接

时间： 2025-01-21 06:13:04

上海交大CS系博士生李泽凡：利用高阶残差量化（HORQ）方法进行网络加速的相关文章

李泽楷进军保险业务遭遇硬“对手”

陈莹莹香港报道半路杀出个程咬金. 7月12日,外媒消息称,黑石和友邦保险前任CEO马克·威尔逊(Mark Wilson)等投资者正组团竞购ING在亚洲地区的保险业务. 黑石财团的加入,给此前呼声甚高的李泽楷,新添一名强敌. 今年3月,ING首席执行官Jan Hommen宣布,将把公司欧洲和亚洲的保险业务分拆出售.而对于亚洲保险业务的估值预期,他给出的价格是至少70亿美元. 媒体消息称,截至今年5月,ING已选出了竞购其亚洲业务的4强,分别是美国保德信金融集团(Prudential Finan

北京理科高考状元李泽高考前一天还在打羽毛球

李泽从高一开始就热衷于打羽毛球,在昨天接受媒体采访时,他还忍不住秀了起来 1.87米的身高.最牛班主任"汤司令"钦定的班长.学校志愿者--李泽的身上贴着太多的标签,如今,他头顶的光环又多了一重--16年来北京高考理科最高分. 与往年许多高三毕业生选择外国大学不同,在人大附中校长刘彭芝将李泽推荐给清华领军计划后,他自己的第一志愿报的正是清华大学经管学院. 因为在李泽看来,刚进入社会时如果过早接触外国的办法来处理中国的事,肯定要办糟,无论学校的名气有多大,真正决定自己未来的,还是"

CAAI演讲实录|大疆李泽湘：智能机器人解决实际问题的路径

8月26日至27日,在中国科学技术协会.中国科学院的指导下,由中国人工智能学会发起主办.中科院自动化研究所与CSDN共同承办的2016中国人工智能大会(CCAI 2016)在北京辽宁大厦盛大召开,这也是本年度国内人工智能领域规模最大.规格最高的学术和技术盛会,对于我国人工智能领域的研究及应用发展有着极大的推进作用.大会由CSDN网站进行专题直播,并由百度开放云提供独家视频直播技术支持. 大疆创新科技公司董事长.香港科技大学教授李泽湘的报告围绕智能机器人如何解决实际问题的努力展开,他介绍了香港科技

李泽楷旗下大国文化收购滚石唱片图谋娱乐霸业

"李泽楷旗下的大国文化集团(以下简称"大国")已经正式和台湾滚石唱片公司签订收购合约."近日,一位接近大国高层的消息灵通人士李永向<财经时报>透露. 至于收购的确切价格以及合约签订的相关具体内容,该位高层表示不方便透露. 此前曾经有媒体报道,大国欲斥资6亿新台币(约合1.4亿元人民币)收购滚石唱片. "'小超人'正在借道滚石唱片原有通道,向他既定的娱乐版图一步一步靠近."资深分析师刘亮认为. 深陷困局的滚石唱片在李永看来,滚石唱片大

李泽楷声明版本不同遭质疑首度承认是三子之父

李泽楷声明"女性版"截图李泽楷声明"人士版"截图南方都市报3月3日报道梁洛施和小超人李泽楷分手,引发"世纪大猜想",不同版本的第三者,还有数亿分手费的传闻,让不少爱八卦人士热血沸腾.为驳斥这些传闻,3月1日下午,李泽楷发布声明,指出第三者和分手费"纯属杜撰".而实际上,李泽楷前后发表了两份声明,当中有两处小小的措辞改动,这改动中或许有小超人的良苦用心. 延伸八卦声明在内地.香港.台湾三地以广告形式刊出记者昨日发现,李

传李泽楷联合上海文广洽购TVB股权

电讯盈科(00008)及电视广播(TVB)(00511)1月7日走势良好,市场随即传出,由上海文广合组的财团,已与电视广播大股东邵氏兄弟步入独家洽商的阶段,而电盈主席李泽楷亦牵涉其中.按香港法例规定,免费电视控股权必须由香港人持有,故上海文广如真的出手洽购,须在财团组合上先解决这一关卡.另有传闻指真正伙拍上海文广向电视广播提出收购者是李泽楷父亲兼长和系主席李嘉诚.上海文广是内地仅次于中央电视台的第二大传媒集团,其控股股东实为上海市政府.有指为了淡化其中资背景及减轻交易的敏感度,上海文广或会透过

李泽：浅谈团购网站的一朵奇笆

中介交易 SEO诊断淘宝客云主机技术大厅国内的互联网总是不缺少复制创意,并将创意不断创新,这也一直是我比较热衷于互联网的原因之一.现在看着祖国上下一阵强劲的团购风,看着清一色的模板Copy出来的每日一团,不免有些麻木,不过正是在这种团购创意之下,笔者也看到了一个难得的特色团购站,说它是团购站,可能有点名不符实,应该说是团购区更为贴切,这就是站长们比较熟悉的--A5团购.为什么说它是特色团购站,因为它确有其与众不同之处,经笔者观察,这些创意都值得互联网从业者和站长朋友们借鉴: 1. 团购以

李泽楷被查：电盈私有化残局难收

黄蒂娟市场对于李泽楷被香港警方调查的消息,并不感觉意外.电讯盈科这场如肥皂剧般漏洞百出的私有化,即便被喊停,也注定残局难收拾. 电盈私有化已于2009年4月被香港上诉庭裁决撤消,其大股东李泽楷亦发表联合声明表示放弃上诉,电盈私有化事件也被看作是已告一段落.耐人寻味的是,为何事隔近一年,在其私有化或资产重组计划又有机会重启之际,警方才采取相关行动呢?有关部门对电盈私有化的股东投票中涉嫌舞弊的调查是否有了新发现,案件性质是否会因搜查取证而改变呢? 意料之中的调查自农历新年前传出警方搜查后,目前仍

李泽楷寓所遭警方搜查疑涉电讯盈科私有化事件

疑涉电讯盈科私有化事件,李泽楷迄今一直不在香港本报讯据香港<明报>报道,香港电讯盈科因私有化而爆出的"种票疑云"("种票"指在相关公司股东集体投票前,知情人提前布局入股,以影响该公司最终决策的行为),不单在去年4月被上诉庭3位法官一致否决私有化,裁决更指有人明显操纵投票,事隔快一年,警方商罪科最近就此案展开全方位调查. 据了解,警方曾搜查电盈主席李泽楷在香港多达3个寓所及富通保险等多间公司.而案中多名关键人物,包括财经界猛人袁天凡.前富通保险高层林孝

猜你喜欢

将人民币的数字表示转化成大写表示

大写|人民币 <%call Money(22222222222)function Money(thenumber)dim Money,i,String1,String2,length,check ...

Flash播放器拖动进度条的制作

flash播放如何做到Flash MV播放中的自由拖动呢,下面的这段代码,也许对大家有些帮助. //这是进度条的宽度: w = 100; Drag = false; ball.onPress ...

合格网管必备知识之十问十答

今天,随着计算机的广泛应用和网络的流行,越来越多的单位和部门开始引入计算机网络管理,从而相应的需要更多的优秀网管.已有几年"脑龄"的你是不是也有成为网管的雄心壮志?在你成为一名合格 ...

Solaris 8下RAID1和RAID5的安装及恢复

本文档以SUN Fire V880 Server(6*73GB Dsik)为例讲解在Solarsi8下使用命令行的方式安装及维护RAID1和RAID5.本文档内容都经本人实践验证过,但对于不同机型仅供 ...

ASP入门教程-控件会话的结束时间

1.利用 Session.Timeout 属性设置超时时限对于一个登录到 ASP 应用程序的用户,如果用户在系统默认的时间内未进行其它任何操作,当设置的时间一到便自动撤销这个用户的 Session, ...

PHP实现在线阅读PDF文件的方法

本文实例讲述了PHP实现在线阅读PDF文件的方法.分享给大家供大家参考.具体实现方法如下: ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 <?php ...

使用position:fixed属性让DIV居中

先看一下效果: http://www.keleyi.com/keleyi/phtml/fixedcenter.htm 关键代码是:#topmenu_keleyi_com{position:fixe ...

Photoshop大揭秘数码人像摄影后期处理

一.绽放 Designer/ 艺流风尚 PS教程最终效果图! 创意思路画面中人物的美姿和当年明星梦露的一张经典照片很相似,创作思路由此而产生.为了让整个裙纱飘动起来,我选择一个略微动感的裙纱做素材 ...

Word中大文档如何提取目录

最近用Word XP整理了一篇150页的技术文档.尽管篇幅有些长,但该文档各级标题之间的逻辑结构比较清晰.于是我决定为文档加上目录,以方便查阅.什么是目录呢?目录就是文档中标题的列表,通过目录来了 ...

如何关闭Win7系统中移动驱动器自动播放

在组策略中进行修改按下键盘上的Win+R,打开运行对话框,输入gpedit.msc,回车打开组策略编辑器. 在左侧标签"计算机配置"中找到"管理模板",& ...

LCD与LED液晶显示屏的区别 lcd与led哪个更好？

经常看到网上有人询问lcd与led显示器的区别,小编就在这里比较全面的讲解下lcd与led的区别到底是什么?厂家宣传的LED背光节能.环保都是噱头么?led lcd 区别真的有这么大么?就请跟随阿飞, ...

电脑中如何修改realmlist.wtf配置文件登录魔兽世界外服

1.在目录中找到realmlist.wtf文件; 2.右击选择用记事本打开该文件; 3.进行替换并保存,如set realmlist logon.classic-wow.org.

JS组件系列之Bootstrap table表格组件神器【终结篇】_javascript技巧

bootstrap table系列: JS表格组件神器bootstrap table详解(基础版) JS组件系列之Bootstrap table表格组件神器[终结篇] JS组件系列之Bootstrap ...

关于RTCP协议，请求帮助！！

问题描述关于RTCP协议,请求帮助!! 请问一下各位大神,VLC插件可以自动发送RTCP包到接收端吗??谢谢了!!! 解决方案问这个问题之前,认为你已经了解了RTCP协议,VLC是具备发送和RTC ...

cookies如何成为全局变量以及设置，删除，获取

(一)cookie机制将信息存储于用户硬盘,因此可以作为全局变量 (1)保存用户登录状态.例如将用户id存储于一个cookie内,这样当用户下次访问该页面时就不需要重新登录了,现在很多论坛和社区都提供 ...

【2017年新篇章】 .NET 面试题汇总（一）

小分享:我有几张阿里云优惠券,用券购买或者升级阿里云相应产品最多可以优惠五折!领券地址:https://promotion.aliyun.com/ntms/act/ambassador/shareto ...

PostgreSQL returning 插入,更新,删除反馈数据

2. returning 例 4.3. PostgreSQL insert returning test=# create table account(id serial,name varchar,p ...

远程连接-关于阿里云服务器的，请问这是什么问题？

问题描述关于阿里云服务器的,请问这是什么问题? ,阿里云服务器远程连接不上,然后用管理终端一进去就是ServerManager已停止运行.Windows Server2012的系统,求大神解决解决 ...

多线程数据库连接问题

问题描述现在定义了一个全局的数据库变量,代码如下:publicstaticSqlConnectionconnn=newSqlConnection();publicstaticstringConnec ...

adt-elicpse快捷键的使用

问题描述列如syso整理代码具体怎样实现求指教解决方案解决方案二:查看插件源码具体在jface里

问题描述 js判断没有输入内容时有提示的字,输入内容后字消失解决方案解决方案二:都是表单验证,找个插件就好解决方案三:--HTML代码<html><body><inp ...

Hot to use typelist of Loki??

最近调试的一段代码,请一起look look! #include<iostream> #include<stdio.h> #include<string.h> us ...

Windows 8 DirectX 和Xaml UI 混合处理方案

原文 http://www.cnblogs.com/chenkai/archive/2012/11/29/2794983.html [如果不想读这么长问题描述和通用的解决方案. 可以直接skip 这段 ...

link环境下制作一款《订餐软件》，请问排队叫号语音报号的功能实现是什么？

问题描述 link环境下制作一款<订餐软件>,请问排队叫号语音报号的功能实现是什么? link环境下制作一款<订餐软件>,请问排队叫号语音报号的功能实现是什么? 解决方案这个 ...

OSCON上最受欢迎的Docker演讲

本文讲的是OSCON上最受欢迎的Docker演讲,[编者的话]本文介绍了上个月OSCON大会有关Docker最受欢迎的一个分享:真实线上环境的Docker技巧.分享者是一名运维工程师叫Bridget, ...

使用extjs上传文件，如何更改上传的文件名？

问题描述这个是playerUpload.jsp<html><head><%@pagelanguage="java"contentType=" ...

强迫症慎入：一大票让人看哭的音量键设计即将袭来

我们日常用电脑的时候,免不了要根据自己的需要调整音量.如果在音量调节时出现差错,不是惊天震地有如世界末日之感,便是轻声细语宛如"聋的传人". 所幸,大多数的音量控件都设计的非常直白 ...

50种英文网站流量来源

中介交易 SEO诊断淘宝客云主机技术大厅 1.写作并提交文章到文章目录 2.在别人博客上留下自己的评论并且反链接到你的网站 3.在answers.yahoo.com上面回答别人提出的相关问题 4 ...

Android学习笔记(1)：一些准备姿势

Android系统的体系结构: 应用程序层--应用程序框架--函数库--Android运行时--Linux内核 SDK目录结构: 一开始只有下面的这些: add-ones:第三方公司为Android平 ...

【转载】Python 中 if __name__ == '__main__': 的作用

# hello.py ? 1 2 3 4 5 6 7 def sayHello(): str = " hello " print (str); if __na ...

热搜

© 2025 iVAN | info#iamivan.net | 11 q. 0.026 s.