香港科技大学在读博士生张鹏博:借鉴师生互动模式来训练机器学习模型

在学校教学模式中,老师扮演着重要的角色。借鉴老师与学生的师生互动模式,香港科技大学在读博士生张鹏博在他的论文A New Learning Paradigm for Random Vector Functional-Link Network: RVFL+中提出一种基于LUPI 的 random vector functional-link 网络(RVFL+),RVFL+不需要太多的计算硬件以及时间,优势明显。

在近期雷锋网 AI研习社的线上分享会上,他为我们详细解读了A New Learning Paradigm for Random Vector Functional-Link Network: RVFL+这篇论文,介绍了RVFL+和KRVFL+,以及它们的应用。

张鹏博,香港科技大学博士在读,于工程学院工业工程与物流管理系(即统计与运筹学系)从事机器学习的相关研究工作。他的研究兴趣包括机器学习、深度学习、优化、智能系统。 在此之前,他于 2015 年在澳门大学提前获得研究型硕士,并参与优秀毕业答辩,同时担任多个期刊和会议的审稿人。

分享内容:

这次为大家带来我最近的研究成果A New Learning Paradigm for Random Vector Functional-Link Network: RVFL+,主要是分享我的思路,为什么这么做以及具体的应用情况。

 

我会先介绍这种新型的训练方式Learning using privileged information(LUPI)与传统的不同点。然后介绍之前的主要网络RVLF以及当前流行的随机性算法,之后会介绍新的两种算法RVFL+和KRVFL+。我也给出了一些实验来验证这个方法的表现,还会为大家带来一些未来的可能应用。

在学习中师生互动模式很重要,Learning using privileged information(LUPI)是在机器学习中借鉴了这种模式,来训练我们的机器学习模型。

 

LUPI第一次提出是在2009年的一篇论文里用来训练SVM,与传统学习模式的不同是在训练阶段,传统的模式由xi和yi组成,xi是指训练集中的feature,yi是label。新型训练方式中训练集中增加了一项,表示额外信息,类似于学习中老师给我们的信息一样。

 

下面给出了SVM和SVM+这两种方法的主形式,如果大家熟悉机器学习,那么SVM的形式应该会很熟悉,SVM+与SVM的不同是多引入了一个参数,如公式所示。

 

接下来给大家介绍Random vector functional-link网络,它是一种前馈单层的神经网络,于1992年提出,示意图如下所示,只有一个隐含层。输入层和输出层直接相连可以有效防止网络过拟合。

 

为什么RVFL网络很简单,但是工作得很好?下图中是一些解释文献。我们希望训练数据中,同类之间角度小,不同的类之间角度大。RVFL网络是用混合的模式来训练所有网络。

 

在当今大数据的时代,对于计算的能力要求非常高,这种混合的训练策略计算花费非常便宜,在未来也是研究的热点。

 

简单介绍几个当前流行的随机方法:前三个Random projection、Random forests、Bagging是十多年前提出来的,大家对于这三个并不陌生。我会主要介绍随机神经网络,有兴趣的同学可以看下我在最后列出的参考文献。

 

接下来为大家介绍新的RVFL+方法,RVFL网络可以写成如下所示:

 

我们引进了LUPI这种新型的训练方式来训练我们的RVFL网络:

 

下一步构建拉格朗日方程,感兴趣的同学可以在论文里看到如何详细的得到输出权重的整个过程。

 

接下来看一下RVFL+的伪码,下面是详细的输入输出。

 

我们不仅提出了RVFL+,也提出了它的kernel版本——KRVFL+,这是为了更好的处理非线性问题。KRVFL+相比于RVFL+有两个主要的优势,一是不需要考虑增强节点的个数,二是消除了RVFL+的不稳定性。

 

感兴趣的同行可以在我的论文里看到KRVFL+的具体方程,在这里就不具体列出来了,简单给大家介绍一下KRVFL+的伪码,如下所示,它与RVFL+比较相似。

 

现在分析RVFL+的一些统计特征,主要是基于Rademacher复杂性。

 

现在看实验,我们在14个数据集上评估了模型的效果,包括1个二项分类数据集,8个多项分类数据集和5个回归数据集,今天的讲座里我给大家分享二项分类数据集的实验。

 

看一下实验结果,可以看到KRVFL+可以获得93.71%的准确度,训练时间只用了0.005s,在所有模型里面是最快的。RVFL+虽然相比高斯kernel的准确度不高,但相比线性kernel还是有很明显的优势。RVFL+不需要太多的计算硬件以及时间。

 

RVFL+和KRVFL+有如下实际应用,后期大家可以进行相关探索。 

在此提出感谢:

我的引用文献如下:

本文作者:Non

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-09-20 19:12:56

香港科技大学在读博士生张鹏博:借鉴师生互动模式来训练机器学习模型的相关文章

香港科技大学教授杨强:云计算、大数据能让每个人都享受到AI红利

 5月19日,由中国电子学会主办,ZD至顶网协办的第八届中国云计算大会进入第二日程,第四范式首席科学家.机器学习领域国际学术带头人.香港科技大学教授杨强在现场带来了"AI For Everyone"的主题演讲. 杨强表示,"我们所说的强人工智能和超级人工智能,实际上并不是我们需要害怕的东西,我们需要害怕的东西是我们的技术,一定需要大数据,但是我们本身又没有大数据这样的红利.相反我们要发展的技术是这样的,把知识迁移到身上,短时间通过小数据能够学习.能够成长,如果我们有能力把大数

香港科技大学杨强教授:深度学习如何才能更靠谱?

雷锋网AI科技评论按:7月22-23日,第三届中国人工智能大会(CCAI 2017)在杭州国际会议中心举行.其中来自香港科技大学的计算机与工程系主任.AAAI Fellow杨强教授发表了<深度学习的迁移模型>主题报告.本文主要阐述了杨强教授在大会中所讲的如何将迁移学习和深度学习相结合,使深度学习模型变得更加可靠,以及具体的实际应用案例. 杨强教授从深度学习模型的共性问题谈起,深度剖析如何使深度学习模型变得更加可靠,在数据变化的情况下,如何让模型持续可用.报告谈到,迁移学习有小数据.可靠性.个性

香港科技大学杨强教授:AI学术的前沿工作,也要从工业界获得灵感|CCF-GAIR 2017

雷锋网(公众号:雷锋网) AI 科技评论按:在7月7日,由中国计算机学会(CCF)主办,雷锋网与香港中文大学(深圳)承办的第二届 CCF-GAIR全球人工智能与机器人峰会正式召开.今年CCF-GAIR的程序委员会主席.香港科技大学计算机系主任杨强教授,担任了大会第一天人工智能前沿专场的「AI 学术前沿」主持人.学术前沿 Session 分别由两位优秀的学术界人士进行演讲,一位是 CMU 金出武雄教授,另一位是 UCL 副教授汪军.在该 Session 结束后,雷锋网 AI 科技评论与杨强教授进行

博客也盈利:从新浪博客看博客的盈利模式

博客|新浪 新浪博客最近人气火爆,开博者赚名气,看博者赚热闹,新浪赚点击量,各取所需,可谓取得了阶段性成果,新浪的名人策略发挥作用了,不过也有隐忧,新鲜过后会否产生审美疲劳?很多名人都把博客转到领袖周刊(LeaderWeek.com)了, 新浪如何变赚眼球为赚钱?是否可持续发展?以下试作一探讨:   一.博客用户的需求是什么 不谈资本运作赚快钱手法,博客将来能否实实在在盈利,实际上取决于博客能在多大程度上满足用户需求.经过一轮泡沫洗礼,互联网大多舍弃内容而做平台生意,博客也是如此.抛开产业链条其

TensorFlow博客翻译——用TensorFlow在云端进行机器学习

原文地址 Machine Learning in the Cloud, with TensorFlow Wednesday, March 23, 2016 Posted by Slaven Bilac, Software Engineer, Google Research 用TensorFlow在云端进行机器学习 At Google, researchers collaborate closely with product teams, applying the latest advances

"博客金行"提供广告收入分享 个人博客开辟盈利模式

中介交易 SEO诊断 淘宝客 云主机 技术大厅 就在人们还将博客看成"个人情感的网络展示平台"的时候,已经有人利用个人博客开始赚钱.这个由博客网运行的名为"博客金行"的广告联盟系统,为博客运营商.博客主开辟了一个共同分享广告收入的平台. 一个名叫"甜蜜蜜"的博友在自己的博客里写道:"欢迎您的到来,多提宝贵意见--如果没时间写评论.留言,那就点击我的广告看看,里面欢乐无穷."在这段话的左边,挂着一些NarrowAD提供的广告.在

BlogBus五周年庆典:博客营销新模式

BlogBus五周年庆典:博客营销新模式 博客营销到底是互动营销?是体验营销?是口碑营销?是内容营销?是整合营销?还是都是?所谓口碑营销.博客营销的概念满天飞,却一直找不到对应的好案例. 这次,BlogBus五周年活动做出了精彩示范,从11 月14日"BlogBus五周年"专题上线开始,在短短半个多月的时间里," BlogBus五周年"成为Blog圈热点话题,在BlogPulse( AC尼尔森)上连续三次表现出峰值."BlogBus五周年庆典"也

香港科技大学杨强教授专注研究的这项新兴技术,可能能造就最初的真正“智能”

迁移学习,简单的说,就是能让现有的模型算法稍加调整即可应用于一个新的领域和功能的一项技术.这个概念目前在机器学习中其实比较少见,但其实它的潜力可以相当巨大.杨强教授在刚刚结束的CCF-GAIR上的演讲中曾提到一个愿景--利用迁移学习,即使是自身没有条件获得大量训练数据的小公司也可以按照自己的需要应用大公司训练出来的模型,从而普及AI的应用. 在目前大家都在努力提高人工智能应用通用性的大背景下,迁移学习的崛起之势已经比较明显.不过杨强教授其实早在2009年之前就开始研究迁移学习了--那时他是国内为

运用博客网络营销模式创造影响力

中介交易 SEO诊断 淘宝客 云主机 技术大厅 连载式有两种理解,一种是未完待续,另外一种是持续更新.未完待续类型的博客非常适合专业作家用来连载自己的作品,和本系列文章前面提及过的贴吧营销一样,连载到一定时候进行购买链接插入.在这里就具体展开讨论持续更新类型的博客营销.互联网经过比较长的一段时间洗礼,网民的上网警惕性提高了,吸收资讯的时间也越来越快,变得理智起来了,炒作性质的博客往往已经不能那么容易吸引眼球,从而转向专业性质的话题. 例如,在新浪上就有30出头自称小美女的作者推出了她的保养心得.