深度学习如何将个性化引入互联网

深度学习属于机器学习范畴下的一个子集,其利用多种方法以实现人工智能研究当中的一大核心目标:让计算机对我们的世界进行充分建模,从而展现我们理解当中的“智能”。

从基本概念角度出发,深度学习方法往往具备非常基础的共通特征。深度学习算法通过多个处理层对原始数据进行解释。其中每个处理层皆将前一处理层的输出结果作为输入结果,同时创建出更为抽象的表达。因此,只要将更多数据馈送至正确的算法当中,则算法通常能够给出更多与相关规则及特征紧密关联的推理与情景,并据此在处理新的类似情况时作为参考。

谷歌翻译提供的类似于科幻小说般的Word Lens功能正是一套深度学习算法支持下的产物。而Deep Mind最近广受关注之AlphaGo亦凭借着深度学习的强大能力横扫围棋界——不过具体来讲,AlphaGo的取胜算法并不属于纯粹的神经网络,而属于一套将深度加强学习与树搜索这一经典AI基础技术相结合的产物。

深度学习属于解决计算问题的一种充分方法,主要面向各类太过复杂而无法凭借图像分类或者自然语言处理等简单算法直接解决的任务。然而,目前深度学习的实际用途仍然非常有限。当下利用机器学习技术的行业大多未能充分发挥深度学习以及相关方法的发展潜能,而仅仅是借用了其中的一部分最佳实践。举例来说,关注近期深度学习变革动态的朋友可以已经听说,谷歌公司前任AI负责人John Giannandrea已经接管了该公司的搜索部门(这甚至可能彻底颠覆整个SEO领域)。

深度学习技术支持下的推荐系统——个性化的未来解决方案

可以肯定的是,深度学习亦将推动个性化领域迎来下一轮重大的跨越式发展。个性化对于电子商务企业、发行商以及营销机构而言皆已成为一大核心领域,因为事实证明其确实有能力提升销售效果、增加参与度并改善整体用户体验。如果说数据是个性化的燃料,那么推荐系统就是其出力引擎。此类算法的进步对于这一领域以及平台用户的在线体验必将产生深远的影响。

在这里,我们将着眼于三个具体领域,探讨深度学习如何对现有推荐系统作出补充及改进。

将内容纳入推荐流程

条目到条目推荐属于推荐系统中的一种标准化处理方式。这意味着当电子商务网站或者发行商网站作出推荐时,其推荐的结果源自用户此前曾经查看的其它类似条目。解决此类需求的一种典型方法为基于元数据的业务逻辑(另一种典型数据源为用户交互,即Amazon上提供的“买过此商品的用户还买了……”)。然而,元数据质量低下成为制约其实际效果的常见瓶颈,这主要源于元数据存在价值缺失或者缺少系统分配。在这种情况下,即使拥有完美的元标签,这样的数据也仅能够表达实际条目之间的间接性关联。而在深度学习的帮助之下,我们则可将内容(包括图像、视频与文本)等实际内容属性纳入推荐流程。利用深度学习,条目到条目间的关系将匹配算法对于产品更为全面的理解,且更少依赖于手动标记以及广泛的交互历史记录。

在这方面,Spotify的推荐系统相当值得肯定。该公司在2014年的研究当中将深度学习引入推荐系统,旨在提供更为多元的歌曲推荐,同时帮助用户创造出经过改进的个性化体验。这项音乐流服务以往曾在其推荐系统中采用协同过滤方法。但Spotify公司实习员工Sander Dieleman这位博士生却将此视为当前功能中的最大缺陷,因为这种高度依赖于数据的作法将不可避免地错失某些人气不高、刚刚崭露头角的艺术家及其不为大众所知的歌曲。因此,Dieleman本人采用一种深度学习算法从50万首歌曲当中各自挑选时长30秒的摘录,并对音乐本身进行分析。这种连续多层学习网络能够掌握更为复杂且恒定的歌曲特征,其基本思路与图像分类非常相似。事实上,“立足于这套网络中高于输出层的完全连接层,经过学习的过滤器最终能够更具选择性地把握音乐中的某些子类”,包括福音音乐、中国流行音乐或者深屋音乐等。在实践当中,这意味着此类系统能够仅基于歌曲的相似性(这种特性对于用户组合个性化播放列表非常重要)以有效进行音乐推荐。尽管我们尚不清楚Spotify公司是否会将这些发现纳入实际算法,但这项实验本身的意义仍然值得高度肯定。

解决冷启动难题

冷启动可谓推荐系统的天敌,其可能对用户及条目产生严重影响。对于用户而言,冷启动意味着当前系统几乎甚至完全不具备任何与客户行为及偏好相关的信息。而条目冷启动则代表其缺少能够指导用户互动的条目到条目间关联数据(虽然我们仍然拥有元数据,但这并不足以提供真正的细致建议)。而利用上述基于内容的方法,条目冷启动的实际效果将得到明显改善,因为其能够保证推荐系统较少依赖于事务及交互数据。

然而,为新用户创造有意义的个性化体验又是另一个棘手的问题,而且很难通过简单收集更多信息加以解决。这种状况在电子商务网站或者包含广泛产品组合的在线商店系统中普遍存在,客户会随着时间推移而随意访问完全不同的浏览目标。他们可能最初决定购买微波炉,但却在下一次访问时查找手机。在这种情况下,第一次会话收集到的数据与第二次会话几乎完全无关。

解决用户冷启动问题的一种有趣思路在于建立基于会话或者条目到会议的推荐。简单来讲,这意味着系统不再依赖于客户的整体交互历史,而是将相关数据分解成多个不同会话,同时立足于特定会话的点击流为用户建立兴趣模型。通过这种方式,未来的推荐系统可能将不再依赖于数月甚至数年之内收集到的、经过精心设计的客户资料,而完全可以在用户进行一段时间的网站操作之后为其提供合理的相关建议。

尽管这一领域尚未得到彻底研究,但确实有可能带来巨大的个性化在线体验提升机遇。Gravity R&D公司的研究人员们在参与欧盟资助的CrowdRec项目时共同撰写了一篇论文,其中介绍了如何利用一种卷积神经网络(简称RNN)方法提供基于会话的建议。这是第一篇利用深度学习技术通过基于会话方式实现推荐功能的研究论文,而结果表明他们的方法拥有优于当前最新算法技术的实效。

真理四时刻

所谓真理四时刻,是指客户在根据企业沟通与相关可用信息作出决定的四段短暂时间。这些决定虽然受到长期考量、个人喜欢以及品牌忠诚度等因素的严重影响,但同时也受到瞬时印象的引导。面对这些真理时刻,强大的深度学习系统很可能带来足以左右人类决策流程的可行方法——这样的见解无疑相当新颖。

举例来说,我们都知道漂亮的产品图片能够促进销售(整个行业都在想办法为出租房屋或者食物拍摄美观的图像)。但在另一方面,我们也期待着能够利用基于深度学习的图像分析方法来评估产品图像中的视觉特性到底如何对销售活动产生显著的积极影响。

诚然,本篇文章所涉及的内容并不详尽。个性化无疑是当今互联网行业最为迫切的需求之一,而深度学习技术几乎必然在这一领域拥有着巨大的潜能。因此,希望保持自身竞争优势的企业自然也有必要时刻关注这项技术的发展与动向。

原文发布时间为:2017年7月5日

时间: 2024-07-30 14:06:36

深度学习如何将个性化引入互联网的相关文章

激活引入非线性,池化预防过拟合(深度学习入门系列之十二)

系列文章: 一入侯门"深"似海,深度学习深几许(深度学习入门系列之一) 人工"碳"索意犹尽,智能"硅"来未可知(深度学习入门系列之二) 神经网络不胜语,M-P模型似可寻(深度学习入门系列之三) "机器学习"三重门,"中庸之道"趋若人(深度学习入门系列之四) Hello World感知机,懂你我心才安息 (深度学习入门系列之五) 损失函数减肥用,神经网络调权重(深度学习入门系列之六) 山重水复疑无路,最快下降

从互联网到物联网 “深度学习”概念让新兴企业崛起

数据爆发,"数据"+"人工智能"将成为未来5-10年的科技投资主线.互联网和物联网蓬勃发展,带来数据量爆发.在过去的十年中,全球每年产生的数据量以50%以上的CARG增长,2015年全球产生数据8 ZB (1ZB = 1012 GB).据IDC预测,2020年全球产生数据量将超过40ZB,相当于地球上每个人产生5200 GB的数据.我们判断,基于海量数据深度学习的人工智能第三次浪潮可能走的更远.从互联网到物联网,"深度学习"概念让新兴企业崛起.

百度将 HPC 技术引入深度学习;卡巴斯基操作系统;AMD Ryzen 预售等 | AI 开发者头条

百度将 Ring Allreduce 算法引入深度学习 Ring Allreduce 本是 HPC (高性能计算)领域的一项技术.日前,百度硅谷 AI 实验室已成功将其移植到深度学习平台,借此来加速 GPU 之间的数据传输速率.目前,在 GPU 并行计算中,它们之间的通信瓶颈是制约深度学习模型训练速度的主要障碍之一.百度宣布,Ring Allreduce 算法的引入将移除该瓶颈,大幅提升多 GPU 和分布式计算环境下的深度学习模型运算效率.雷锋网获得消息,该技术已被百度成功应用于语音识别. 该算

互联网世界的“人工智能”——探秘“深度学习”的前世今生

最近一段时间里,Facebook.Google.Yahoo!.百度等各大公司都在尝试将深度学习(deep learning)算法运用到产品开发中,以期使产品更智能化,提升用户体验.在深度学习持续走红的当下,本文作者对这一概念做了梳理,并分享了他对深度学习的实用性及未来发展的看法. 本周一,加利福尼亚州的Lake Tahoe.Facebook CEO Mark Zuckerburg造访了神经信息处理系统(Neutral Information Processing Systems, 下文简称NIP

2016这一年,深度学习开始主宰互联网

雷锋网按:2016 即将画上句号,当我们回顾这一年的科技进展时,雷锋网很难不联想到一个词--深度学习.当它从研究室中脱胎而出,并成为今年的当红热词,实际上我们已经意识到深度学习的来临.从 AlphaGo 到 Google Translate,雷锋网也做过不少覆盖和解析.Cade Metz 为 Wired 撰文回顾了与深度学习同行的这一年,雷锋网(公众号:雷锋网)编译,未经许可不得转载. 在澳大利亚西海岸,Amanda Hodgson 正在操控无人机飞跃海面,无人机可以帮助他们在水面上拍摄照片,利

专访 | 杨强教授谈CCAI、深度学习泡沫与人工智能入门

7 月 22 - 23 日,由中国人工智能学会.阿里巴巴集团 & 蚂蚁金服主办,CSDN.中国科学院自动化研究所承办,作为独家直播合作伙伴的第三届中国人工智能大会(CCAI 2017)将在杭州国际会议中心盛大开幕. 作为大会主席,香港科技大学计算机与工程系主任.AAAI Fellow 杨强教授最近接受了大会记者专访.这次访谈干货满满,其中有不少话题是杨强教授首度公开谈及,比如下一个 AI 突破口.深度学习泡沫.AI 之路心得.本科生入门 AI.好学生要能教导师学习,等等. (点击阅读杨强教授历史

基于深度学习的智能问答

作者:周小强 陈清财 曾华军 1引言 纵观自动问答系统的技术发展历史,从1950年代因图灵测试而诞生至今,已经有几十年的历史.但真正在产业界得到大家的广泛关注,则得益于2011年Siri和Watson成功所带来的示范效应.自此,自动问答系统较以往任何时候都显得离实际应用更近.这一方面归功于机器学习与自然语言处理技术的长足进步,另一方面得益于维基百科等大规模知识库以及海量网络信息的出现.然而,现有的自动问答系统所面临的问题远没有完全解决.事实上,无论是业界应用还是学术研究,问句的真实意图分析.问句

深度学习如何“助攻”医学影像?我们来听听学界大拿的解释 | CNCC 2017

雷锋网消息, 10 月 26 日上午 8:30 分,由中国计算机学会(CCF)主办,福州市人民政府.福州大学承办,福建师范大学.福建工程学院协办的 2017 中国计算机大会(CNCC 2017)在福州海峡国际会展中心隆重召开.雷锋网作为独家战略合作媒体对本次会议进行全程报道. 雷锋网(公众号:雷锋网)了解到,本次大会主题是"人工智能改变世界(AI Changes the World)",共邀请近十位院士. 300 余位国内外计算机领域知名专家.著名国际国内 IT 企业家到会演讲.会议包

香港科技大学杨强教授:深度学习如何才能更靠谱?

雷锋网AI科技评论按:7月22-23日,第三届中国人工智能大会(CCAI 2017)在杭州国际会议中心举行.其中来自香港科技大学的计算机与工程系主任.AAAI Fellow杨强教授发表了<深度学习的迁移模型>主题报告.本文主要阐述了杨强教授在大会中所讲的如何将迁移学习和深度学习相结合,使深度学习模型变得更加可靠,以及具体的实际应用案例. 杨强教授从深度学习模型的共性问题谈起,深度剖析如何使深度学习模型变得更加可靠,在数据变化的情况下,如何让模型持续可用.报告谈到,迁移学习有小数据.可靠性.个性