滴滴研究院副院长叶杰平:揭开滴滴人工智能调度系统的真面目

雷锋网(公众号:雷锋网)按:腾讯大数据峰会暨 KDD China 技术峰会中,滴滴研究院副院长、密歇根大学终身教授叶杰平博士非常全面地解密了机器学习在滴滴中的大规模应用,其中包括:出行目的地预测、路径规划、拼车最优匹配、订单分配、估价、运力调度、评分系统等。雷锋网根据现场演讲整理成文,并由叶杰平博士与滴滴 CTO 张博亲自审文。

叶杰平:

滴滴研究院副院长,美国密歇根大学的终身教授。叶杰平是机器学习领域国际领军人物,其主要从事机器学习、数据挖掘和大数据分析领域的研究,尤其在大规模稀疏模型学习中处于国际领先地位。

雷锋网了解到,去年滴滴成立了机器学习研究院,之后改名为滴滴研究院。

滴滴研究院做的事情是结合大数据与机器学习,搭建滴滴交通大脑。滴滴交通大脑需要收集每个城市、每一时刻的所有交通出行相关数据,然后做出最优的决策(匹配、导航等),从而提高出行效率。接下来我来分享一下滴滴过去一年在大数据和人工智能方面的探索。

App 首页中的人工智能

打开滴滴出行 App,首页中就包含很多人工智能:

预测目的地

我们先会精确定位用户的位置,下方是用户所要去的目的地。很多情况下我们能够预测到用户去哪里:因为很多出行是比较有规律的:早上上班、晚上回家。我们利用用户的出行数据从时间和地点中预测用户去的目的地,这是人工智能的一种体现。

估价

我们常见的价格预估背后其实也有着非常复杂的计算过程,涉及到路径规划和时间预估(ETA)。其中从起点到终点的路径规划是非常核心的一部分,找到最佳路径后,我们需要计算出 A 到 B 的距离。随后着手解决行程所需的时间估算:起点到终点需要 20 分钟还是 30 分钟。结合路径和时间,我们给出一个预估价。

拼车

拼车选项也是非常复杂的机器学习问题,我们需要计算用户点击拼车后从起点到终点过程中找到一个拼友的概率。如果概率不大,这名乘客就很可能得一个人从头坐到尾,而滴滴给出的折扣也会低一些,如九折等。如果这条是热门路线,路途中很可能会有其他乘客与你在同一时间去同一个或附近的地方。这种情况下,我们可以打一次力度稍微较大的折扣。

叫车后的人工智能应用

乘客与司机匹配

当用户确认叫车后,滴滴需要做订单匹配,找到最适合接该用户的司机。这一流程也是一系列的机器学习问题。

那么如何权衡订单合不合适,可以有多种办法解决:比如距离和时间上离你最近的司机。当然,权衡订单问题背后也包含个性化搜索,如个别用户可能只喜欢某一类车型、某一种类型的司机。尤其是女性用户在深夜十一二点,可能对车型和司机的要求比较高,这需要进行个性化匹配。

如果用户选择拼车,系统如何找到最适合的一辆车:这辆车有可能是空车,也有可能是载人车,与此同时,算出 A 到 B 的时间。

热力图

这里会遇到一种情况,新司机希望空驶时间越少越好,但往往不知道去哪接单,这时候滴滴会给到一个热力图,告诉司机哪些区域未来的半个小时,有可能有很多订单需求。

滴滴人工智能的核心:订单分配

滴滴研究院目前做的最核心的事情是订单分配。在某个时刻有成千上万的乘客,同时也有成千上万的空闲车辆,我们要完成司机和乘客的最优匹配,权衡标准是匹配度。计算匹配度最简单的方法是用距离进行评估,滴滴在前几年均是用距离进行匹配。但路面距离计算仍存在很多不合理的地方,因为各个路段的状况不同,有些地方特别堵,有些则相反,同样是一公里但行驶所耗时间可能完全不同。这里就急需增加时间这一维度。而计算时间又是一大难题,比预估距离还要难。

所以滴滴实现订单最优匹配需要遵循这两大核心:做出最优路径规划,预估时间。

大规模匹配

计算出某个订单的时间和距离后,会遇到一个问题:由于滴滴数据量特别大,每一个乘客不只是让一个司机去匹配,而是需要跟周围上百个司机匹配。在任何一个时刻,滴滴的匹配量高达千万次以上,在一两秒钟完成上千万次的路径规划,这是一项非常大的挑战。

这项决策与搜索不同,用 Google 搜索出结果后,再过 10 分钟结果依旧与之前相同。而滴滴在匹配时,哪怕滞后两秒钟这个司机就可能过了某个十字路口,使得路径规划状况完全不同。我们现在建立起一个机器学习系统,该系统包含历史数据和实时数据,只要在有滴滴的地方,我们就知道车辆行驶的速度和路况。然后找特征,建立系统,也可用深度学习做路径规划和时间预估。

滴滴研究院最近建立了一套深度学习系统,然后加上路况和其他信息去进行预测,这是滴滴在深度学习领域的一次崭新尝试。简单对比下结果,去年开始用机器学习再到最近的深度学习使误差大概降低了70%左右。

接下来需要做最优匹配,这里有很多不同的方法。滴滴有出租车、快车、专车、豪华车等等多条业务线,滴滴能否把各个业务线打通?比如用户叫了快车,但周围可能没有快车司机来接用户,那有没有可能利用算法去做决策,在这个时刻让专车或出租车司机来接这位用户,该调度方案要做一个全局的最优匹配,充分发挥滴滴优势。

在北京,高峰期大家打车困难可能会认为是由于运力不够导致,但经过分析发现,在高峰期滴滴的运力其实是足够的,主要是因为车辆分布不合理。

此我们开发了一套系统,把整个地球分割成无数个六边形。每一时刻都在检测每一个六边形,然后在某个六边形里面计算订单数和空车数,计算供需是否平衡。

运力问题解决

司机没有在他应该在地方是我们需要解决的一大问题,如果有一个平台可掌握所有信息,这样使其能做出最优决策、最优调度以及导航决策。解决这个问题的第一种方法就是动态调价。我们也在探索另外两种解决方式:

供需预测、运力调度:如何完成预测,我们先来还原一个场景,比如说某个大会大致在晚上 6 点结束后,很多人会有打车需求,这就是预测的一种体现。此外,我们之前也提到人们出行普遍是有规律的,所以能预测某一时刻、某一区域可能缺多少辆车,这样我们就提前 15 分钟或半小时做调度,把过剩的运力从周围调过去,缓解供需问题。这里牵涉到供需预测,供需预测本质上就是一个时间序列的预测问题。

拼车:如果两个乘客的行程和出行时间类似,就无需两个司机去接,而是把两个订单整合为一个组合订单,用一个司机来接。拼车中涉及到一项非常重要的问题就是用户体验:用户体验体现在两个维度,一是价格便宜,二是在接另外一个人时绕的路程和时间不要太多。我们希望把两个订单整合起来后,这个行程路径是相似的。为此,我们建立了几个机器学习模型估计路径匹配度的高低。

预测乘客体验

行程结束后,我们也需要去预测乘客的体验是好是坏。由于历史订单中有些乘客会进行投诉,比如说拼车匹配欠佳、绕路。而有些用户则会给出好评。我们从大量历史数据学习出来哪些特征是导致乘客抱怨的原因,哪些特征会导致好评。

拼车最核心的一点是定价,里面用的也是机器学习优化算法。核心想法非常简单,如果乘客发了拼车单,我们会预测这个乘客起点到终点系统为它找到拼友的概率大不大,匹配度如何?如果预测出他很大概率自己一个人会从头到尾走到底的话,折扣相对就会更低,反之则会高一些。

除此之外,我们也做了很多图像方面的工作。比如驾照图像检测,识别证件号码等,让司机的很多手续无需要到滴滴办公室即可解决。

评分系统


我们可以把滴滴看做是一种搜索引擎,即乘客搜索司机。与百度搜索信息不同,在百度搜索结束后,就没有其他后续问题。但乘客在滴滴中搜索好司机后,滴滴需要保证安全和出行体验。于是我们在近期引入一套机器学习系统,预测司机的服务质量和服务态度,衡量服务好还是坏需要通过分析大量乘客的打分、评语数据。

以往 滴滴和 Uber 都采用星级打分制,后来我们发现该功能并不完美。现实情况是用户要么不打分,要么给较高的五分或四分,使得星级评分功能不够有效。

这本质上是用户习惯问题,为了让评分系统更加全面,平台把乘客留下的所有痕迹都整合起来,然后给出一个分数评判。比如乘客打出星级后,又进行文字评价态度很差、绕路等,针对乘客给出的两个维度信息,我们再根据轨迹等多项数据,然后给出综合的分数。分数越高,滴滴也会保证司机的收入越高,推动司机主动提高服务质量。

这里存在另外一个问题,就是乘客恶意给司机写差评。针对这一情况我们建立了一个判责机器学习系统,该模型能够判差评的背后是司机的责任,还是乘客的责任。如果责任不在司机,我们就不会降低它的分数。判责系统上线后滴滴平台司机满意度有了显著提高。

系统可视化

最后我们提一下非常重要的系统可视化性,这套系统能够看到历史订单行程中发生了什么事情,如哪些区域是我们比较感兴趣的、成交率高的,订单多的。其次是区域变化情况,如早高峰时订单量涨了,晚高峰订单量跌了,应答率可能在早晚高峰非常低,平时可能非常高,我们可以迅速知道每个区域、每个时刻的情况。

上述为区域,我们也可以有一个城市的维度,比如这个城市大概有多少订单?大概有多少司机?乘客发出订单需求成交率大概有多少?我们也能掌握过去和现在的情况,司机实时看到热区所处的位置,引导司机沿着热区去走,减少空驶时间、提高平台效率。

除此之外,我们也能实时看到跨城情况,尤其是春节之前等节假日,因为有很多人会拼车回家。为此,我们也会找到一些比较特殊的区域,单独去分析它发生了什么事。

可视化系统也能让大家看到全城各个时刻供需不平衡情况:哪些区域供大于求,哪些区域求大于供,哪些区域供需平衡,以及现在和过去发生了什么事。针对这些现象,我们需找到应答率低、成交率低的原因。

本文作者:亚峰

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-10-25 04:48:17

滴滴研究院副院长叶杰平:揭开滴滴人工智能调度系统的真面目的相关文章

苹果曝光首份AI论文,揭开滴滴人工智能调度系统真面目| AI科技评论周刊

雷锋网(公众号:雷锋网)按:过去一周,是"中国人工智能元年"的最后一周.这周里,苹果揭开其首份AI论文的面纱:美国启动全球首个深度学习加持的"癌症先进计算解决方案的联合设计":IBM在高性能计算上继续发力,提出数据中心计算(DCS )模型:2016年是三星饱受煎熬的一年,来年它将押注Galaxy S8,发力移动AI助手:滴滴研究院副院长叶杰平,为我们揭开滴滴AI调度系统的真面目. 苹果首份AI论文横空出世,提出SimGAN训练方法 12月27日,苹果的首份AI论文曝

前IBM认知医疗研究总监谢国彤加盟平安 出任平安医疗科技研究院副院长

新智元获得最新消息,认知医疗领域的知名科学家.前IBM认知医疗研究总监谢国彤先生近日入职平安,出任平安医疗科技研究院副院长.平安医疗科技公司副总经理, 负责平安医疗科技相关业务,整合并构建平安医疗人工智能平台.平安医疗科技研究院将充分挖掘平安积累的海量医疗健康数据资源,利用人工智能技术赋能医疗大健康行业. 在加入平安之前,谢国彤先生在IBM中国研究院任职长达15年,担任IBM认知医疗研究总监及IBM全球研究院医疗信息战略联合领导人,任职期间曾将诸多研究成果转化为IBM解决方案. 作为人工智能领域

图文:中国电信集团北京研究院副院长赵慧玲

图为:中国电信集团北京研究院副院长赵慧玲.(陈鑫/摄 新浪网) 2010年4月7日,2010全球IPv6下一代互联网高峰会议在京召开.此次会议主 题为:物联网.云计算. 三网融合,商用IPv6构建基石.新浪科技进行现场直播. 图为中国电信集团北京研究院副院长赵慧玲.

谷歌中国工程研究院副院长刘骏离职

比特网(Chinabyte)5月7日消息,来自谷歌中国内部的消息证实,谷歌中国副总裁.工程研究院副院长刘骏日前也悄然离开谷歌中国,这也是继之前另一位副院长王劲离职之后另一高管离职消息.原谷歌中国工程研究院副院长刘骏(资料图片) 目前为止,刘骏并未透露新的去向,也没有接受媒体的咨询电话,有分析人士猜测刘骏可能会选择自主创业.而谷歌中国的新闻发言人则表示,不会对员工的变动作任何的评论,不过该人士强调在谷歌的黑板报当中已有声明,谷歌中国会继续加强产品的研 发力度,并同时声明多个部门正在招聘人才. 资料

中国电信北京研究院副院长陈运清:网络云化推进中技术和商业驱动场景探讨

由天地互连.下一代互联网国家工程中心主办的"2017全球SDNFV技术大会" (2017.chinasdn.org)于 2017年8月2-3日,在北京国宾酒店火热开幕.在3日上午的大会中,中国电信北京研究院副院长陈运清做了"网络云化推进中技术和商业驱动场景探讨"的主题演讲. 中国电信北京研究院副院长陈运清 以下为现场演讲实录: 陈运清:大家上午好.我今天介绍的题目,关于网络云化.我以前演讲的风格是偏重于切入一个点,今天改变一下风格,前天是杨董事长和集团各位领导到了我

中国移动研究院副院长杨志强:对SDN和NFV的实践和思考

2016年6月1-2日,"2016全球SDNFV技术大会"在北京盛大召开.作为连续举办三届的SDN/NFV技术与产业盛会,本届大会着眼于SDN /NFV的实践应用与部署,从SDN/NFV在运营商网络.企业网.云数据中心.测试解决方案等多个场景的应用出发,深入解析产业部署现状及面临的挑战与发展趋势. 中国移动研究院副院长杨志强 在大会第一天下午的主会场中,中国移动研究院副院长杨志强分享了主题为"对SDN和NFV的实践和思考"的精彩演讲.其中讲到,关于SDNFV,我们觉

谷歌中国工程研究院副院长林斌离职

接近谷歌中国人士透露,"Google中国工程研究院副院长.Google全球 技术总监林斌已在上周离职",至此,谷歌中国核心技术高管已经所剩无几.Google中国工程研究院副院长.Google全球技术总监林斌消息人士称:"林斌在上周离开了工作达 四年的谷歌中国,不清楚他未来的方向,或许会创业."自从李开复去年离开谷歌中国后,谷歌的高管也逐步流失.今年4月,谷歌中国工程研究院副院长王劲跳槽百度担任技术副总裁,此后5月初,时任谷歌中国工程研究院副院长.谷歌全球工程总监刘骏

中移动通信研究院副院长:新型SIM卡将取代NFC

中国移动通信研究院副院长杨志强日前向记者透露,我国自主研发的移动商务支付技术已经取得关键性突破,用户将仅需更换新型SIM卡而非购买NFC手机,就可享用移动支付服务.这将极大加快我国移动电子商务的商用进程,促使其普及推广. 据杨志强介绍,国家移动电子商务研发中心通过制定统一的技术标准及技术方案,加快推进国家移动电子商务的进程:通过自主研发和合作研发相结合的方式,解决移动电子商务发展中的关键技术问题,形成自主知识产权的成果:通过与相关行业开展业务合作,促进产业链发展,加快移动电子商务的推广和应用.

图文:中国电信北京研究院副院长赵慧玲

图为中国电信集团公司北京研究院副院长赵慧玲演讲 由工业和信息化部电信研究院主办的"2009全球下一代网络发展论坛"于2009年5月27日,在京举行.新浪科技作为独家门户支持,全程直播此次论坛. 图为中国电信集团公司北京研究院副院长赵慧玲演讲.