CNET科技资讯网 2月23日 北京消息:滴滴研究院副院长叶杰平近日在上海一场内部分享会上详解滴滴大脑,这是外部首次窥探到较为完整的滴滴算法世界,并且一直潜水的产品“九霄”也首次露出真容。
滴滴大脑由三部分组成
叶杰平将滴滴大脑这个智能系统分为三部分,分别是大数据、机器学习和云计算。
其中大数据就像工业革命时代的煤一样举足轻重,人工智能需要数据进行训练,纵观应用级深度学习的成功案例,他们都获得了海量数据,像谷歌和Facebook这样的公司都可以获取大量数据,这种优势让他们可以创造更有效的新工具。
而机器学习是人工智能的核心,一套系统通过机器自我学习的方式来实现人工智能,算法则是机器学习的关键要素。滴滴搭建的核心算法模型,可以帮助实现更准确的预测能力、智能的调配能力,提高效率降低成本,达到最优运力调度。
云计算提供强大、灵活的计算能力,滴滴的业务场景对计算要求和实时性都非常高,用户输入一个目的地,最佳合理调度都由滴滴大脑以毫秒级的速度来计算,例如通过滴滴云计算搭建了大规模实时分单处理平台,可以实现多维度最佳订单匹配。滴滴平台已经有数万台服务器,未来两年服务器规模将达到数十万台。
叶杰平揭秘的算法世界是滴滴大脑最为核心的技术之一,滴滴研究院解决的技术难题,包括供需预测、路径规划、智能派单等都离不开算法,此外在提高用户乘车体验上,也引入了人工智能,比如服务分和机器判责等功能背后都是通过复杂的机器学习算法技术来实现。
滴滴大脑每两秒判断一次,要考虑N步走法
打个比喻,每一次分单,就如同下棋,需要考虑之后N步的走法,也就是预测未来,滴滴大脑每2秒进行一次全局的判断,在迅速的大量计算中,完成全局最优的智能派单,对于这些背后的技术,叶杰平在这次内部分享中作了详细解读:
1、供需预测
大数据的神奇之处就在于可以通过搜集到的数据,进行处理分析后,得到规律,然后利用这个规律来对未来进行预测。
最近比较有名的例子是一套名为MogIA的人工智能系统成功预测出川普将成为美国总统,这套亮相于2004年的系统,也曾经对以往三次总统选举进行过成功预测。去年,开发者设计的算法又一次准确预测出了最后关头共和党方面取得的后起势头。大数据还可以预测天气、预测地震,甚至预测你会不会生病等,而在交通方面,大数据预测的能力就极为重要,可以预测什么时间什么地方会拥堵。
大数据预测的关键是足够多的高质量的数据。当前滴滴在交通领域的数据量全球第一,每日峰值订单超过2000万单、每日处理数据超过2000TB,覆盖了交通路况、用户叫车信息、司机驾驶行为、车辆数据等多个维度,它所掌握的巨大的真实数据除了帮助预测路况外,还能对供需进行预测,供需预测越准确,越能更好的解决供需不平衡问题。
滴滴目前对15分钟后供需预测的准确度已经达到了85%,基于这样高的准确率,平台可以调度司机满足未来的打车需求,有效降低未来该区域供需不平衡的概率。甚至可以畅想,有一天滴滴将能精准地知道,星期五夜晚,雨天或雪天,港丽酒店门口有多少乘客需求,附近有多少运力?
2、路径规划
路径规划和ETA两项地图技术是实现智能派单的关键,也将直接影响到司乘双方的使用体验。
通过海量历史数据,可以对未来路况做预测,实现A点到B点的路径规划,它是派单的核心,工程师围绕最低的价格、最高的司机效率和最佳交通系统运行效率来做算法。
ETA指预估任意起终点所需的行驶时间,要求精准性。滴滴是国内第一家把机器学习成功应用到ETA的公司,这是解决“订单高效匹配”和“司机运力调度”的关键技术。当前滴滴ETA可以预测每一单出行的时长以及预估在每一个路口前的等待时长。有了这项技术,可以在更合适的时间对运力进行更好的调度。
3、智能派单
用滴滴叫车,和搜索的逻辑不同,网上的商品、资讯等信息都是静态停留在那里,计算方式只是将这个商品、信息挖掘出来即可,而滴滴的计算则类似于动态打靶,车辆永远在运动当中,要在众多运动的车辆中,给乘客一个最优的选择,不光是距离,时间也是。也就是实现平台效率和用户体验最大化。智能派单对订单量和司机数进行预测,然后通过大规模分布式计算来实现上述的最优撮合。
为了实现这一目的,供需预测、动调调价、路径规划以及服务分的算法技术要一起发挥作用,他们最终为实现最优派单而服务,他们的算法都将结合到智能派单系统中,帮助在动态环境中撮合乘客与司机的交易。
据悉,目前高峰期滴滴平台每分钟接收超过3万乘客需求,每两秒钟作一次订单匹配,每一次发单背后,滴滴大脑运算次数达到百亿次级别。
4、服务分和司乘判责
滴滴使用大数据技术来预估每个司机的服务分值,包括乘客打分、乘客评价以及取消率等因素,并利用算法模型来计算不同服务水平的司机对用户产生的长期影响。
滴滴在2016年9月上线服务信用体系后,司机拥有个人专属的服务信用档案和服务分值,为乘客提供优质服务的车主可获得更高的服务分,从而获得更多的订单和收入。目前服务分已与滴滴的智能派单系统结合,在距离、车型等条件类似的情况下,系统将优先派单给服务分较高的车主,帮助服务优良的车主获得高的收入。上述服务信用体系就是利用人工智能建立算法模型来实现,该信用体系上线后,用户投诉率和订单取消率都显著下降。
保证安全体验,服务分是手段之一,提高司机服务质量,用大数据机器学习模型来计算司机当前服务分,通过交易引擎系统来保证服务分高的司机收入越高,司机就有动力来提高服务。
除了服务分外,滴滴还通过大数据和机器学习模型来进行司乘判责。服务分里重要的几项因素包括乘客取消订单、投诉,以及文字评价等,需要系统来作智能判责,针对当次取消行为,判断司机是否有责?乘客是否有责?去年12月15日全国上线了智能取消判责系统后,司机的满意度得到显著提高。
5、九霄
九霄是滴滴大数据孵化的出行领域智能决策的技术创新产品。能够把错综复杂的时间、空间、业务维度的n次元出行领域数据,转化成易于理解的2次元数据,搭建数据理解的桥梁;帮助运营、产品、BI、研发同学发现问题、分析问题、解决问题,产生切实的业务收益;提升业务决策效率和决策效益。
滴滴将出行领域的数据,进行整理、挖掘、智能聚合,在地图空间和时间轴上进行合理的呈现,使用户能够直观的感知在什么时间、什么地点、各个业务线的什么业务维度(乘客、订单、运力、体验等),发生了什么,方便深入追踪和探寻业务痛点和原因分析。
同时,利用机器学习、数据挖掘的方法帮助运营、产品、BI、研发同学发现/分析和解决实际问题,产生切实的业务收益。举个例子,比如通过九霄对地图上任意区域的供需平衡状况、订单满足情况能够一目了然,并且结合九霄的精细化分析能力,能够进行细化到某个地理围栏的供需策略,进行围栏级别的运力调度策略配置;(在代驾场景上)基于机器学习进行供需预测,判断哪些区域存在运力缺口,自动化调度司机调节供需平衡。
九霄通过科学可视化技术能力、算法能力和高性能架构能力,将数据变为知识,用知识武装决策、改变出行。
数据正在迅速生产,算法和计算平台都需要越来越快的速度
叶杰平表示,算法世界犹如一个浩瀚的星空,没有边际。因为没有一个算法是通用的,每个具体问题就需要一个算法,如何结合业务场景找到最合适的算法是一大挑战。
“算法已经变得非常重要,随着每天数据量迅速增大,现有算法不分昼夜都处理不完,可以说现在算法的分析速度远跟不上数据的产生速度,算法和计算平台需要越来越快的速度。”
当前滴滴在交通领域的数据量全球第一,每日峰值订单超过2000万单、每日处理数据超过2000TB,覆盖了交通路况、用户叫车信息、司机驾驶行为、车辆数据等多个维度,这些海量的数据信息将被利用挖掘,产生巨大社会价值。
原文发布时间为:2017年2月23日
本文来自合作伙伴至顶网,了解相关信息可以关注至顶网。