阿里云ET的成功应用——云博士架构揭秘

简介

近几年来,阿里云作为国内最大的云计算服务提供商,随着用户量的急剧上升,产品规模的迅速扩大,用户的服务需求也随之攀升,如何利用阿里云人工智能技术高效的解决用户的问题?

在2016年年初,阿里云服务团队和ET人工智能团队合作,启动了云博士机器人的项目,旨在用人工智能技术提升用户的服务体验。去年11月,阿里云的智能服务机器人正式对外提供服务。

 

 云博士(Dr. Cloud)的官网地址为https://drcloud.aliyun.com,主要功能是通过大数据分析来猜测用户可能遇到的问题并给出解决方案,通过人工智能的技术提供秒级的在线智能问答服务。

技术架构

    云博士技术架构主要分为四层:Portal层、智能服务引擎层、数据持久层及外部数据来源层。同时有管控台支持云博士的语料编辑、数据运维与数据闭环。

   Portal层:Portal层是用户与云博士进行交互的界面,包含PC端、阿里云APP端与钉钉端。一方面用户可以通过PC和阿里云APP两个途径和云博士进行便捷交互,另一方面可以将把云博士作为机器人加入到了钉钉群,群内所有用户只要在群里@云博士就可以开启提问模式,也可以在钉钉上直接和云博士进行一对一的会话。

   智能服务引擎层:智能服务引擎层是云博士处理所有重要逻辑的核心层,同时提供接口供Portal层调用,使得Portal层只需要关注input和output。引擎层主要分为在线响应和离线分析两部分,包涵几个重要的模块:

  • 人工智能算法:用户输入问题后,引擎层调用阿里云ET的问答引擎获取相应答案,根据业务需要对备选答案进行再次处理和答案可信度计算,最后依据设置的可信度阈值来判断答案是否能解决用户的问题。
  • 缓存处理:为了保证高并发情况下的秒级应答体验,云博士使用缓存机制提升性能。在流量比较大的时候,云博士把问答输入和输出存入缓存,之后来自用户的问题如果命中缓存中的问答输入,云博士会把缓存中对应的答案直接返回给用户。
  • 数据封装:把从数据库和调用外部服务获取的各种数据进行封装,输出给Portal层。
  • 调度:Portal层通过调用HSF(类似Dubbo服务)接口,把请求分发到引擎层不同的服务器中实现调度均衡。其中job调度利用DTS(阿里自研的任务调度服务,类似Quartz)和ODPS(大数据计算服务)来运行相应的job。
  • 负载控制:当流量陡然增大时,为了防止服务超负荷运转出现问题甚至宕机,引擎层还做了负载控制,在超过系统承受范围时做限流,保证服务能够正常运转。
  • 提供服务调用:系统通过HTTP和HSF接口为Portal层提供服务调用。
  • 数据分析:把云博士所有问答记录取出进行分析,以帮助算法和数据的优化。
  • 算法数据更新:云博士需要通过不断地进行算法优化和新数据的训练,才能变得更加智能,引擎层会每天不断地推送新的数据去训练相应的模型。

数据持久层:是云博士进行数据持久化的架构层,数据主要以四个方式持久化:

  • RDS: 即MySQL数据库,主要存放的是需要经常使用,对于读写实时性要求高的数据。
  • ODPS: 一般存放的是离线任务执行后生成的数据,对于读写的实时性要求并不高。离线任务生成的部分数据会同步到RDS,供引擎层使用。
  • OSS: 主要存放训练算法模型的训练集数据。
  • Redis:主要存放缓存数据,比如为了提升性能的问答输入和答案输出。

 外部数据来源层:调用外部系统获取相应的数据使得云博士更好的进行状态判定和问题排查,比如调用账单系统查看用户有没有因为欠费而导致服务处于异常状态,调用黑洞清洗查看用户实例有没有处于黑洞中等等。

 除了上面的四层之外,云博士的管控台主要有如下几个功能:

  • 语料编辑:供人工智能训练师编辑语料。
  • 数据运维:实时监控云博士的各种指标,如准确率、PV、UV、、响应时间和一些业务指标。
  • 数据闭环:提升云博士问答准确率,如处理用户提交的对于云博士答案的反馈,进行数据挖掘等。

问答流程

  在云博士底层有一套完整的知识管理系统,所以云博士引入了知识点的概念。在云博士的系统中,知识点主要包括以下部分:

  • 知识点标题:如 “如何连接RDS数据库?”
  • 扩展问句集: 因为不同的用户会有不同的问法,有些问法之间算法相似度并不高,需要算法把同一个知识点不同问法都放入扩展问句集中。
  • 答案:知识点中的问题解决方案。
  • 产品域:知识点所属产品。

  简单来说,用户问题会和训练集中的知识点标题和扩展问句进行相似度计算,把相似度高的知识点作为答案返回。

 

数据闭环

  准确率是云博士的一个极其重要的核心指标,直接影响云博士的业务效果,提升准确率也是云博士一项贯穿始终的重要工作。云博士第一版上线之后,通过阿里云售后工程师打标数据获取到V1.0版的数据去训练算法,然后根据云博士线上的业务效果,自动筛选效果差的数据,同时把不能返回答案的问题进行聚类,通过人工审核、修改扩展问句和新增知识点等方式,对数据进行了优化,形成闭环,从而提升业务效果。

  目前,云博士以智能问答机器人的形式秒级响应用户的问题,还在用户的工单排队期间提前提供建议的解决方案,提升用户的体验。更为重要的是,通过客户的反馈,云博士用强化正确结果和调整负面评价结果的方式持续提升对云计算的理解,实现自学习和成长。最终,阿里云希望通过应用人工智能技术,真正为用户提供极致的服务体验。

时间: 2024-11-10 00:10:12

阿里云ET的成功应用——云博士架构揭秘的相关文章

半年16家云公司融资成功 私有云混合云成投资热点

私有云.混合云市场非但还没有形成寡头,而且存在着非常多的可以纵深切入的方向,成为云创业和云投资的重点领域. 时至今日,云计算成为未来主流IT基础设施已不再是悬念,中国云产业市场正在走向纵深,云公司领域的投资风向正在发生剧烈变化. 近日,云计算服务商青云QingCloud宣布获10.8亿元人民币的D轮融资,本轮投资方包括招商证券国际.招商致远资本等多家机构,蓝驰创投.光速中国等早期投资方跟投. 不仅青云,截至6月,在2017年上半年的中国云计算市场,已经发生了至少16起大笔投资,对外公布的融资总额

好风凭借力,送我上云端 - 阿里云移动服务成功助力人民日报客户端上云

人民日报客户端三期成功发布并举行了盛大的发布会 一.时代背景 1 移动互联网+云计算,奏响时代最强音 云计算 从国家战略(国务院首次布局云计算).市场规模(全球公共云服务市场规模2016年将达2040亿美元).客户认知(全球云计算采用率不断上升 亚太区增长24%)等多个层面来看,云计算早已从时髦前沿的概念演变成为了当今社会的基础设施. 移动互联网 随着智能手机和其他设备的普及,移动互联网时代已经到来.全球移动设备出货量在2011年超越PC机,我国智能手机使用率已于2014年)超越PC机. 放眼中

天弘基金运用阿里云系统,成功应对双十一

双十一大促即将来临之际,一个新的产品余额宝也将问世,这是一个全新的先进技术系统,可通过海量数据与交易的处理能力为更多用户提供优质的服务. 从技术层面上来说,余额宝模式分为两期,余额宝一期是由天弘基金与金证合作开发的新型直销系统,与支付宝进行对接,共同的完成了一揽子的客户综合体验的实现.如今,天弘基金新型直销系统已经成功登上阿里云,技术层面的第二个阶段由此掀开. 在增利宝余额宝项目规划初期,天弘基金就给新型直销系统设计了日处理数百万笔交易的技术系统,意在支撑起产品的客户定位:海量客户.基于生活需求

首届阿里云开发者大赛:应者“云”集

本文讲的是首届阿里云开发者大赛:应者"云"集,7月20日启动的首届阿里云开发者大赛如火如荼,距离最终提交作品时间不足40天,参赛作品设计已经到了紧锣密鼓的收尾阶段.据阿里云云计算业务部云计算产品线高级专家王立博士介绍,自开赛以来,平均每周有数百个作品报名提交.截至目前为止,在阿里云平台中提交报名的开发者已突破2000名,基于阿里云ECS(云服务器)或OSS(开放存储服务)的开发作品数量大致相当. 为了帮助参赛者明确赛事流程与评选规则,熟练掌握基于基于阿里云ECS(云服务器)和OSS(开

阿里云追云数据库风口,完成第三代架构产品布局

云数据库业务已是阿里云发展的最重要阵地之一.9月21日,阿里云发布了新一代自研商用关系型数据库POLARDB.新数据库采用第三代分布式共享存储架构,实现了计算节点和存储节点分离,并使其具有即时扩展能力和运维能力. 据阿里云方面介绍,经过7年发展的阿里云数据库家族已完成基于关系型.键值型.文档型.搜索型.时序型和列式数据库引擎的布局,并拥有16个子产品和超过10万量级的付费实例. 此外,一位知情人士向<财经>新媒体记者回忆称,阿里在自研云数据库的道路走到今天其实是形势所迫. 在2009年之前,阿

阿里云面向企业效率的云上产品全解析——云呼叫中心

日前,在"2017杭州·云栖大会"上,阿里云副总裁李津做了"云之深处"的阿里云新品发布主题演讲,在演讲中,李津认为在数字化时代,商业的效率将指数级提升,而智能技术的发展,也将给企业与客户的交互带来巨大的变化,为了帮助企业在数据化时代领跑商业前沿,阿里云推出了面向企业效率的云上产品栈,云呼叫中心,就是其中的一个重要产品. 在阿里云呼叫中心,企业可以使用呼叫中心进行呼入呼出,例如通过语音服务客户,电话销售,客户回访等场景.配备了交互式语音响应(IVR),自动呼叫分配(A

一个晨冰恋,竟促成了微博与阿里云史上最大混合云

2015年5月29日上午,李晨与范冰冰在新浪微博上晒出甜蜜合影并配文:"我们",承认了两人正在热恋中.这股"我们"风潮在创造了微博2小时阅读量超1000万的记录,联合国的官方微博也趁热晒出了一张前联合国秘书长潘基文与妻子的合影. 然而,谁也不会想到,娱乐圈的蝴蝶扇动了一下翅膀,竟引发了中国科技界的一次创新,促成了微博与阿里云史上最大规模的混合云实践.当流量激增形成脉冲计算,要保证系统的稳定性和服务的正常运转,唯一的办法就是快速扩容,甚至实时扩容."晨冰恋&

阿里云Tech Insight 企业迁云实战专场强势来袭!

随着云计算的飞速发展,越来越多的企业用户选择以云平台为基础,来构建IT架构,聚焦企业的核心战略,以全面提升企业效率.那么,如何将IT架构高效平滑的迁移到云上,如何搭建高可靠高性能的业务系统,我们在Tech Insight的<企业迁云实战>专场将进行一一分享. <冰与火之歌 - Oracle上云研究> 数据库作为企业级应用的核心,也是迁云工作的最大挑战.该部分沉淀了阿里云在面向传统客户迁云技术服务过程中的各类问题和实践经验,从架构设计.实施部署.容灾方案,到产品选型.性能和可靠性测试

直击阿里云VPC: 你要的云上安全体验全部在这里!

这几天大家比较关注VPC,这里向大家介绍下阿里云网络相关的动态.   阿里云起步于经典网络,但已全面转向VPC      大家知道,阿里云从2009年就启动了代号为"飞天"的云计算研发,致力于提供公共云计算服务.那个时候经典网络是普遍的网络类型,因此阿里云云计算系统是从经典网络起步的.为了云上租户的安全性,阿里云研发了安全组,用户通过安全组的设置,也可以做到很好的安全防护,大家有兴趣的可以点击访问.   阿里云在安全上一直持续努力,陆续又推出了访问控制(Resource Access