AI在双11中的个性化搜索和决策实践

分享嘉宾:

三桐:阿里巴巴资深算法专家,淘宝商品搜索算法方向,主持多个搜索技术项目,致力于推动大规模机器学习、深度学习等在商品搜索的应用。

 

搜索智能化之路

搜索是有交互的个性化推荐产品,具体体现在query的引导,提升整体效率;其次是个性化,主要问题是行业冷启动、购物链路比较长,包括淘宝产品如搜索、推荐、广告的个性化,用户会在其中作不同的穿插;第三,电商搜索是商业平台的搜索产品,涉及到消费者、商家和买家三方市场;最后是数据闭环,淘宝数据链与网页不一样,用户行为(浏览、点击、成交、评价、物流)形成全链路闭环数据,商品数据也上传到淘宝平台中。

AI在搜索中如何落地?

在算法层面,需要考虑用户理解、个性化匹配和排序策略,还要对购物链路进行优化,也要对深度学习在线预估进行探索调研。学习(大数据+大模型+实时+在线预估)+决策(自动探索和学习)是在算法中所作的人工智能,学习具体体现在由单任务-多任务、由浅层-深层、由batch-sgd,决策是指探索未知领域、多任务联合优化等。

AI在搜索中的挑战主要是如何做超大规模机器学习平台,如何进行在线深度学习,如何进行稀疏深度模型处理和加速,如何进行异构计算,如何进行多模信息融合、多任务表征学习、多目标学习,以及如何处理长短期收益平衡?

图为算法系统框架,包括离线数据处理和机器学习平台和在线数据处理和机器学习平台,离线主要做预测和模型训练,在线主要做个性化引擎和搜索服务。算法层面我们实现了常见的强化学习、在线学习、深度学习等主要模型,我们还为搜索业务制定了特定模型。

在系统演化方面我们取得了很多进展,比如:

  • 流式计算Blink:实时日志Join,在线特征抽取和预测和在线学习 TF-PAI@Porsche;
  • 图搜索引擎 IGRAPH:分布式超大规模,实现实时更新、在线查询、过滤、复合查询和推理;
  • 在线排序算分服务 RTP:服务解耦,CPU + GPU异构计算;
  • 机器学习平台:离线、增量和在线学习,混布和异构计算;
  • 引擎:个性化索引和向量召回,多级排序和重排;
  • 平台化:服务产品化,算法平台化。

整体来看,算法、系统和业务正在交织发展,机器学习平台、在线学习平台和实时计算平台是算法的前提条件,我们一直在探索深度学习和强化学习,并且在搜索全链路深度学习、多场景联合优化和知识图谱和智能交互方面取得一些进步。

 

个性化搜索

关键字推荐

推荐关键字主要参考用户和当前query,我们会给出关键字list,用户会选择想要的query进行下一步的搜索,那么,如何评价query list的好坏呢?我们从直接收益和间接收益当中学习,包括query点击和query引导的用户搜索页是否成交,以及用户选择query后,会产生新的query做query推荐。Query推荐是一个序列优化问题,适合使用强化学习来做,所以我们基于DQN做query推荐,每个query是一个action,状态是用户和当前query。

图搜索

个性化搜索数据体系叫电商图谱,是以用户为核心建立用户社交圈、用户生活圈、用户购物行为、用户购物行为、用户标签和辅助关系,通过数据挖掘挖掘出这些关系,基于此图做简单个性化,电商图谱约有10亿个实体、近千亿条边和几十种关系类型。

个性化召回

个性化搜索中较重要的是个性化召回,首先基于Igraph数据取出基本信息,因为搜索中是有query的,每个query中用户信息是不一样的,所以首先会基于上下文对基本信息进行过滤,再拿这个信息去引擎中召回结果。传统搜索引擎只是关键字,在这里除了关键字外,还有很多个性化辅助信息参与召回。

由于布尔召回的召回深度较浅,所以我们使用基于深度学习的向量化召回,向量化召回包括做similarity learning把query 、user和商品变成低维的向量,再通过Top K高位向量的召回实现向量化召回,召回深度有所提高。

Deep User Perception Network

如何深度感知用户?从个性化角度说,一是年龄、性格等用户标签,一是用户行为序列;从搜索角度说,用户行为对于当前搜索的重要性是不一样的
。如图,首先输入x1~xn的行为序列,首先做embedding,然后再经过LSTM做Attention,最后通过相似task学习统一用户表征。

offline training

离线训练流程如图,主要解决如何做超大规模深度模型训练,我们在训练时候有2000个workers、96个parameter servers,每个worker应用15个GPU核,模型规模达到150G。在模型训练本身,针对稀疏 id 特征进行了专门处理。

real-time updating

在线学习流程如图,电商商品变化较快,如果模型无法快速适应变化,效果肯定会大打折扣,所以我们实现了端到端的在线模型学习更新。

online processing

在线预测结果如图所示。

实验结果如图,我们会做不同的尝试实验,基于DUPN我们一是不做端到端训练,现将商品embedding部分用离线模型做预训练;二是做端到端模型训练。可以看到,端到端训练相比其它会有明显提升。

右图为多任务和单任务的对比,多任务准确率相对更高,对于一个任务来说,其它任务就是约束,得到用户表征更加通用。

我们在做任务迁移时比传统迁移有明显优势,用户行为序列通过attention可以更好的学习与当前场景较相关的表征。

Contextual Linear LTR

传统的LTR是指学习统一的模型,在电商搜索中不同行业不同用户下排序特征不一样,对此,我们做了基于上下文的LTR,第一版做了1000个排序模型,每个模型完全独立训练,其实际效果十分明显。但是,该场景划分是根据数据统计划分,具有很大不确定性,如果划分场景比较碎,做在线学习也有很大困难,模型训练稳定性较差。

Online
Contextual Nonlinear LTR

因此,我们使用深度学习得出在线上下文LTR模型。可以看到,在特征层面加入了深度特征,引入了query和user信息,首先会将商品特征进行结合再降维,用户也需进行结合再降维,再将商品特征和用户组合在一起再降维,最后输出时还会用原来商品特征和组合的降维特征再做CTR和CVR预估,通过深度学习非线性表达能力,实现基于用户和上下文感知的非线性排序模型。

Learn to Display

我们做了基于上下文的序列最优排序,利用前面已经排好的结果来预测下一个该排的商品,首先会对之前排好结果做embedding,基于embedding预测下一个商品,实现整页最优排序。

为了生成一些特色商品内容传递给消费者,也为了做商品聚合并生成主题,我们做了智能内容生成展示。

 

智能决策

智能决策与搜索的差异是:在搜索中无法给一些场景确定的样本,比如用户偏好的探索;其次是长短期受益的平衡。因此,实施在多目标环境下,根据环境反馈实时优化策略达到整体最优。

MAB 多样性探索

我们在搜索个性化结果中会有不同维度,使用MAB探索不同维度,分别去计算每个维度收益,使强个性化和弱个性化平衡,提升效率同时避免过度个性化。

feature pruning

不同用户不同场景下,每个特征重要性不一样,如果不用一些特征,可以很好的提升性能。因此,我们用强化学习做用最少的特征学习用全部特征类似的排序结果,排序性能提升20%。

MA-RDPG

非合作竞争会带来负面影响,电商领域有很多类似问题,比如搜索和推荐都奔着GMV,会导致结果趋同,引发无效报关。对此,我们提出MA-RDPG模型,MA-DPG策略独立,评价统一。

实际应用架构如图,首先模型训练是在porsche中完成,搜集样本成立model,model会更新到在线服务,根据Actor场景产生排序policy再部署到我们的环境中,环境中的结果会反馈到porsche中,形成数据闭环。

实验结果如图,可以看到,我们的整体收益有明显提升。

 

性能优化

Cascade Learning

我们在排序时除了考虑模型军队外,还要考虑模型性能开销。我们会把每个特征性能的cascade带进来,样本进来后是否应该进入到下一轮排序,通过控制每一轮排序商品数量,达到整体模型精度。使用Cascade Learning使整体性能提升了30%。

除了业务角度的性能优化,针对深度学习我们也做了很多加速探索,包括降维、量化、剪枝和二值网络。

未来挑战仍有很多。包括在冷启动、多场景联合优化、多目标优化、超参数学习、多模交互和智能导购等多方面,仍有许多等待着我们去完成。

 



《2017阿里巴巴双11技术十二讲》全部讲师直播回顾&资料下载,请点击进入:

 

时间: 2024-10-24 00:43:56

AI在双11中的个性化搜索和决策实践的相关文章

专访阿里巴巴徐盈辉:深度学习和强化学习技术首次在双11中的大规模应用

12月6日-7日,由阿里巴巴集团.阿里巴巴技术发展部.阿里云联合主办,以"2016双11技术创新"为主题的阿里巴巴技术论坛(Alibaba Technology Forum,ATF)将在线举办.(https://yq.aliyun.com/promotion/139) 系列文章陆续发布: 专访阿里巴巴徐盈辉:深度学习和强化学习技术首次在双11中的大规模应用 专访阿里巴巴林伟:三项世界级挑战背后的思考.实践和经验 专访阿里巴巴魏虎:揭秘阿里双11背后的全站个性化&商铺千人千面 价

一张图看懂2017双11中的网络产品和技术

一张图看懂2017双11中的网络产品和技术 揭秘2017双11背后的网络系列文章: 揭秘2017双11背后的网络-一张图看懂2017双11中的网络产品和技术 揭秘2017双11背后的网络-双11的网络产品和技术概览 揭秘2017双11背后的网络-直面双11洪峰的负载均衡SLB 揭秘2017双11背后的网络-全球最大混合云架构

新一代数据库技术在双11中的黑科技

分享嘉宾: 张瑞:阿里巴巴研究员,阿里集团数据库技术团队负责人,经历阿里数据库技术变革历程,连续六年作为数据库总负责人参与双11备战工作. 双11是一场技术大练兵,是互联网界的超级工程.需要做到支撑尽可能高的零点峰值,给用户最好的体验:也要做到成本尽可能低,要求极致的弹性能力:还要做到整体系统的稳定.   数据库如何实现极致弹性能力 数据库上云 数据库实现弹性是比较难的,数据库对性能要求非常高,因此,必须实现数据库上云,但是如何上云呢? 数据库上云面临以下几个难点: 1.         数据库

为了能在双11中获利,各个店家也使出浑身解数

"双11"大战尘埃落定.为了能在"双11"中获利,各个店家也使出浑身解数,几乎所有的营销渠道都被利用到.而"双11"也成了检验店家的试金石,营销是否管用,业绩即可证明.正如马云所说:数字不是我觉得我们今天所关心的.我觉得我最关心的,或者是我们今天最关心的是数字背后的东西,通过数字我们怎么样去真正的理解市场的力量. 双11排行榜的Top10中,不是知名的淘品牌,就是线下的知名品牌,而且随着这些品牌卖家的继续扩张,市场的份额还将被挤占,很多草根的卖家

支撑双11大促,阿里巴巴敏捷项目管理实践及工具落地

日常生活中,我们会接触到很多项目,但是在互联网时代,和产品相关的项目就会复杂的多,我们的项目会遇到什么样的挑战?这个过程中,我们如何应对挑战,解决问题?在2017杭州云栖大会企业高效研发实践专场上,阿里巴巴产品专家光脉,从产品的角度,分享了敏捷研发环境下,项目管理的落地实践. 嘉宾介绍 方奕东(花名:光脉):阿里巴巴产品专家.云效项目域产品经理,主要负责项目和项目集.需求.任务.缺陷和迭代管理等产品工作.2015年加入阿里巴巴,在加入阿里巴巴之前,担任过大型项目和项目组合管理软件的架构师,有多年

“刺激的”2017双11 阿里安全工程师首度揭秘智能风控平台MTEE3

"太刺激了,太刺激了!如果那个48%真出问题,整个安全部的双11就可能是3.25!"知命推了推眼镜,语速明显快了一些.伴随着肢体语言,知命表现出来的是程序员解除了重大Bug时的那种兴奋与激动.用这部IMDB评分最高的电影向阿里安全的工程师致敬 MTEE3是什么?那个48%又是什么鬼? 知命,阿里安全业务安全产品技术高级专家,智能风控平台MTEE3的技术负责人.这一切,他向我们和盘托出. MTEE3,性能.智能双重加持 MTEE3的中文名称叫业务安全智能风控平台,最后面的3代表这是全新一

专访阿里巴巴魏虎:揭秘阿里双11背后的全站个性化&商铺千人千面

12月6日-7日,由阿里巴巴集团.阿里巴巴技术发展部.阿里云联合主办,以"2016双11技术创新"为主题的阿里巴巴技术论坛(Alibaba Technology Forum,ATF)将在线举办.(https://yq.aliyun.com/promotion/139)12月7日晚20:00,来自阿里巴巴的资深技术专家魏虎将在在线论坛上发表<数据赋能商家背后的AI技术>的演讲. 系列文章陆续发布: 专访阿里巴巴徐盈辉:深度学习和强化学习技术首次在双11中的大规模应用 专访阿里

一年一度的电商双11在消费者狂热中落下帷幕

一年一度的电商"双11"在消费者狂热中落下帷幕. 各大电商频频向媒体发来战报.来自阿里巴巴的数据显示,今年天猫"双11"成交额350亿:易迅网公布,促销8天下单金额突破10亿元.京东方面表示,截止到11日中午12点,订单量达到平日全天水平,网站流量是平日的2.5倍.苏宁方面表示,移动客户端销售同比增长了10倍-- 这场狂欢背后,折射出的电商格局的演变:一些电商公司风头正劲,希望从"双11"狂欢中占据一席之地: 另一些电商公司则在"双11

双11享Go了吗?2017阿里双11在线峰会续写科技盛宴!

技术成就辉煌,今年的双11毫无悬念地再次刷新了全球记录--11秒交易额破亿,28秒破10亿,3分01秒破百亿,40分12秒破500亿,9小时破1000亿--最终的交易额稳稳定格在了1682亿,不仅创造了极高的交易峰值和支付峰值,同时刷爆纪录的还有4200万次/秒的数据库处理峰值. 数字背后蕴藏着阿里繁花似锦的炫酷技术,AI设计师"鲁班".阿里机器智能推荐系统.机器人客服"阿里小蜜".智慧物流.华北数据中心的巡检工作由智能运维机器人"天巡".X-C