上海QCon2017参会分享

标签(空格分隔): QCon



10.17-10.19在上海度过了Qcon的三天。今年的Qcon主题非常的散,这也是近两年无论ArchSummit还是QCon的一个特点,基本涵盖了以互联网技术为主的所有领域。

我个人主要关注还是云计算、机器学习和大数据相关的话题,因此主要参与的topic也集中于此。本文就印象深刻的一些展开一点分享。

会场第一个关注的话题,是复旦危辉教授讲的人工智能的一个概述,怎么说呢?这个topic在这个时候回看,是整个QCon我个人认为最棒的topic,偏哲学层面,主要纠正了一些大家对AI的认知,同时也再次强调了要正确认识DeepLearning。可惜这块没有PPT,真心无法传播分享其精髓了。

机器学习应用

理解为算法应用好了,其实方法论确实是大同小异,只是场景的不同,可以看出不同的技术团队在各自场景中的一些取舍。

可配置系统的性能学习

首先看一个例子——《可配置系统的性能学习》。华东理工大学的AP做了基于机器学习来调整可配置系统的参数,期望获取复杂参数系统中“最优”运行的参数组合。因为复杂的参数组合有组合爆炸的问题,在期望有较好性能的情况下能调节有效参数,对于复杂配置系统有很大帮助。具体的一个solution是通用的机器学习方法论,如下图:

唯品金融机器学习

唯品金融的同学分享了他们的机器学习实战经验,比较贴地气。有个谈法挺朴实——没有高大上,面向业务的机器学习。
唯品金融在4大产品方向上做尝试。

当然这些也不是都实现了,分享的讲师提到了一个有意思的话题:算法平台vs算法应用,那他也展示了在唯品金融,算法应用和平台又是如何建设的。

可以看到平台、应用(预测模型)和策略层(人工干预)很清晰的分层。anyway无论高大上与否,我认为这是一种正确且cost based的架构。

携程度假智能云客服平台

毕竟在客服团队,看到客服平台还是忍不住去听了一下。携程的客服场景对应于CCO体系内,业务模式其实主要对标飞猪。其现状

也是在解决多渠道(热线、在线)多环节(售前、行中、售后)的各种咨询和维权问题。那么面对复杂业务场景,携程度假做了一层业务抽象

可以看到,对于智能问答、智能分配、预警,与我们集团CCO的技术产品有同质性,也就是说在客服场景中,如此复杂的业务逻辑,必须通过几个核心步骤和域划分开。其中对于用户意愿的持续追踪,我觉得与我们当前团队做的主动服务以及小蜜团队的障碍预测很类似。就是要基于数据在用户动作前预知到用户的意图。具体如何做的呢?很遗憾,演讲者没有细节深入,只有一个架构图粗略的描述了整体系统的模块划分。不得不说太遗憾了。

这里演讲者着重讲了携程自己做的Easy AI平台,看UI截图其实功能很简单,就是集成了标注和一些model的管理。算是工程层面的一个特色吧。

TensorFlow与深度学习

这个topic是Google Brain团队带来的,主要是TF的特性介绍,几个新特性比较吸引人,如微博上前段时间比较火的eager execution,还有auto learning的Learn2learn。我对后者比较感兴趣,这里截了一些图片简单介绍。

如上图这样的复杂网络,是很难炼丹完成的,那么learn2learn可以解决这类问题,一个主要方法就是迭代优选。就像去年和寿哥团队简单了解autolearning一样,基本就是需要迭代来尝试。

TF的learn2learn能力据说还不错,很快可以搞出一个性能不错的net。

Pinterest如何利用机器学习实现两亿月活跃用户

这是硅谷专场的一个topic,Pinterest的同学分享了一个推荐rank的系统演化。算是比较经典吧,而且进度和集团手淘的千人千面也差不多。基本上第一阶段都是规则策略,然后演化为线性模型,接下来GBDT用boost组合的方式来优化,到如今演化到DeepLearning。

其首页的推荐核心是个性化主页

核心问题是

系统演化刚开始的规则(基于时间)

线性预测(LR、500+稀疏特征)

GBDT(XGboost、深度7、700+特征)

DL(TensorFlow、1层embeding+4层全连接的神经网络、ReLu+SigmoidGate混合神经元)

系统演化

最后的总结还是不错的。线性模型不能很好的利用高维复杂特征,另外cross feature都要手工做,同时用户特征(年龄、性别等)对于模型无意义,因为不同的user-item pair,user维度是一致的。那GBDT其实是演讲者最推崇的一个模型,因为这个模型对于性能的提升是巨大的,且有效的探索和丰富了特征空间,能做特征分析的算法,我个人也倾向于应该是一种合理的算法(符合人类直觉),我相信如果不是DEEPLearning太火,Pinterest的首页推荐应该就是GBDT了。因为讲者自己也说了,GBDT的离散特征处理不足的问题,也可以通过加embedding解决。

大数据

最后还是要谈回大数据,之前archsummit思考里就讲过离线计算的大数据架构已经是一个稳态架构,果然在2017大家已经不谈了,实时计算出现了稳定的专场占据着大数据专场的一个固定席位。今年的实时主要是阿里的介绍为主,包含Blink Sql和毅行的Porshe,因为内部有更多机会了解,因此没去。主要听了一个talkingData的内存计算和Linkedin的系统分享。

基于内存的分布式计算

这个话题扯的太大了,其实TalkingData就是在做我4年前在无线和一群小伙伴做的事,实时计算uv。他们提到的架构主要是用bitmap来去重,而bitmap又是以blob的结构存mysql的,导致binlog巨大。因此提出一个改进的方案在内存中分布式的存储来计算。大体流程是这样:

这个blade就是核心的内存计算框架,大体集群包含

这里主从是双写的,也无法解决完全的高可用,只能是相比老系统提高。这里当时会场有很多人有疑问,不过没有深入细究。

Building Invisible Data Infrastructure at LinkedIn

linkedin的这个topic话题很大,不过主要介绍了两个开源的系统:Helix和Nuage。

topic开始先普及了一下分布式系统,介绍了一些难点:

Helix主要是负责做分布式的集群管理,而Nuage则关注云平台。Helix的抽象主要面向Node和机器,管理的资源就是Database和Job。主要的资源状态包括master、slave、online和offline。核心通过zk来协调,有个spectator负责做资源mapping。细节比如如何高可用的利用zk,没有仔细讲。主要架构简图如下:

Helix照演讲者介绍来看,基本管理了linkedin的全部db资源,不仅是关系数据库,包括文档数据库、kv数据库、OLAP数据库都是通过helix管理的。而Nuage更像一个管理平台,Nuage本意就是法语的cloud的意思。其提出两个核心概念——Automation、Self-service,这个听起来很好。而Nuage的目标也是做这样的事情。让开发和运维过程更自动化和自服务,降低犯错的可能性,统一审批和安全流程、一致的监控和告警、做容量预估,anyway,这样的管理平台可想象的空间真的很大。这两年看到集团内部这么多的基础运维平台出现,如果打包合并,就是Ali的Nuage。智能自动化运维不是梦。

最后附一个LinkedIn的data infrastructure图结束。外加一句总结:大数据离线&实时架构稳定了、高可用高并发互联网架构稳定了、机器学习的套路也算固定了,后面会是什么呢?我非常看好Robotics,including chatbot。

Reference

时间: 2024-09-19 11:21:24

上海QCon2017参会分享的相关文章

AWS SUMMIT In London参会分享

AWS SUMMIT In London参会分享 本次AWS在伦敦举办的峰会包括三部分:presentation分七个场次持续半天时间.现场演示和培训持续两天时间.合作伙伴的展览活动.我与@陶方参加了这一次会议,由于内容同时进行,我侧重在参加展览以及部分安全相关的session,陶方关注在aurora和redshift数据库相关的专场. 几个总体印象: 合作伙伴参与度非常的高,合作伙伴参与会议的发起 合作伙伴中做安全.监控.日志分析占大半以上,很多厂商是从传统厂商转型到云计算平台上来的 AWS的

(转) ICML2016 TUTORIAL参会分享

    ICML2016 TUTORIAL参会分享   本文转自: https://mp.weixin.qq.com/s?__biz=MzI3MDE4NTk4MQ==&mid=2658399541&idx=1&sn=de6da3b595f1843a85acf75110f54e48   原创 2016-07-26 阿里巴巴-探微 蝙蝠遐想 本次ICML会议的tutorial安排在主会前一天.这次tutorial内容非常丰富,有微软亚研的hekaiming(已经跳去facebook)介

表格存储在QCon2017的分享

        在QCon2017的基础设施专场,笔者以表格存储为基础分享了分布式系统设计的几点考虑,主要是扩展性.可用性和性能.每个点都举了一个具体的例子来阐述.这里对这次分享做一次简单的总结.        首先,说到了表格存储产生的背景,大规模.弱关系数据,对灵活schema变动的需求,传统数据库无法很好的满足,NOSQL的出现是一个很好的补充.NOSQL不是为了取代SQL,也无法取代SQL,是已有数据库生态的很好补充.我认为未来会出现更多种类的数据库,面向不同的业务,使用不同的硬件,数据

Qcon2012杭州站参会分享

去年参加了QCon杭州2012大会,有一些收获和大家分享一下. 京东的分享 京东面临的问题 京东的分享嘉宾何斌提出京东之前面临的两个问题:第一个是促销时需要很多机器,但是平时不需要:第二个是当某一台客服中毒其他客服主机也会中毒.大家可以先思考下,觉得应该如何解决这两个问题呢? 京东的解决方案 第一个问题京东采用弹性架构的方式解决.当服务器的资源利用率超过一定阈值时动态扩展虚拟机.举一个例子:如在5分钟内资源使用率达到某个设定的阈 值时,就会自动生成几个虚拟机,虚拟机里会自动部署好相关的应用程序,

ICML2016 TUTORIAL参会分享

本次ICML会议的tutorial安排在主会前一天.这次tutorial内容非常丰富,有微软亚研的hekaiming(已经跳去facebook)介绍深度残差网络,也有deepmind的david silver介绍强化学习,还有一系列优化相关的topic等等.笔者选取了深度残差网络,随机梯度,深度强化学习三个topic,下面简单做一下与会分享: Deep Residual Network He Kaiming FACEBOOK 相关介绍链接 http://kaiminghe.com/icml16t

上海智慧城市体验周启动 “共享经济”引热议

"2016上海智慧城市体验周"1日于此间启动,"共享经济"成为政企学界探讨的热点. 北京大学教授杨学山在体验周的高峰论坛上指出,中国的分享经济还处于萌芽期,"既使是今天规模特别大的网络约车或是住房分享,我们的商业模式也还有完善和发展的余地,更不用说分享经济还没开拓的领域." 赛迪研究院副院长樊会文指出,中国国内已有几十个行业都有了分享经济的苗头,除了汽车.房子.物品.金融等的共享,目前还在向更深处发展,比如物流.医疗的共享等等. 他认为,分享经济

《算法帝国》:被算法和算法交易改变的未来

当我们用崭新的视角去观察与思考,世界就会变成另外的模样.这是我们筹备举办"改变未来的算法与算法交易"研讨会的初衷. 美国雄霸全球依赖华尔街与硅谷等强大支柱,而近年来,算法对华尔街的渗透与控制体现出颠覆未来产业生态的力量.图灵公司出版的<算法帝国>一书中介绍,2000年,华尔街通过计算机程序交易的比率不足美国股市交易量的10%:2008年上半年,自动化电子交易占了全美股市交易量的60%:现在,华尔街70%以上的交易依靠所谓的黑盒子或者算法交易(闪电交易)运行.银行家和股票经纪

朗科创始人内讧始末:缺乏利润增长点是根源

外部市场不利,加上邓国顺.成晓华两大创始人相互掐架,导致朗科连连"掉价".南都漫画:陈婷 创始人"翻脸"业绩"变脸"朗科有点悬 公司面临内忧外患,股价从2010年上市之初最高60元,一路跌到如今的16元左右 曾经的创业搭档,现在却变成了见面分外眼红的"仇人".昨日,仅仅因为修订一份<控股子公司管理制度>,朗科创始人之一的邓国顺,再次投上反对票,邓国顺与现任董事长成晓华(微博)之间的矛盾愈来愈深. 作为闪存盘市场的开

全球云计算大会首次登陆中国

继百度云.阿里云之后,腾讯云平台近日也宣布全面开放,这代表着"BAT"三家互联网巨头全部进入云计算市场.同时,云计算概念也正在被大众所熟知,如云存储.云服务.云安全.云电视等.云计算应用领域广泛,国内电信.政府.科教.金融等行业最需要云计算,据机构预计,中国云计算市场规模每年以超过40%的速度增长.云计算在中国正掀起浪潮,而2013全球云计算大会也于9月15日至17日在上海举行,这是此大会首次亮相中国.本届大会围绕云经济及战略.大数据.云服务模式.行业应用(游戏云.电商云等).云安全等