禾连健康CDO沈金:谈云时代的大数据平台架构

11+大数据行业应用实践请见,同时这里还有流计算、机器学习、性能调优等技术实践。此外,通过Maxcompute及其配套产品,低廉的大数据分析仅需几步,详情访问https://www.aliyun.com/product/odps;更多精彩内容参见大数据频道:https://yq.aliyun.com/big-data 。

禾连健康通过为医院提供无线WIFI网络解决方案作为切入点,让医护和患者在享受高速上网服务的前提,为医护提供提升工作效率的工具,为患者提供健康服务的内容,同时作为国内领先的医院流量运营者,为医药行业提供精准营销服务。在禾连健康,大数据主要被用作在精准营销和内容服务两个部分,一方面为利用大数据做医院流量的精细化运营,另一方面利用大数据在互助问模块道实现自动化问答,从而降低用户获取信息的成本。

近日,笔者有幸与禾连健康CDO沈金进行了简短的交流,就大数据技术架构方面进行了简单的探讨。

以下为实录:

YQ:请介绍一下自己?

沈金:禾连健康CDO,前阿里云数据服务IDMAPPING负责人,后作为阿里云数据工作室成员入驻云栖小镇,参与医疗大数据的创新,案例:“云上安心”、“安心跑”。

YQ:在大数据实践的过程中,你们业务场景中的主要挑战有?

沈金:广告营销团队面对的是国内各种医药保健行业的客户,这些医药客户有非常明确的人群需求,母婴类客户和肿瘤类客户需要是完全不一样的人群,如何有效区分流量,高效利用流量一直是个难题,再加上对于人群的区分需要考虑在医院的就诊轨迹,结合挂号信息,网络访问URL和搜索行为进行完善补充。历史的解决方案是其他云 + 自建HADOOP,这里主要存在的问题有:维护——没有专人维护、开发任务比较繁琐;费用——在同样的满足性能情况下,阿里云明显费用低,只有以前的1/3。

YQ:阿里云数加的哪些特性帮助你们解决了这些问题?你们所使用的服务有?数加给贵公司带来了哪些收益及业务价值,能否通过一些数字阐述?



沈金:利用MaxCompute的离线计算能力和PAI在文本挖掘上的能力,帮助我们能快速解决如细分疾病历史人群的问题,利用DataHub和StreamCompute的实时计算能力能帮助我们

解决如何细分在线人群的问题,通过离线圈人和实时圈人使我们在精准营销方面,广告的点击率提升了3%。

YQ: 贵公司大数据解决方案是什么?可否进行简单描述?




沈金:

  • 离线计算:RDS/MongoDB->Datax->MaxCompute(PA)
  • 实时计算:ActiveMQ->DataHub->StreamCompute
  • 日志收集:MongoDB(目前正在尝试SLC)

YQ:当初是什么原因促使您选择阿里云数加产品的?


沈金:能快速帮助企业搭建稳定便捷的大数据处理基本能力,而且成本也相对较低。

YQ: 对比云服务和自建大数据基础设施,你们是怎么衡量的?

沈金:自建维护成本太高,对数据存储和计算框架未来会越来越普遍,会作为一种基础能力,不想投入大量精力。

YQ:你们未来还想借助大数据实现的场景有?阿里云数加是否能满足你们的需求?如果没有,期待有哪些?

沈金:语音识别,智能问答。

时间: 2024-10-26 04:16:02

禾连健康CDO沈金:谈云时代的大数据平台架构的相关文章

阿里云“数加”大数据平台为计算加点料

数据在现在的年代一点也不缺,大数据时代是一个很好的解释,而且计算也是我们从很早就开始做的一件事. 计算在那个年时代是一件相对困难的事情,但是在现如今计算的能力却平易近人.这就不得不说到图灵,他被誉为计算机之父,其让计算发生了质的飞跃. 为了计算而奋斗始终 为了无法计算的价值,正是现在企业要做的一件事,而这也成了阿里云甚至是2016栖大会上海站的主题,阿里巴巴集团首席技术官王坚对计算这点事做了充分的阐述. 阿里巴巴集团首席技术官王坚 因为有了互联网+数据+计算产生了巨大的价值,使得人类有机会看到以

阿里再次“拔高”云业务 发布大数据平台

阿里的云业务在集团内部的重要性正在持续上升中,去年下半年以来,包括马云在内的众多阿里高管不断在各种场合向外界强调所谓DT时代(大数据时代)的来临. 1月20日,阿里云发布全球首个一站式大数据平台"数加",首批亮相20款产品,阿里云做"普惠大数据"的野心再一次显现. 据了解,"数加"将向有数据开发能力的团队开放,这些团队可入驻"数加",借助数加上的工具为各行各业提供数据服务."这就像在淘宝开店一样,只是他们售卖的是专业

阿里云发布一站式大数据平台“数加”

1月20日消息,阿里云在2016云栖大会上海峰会上宣布开放阿里巴巴十年的大数据能力,发布一站式大数据平台"数加",首批亮相20款产品.据介绍,在输出自身大数据能力的同时,"数加"还向有数据开发能力的团队开放.这些团队可入驻"数加",借助数加上的工具为各行各业提供数据服务. "这就像在淘宝开店一样,只是他们售卖的是专业能力."阿里云大数据事业部资深总监徐常亮表示,阿里云计划用3年时间吸引1000家合作伙伴入驻,共同分享1万亿的大

走进云时代挖掘大数据蕴藏的亿万富矿

现在什么东西最能赚钱?答案是数据.你也许会惊讶于淘宝知道你孩子最爱的奶粉品牌,新浪微博了解你可能认识的朋友,京东商城总是推荐你最喜欢的手机,似乎一夜之间,互联网比你更了解你自己.正如哈佛大学社会学教授加里·金所说:"这是一场革命,庞大的数据资源使得各个领域开始了量化进程."据了解,大数据的市场规模将从2010年的32亿美元成长到2015年的169亿美元,平均年增近40%.甚至有人预言,得数据者得天下. 数据的世界正在不断变化,企业面临的是不断增加的数据容量.种类和速度,我们究竟该如何面

云时代的大数据存储-云HBase

为什么 纵观数据库发展的几十年,从网状数据库.层次数据库到RDBMS数据库,在最近几年的NewSQL的兴起,加上开源的运动,再加上云的特性,可以说是日新月异.在20世纪80年代后,大部分的业务确定使用RDBMS数据为存储基础.新世纪开始,随着互联网的发展,数据量的增大,慢慢RDBMS数据库撑不住,就出现了读写分离策略.随着压力增加,Master撑不住,这时就要分库,把关联不大的数据分开部署,一些join查询不能用,需要借助中间层.随着数据量的进一步增加,一个表的记录越来越大,查询就变得很慢,于是

AWS首席数据科学家谈云价格战和大数据

亚马逊Web服务近年来频繁变动,从价格削减到紧密整合私有数据中心,再到调整企业市场,而且不断扩展其原来的开发者和创业公司客户. 在众多执行者中一马当先的就是Matt Wood,他是亚马逊Web服务(AWS)的数据科学总经理.SearchCloudComputing本周在AWS峰会上和他探讨了企业客户的热点问题.这里我们将谈谈云价格.云联盟.法规以及数据定位. TechTarget云计算:云价格是当下的热点话题,谷歌和亚马逊都在本周大幅降价.在每个人都可以免费得到一切之前价格究竟会有多低? Mat

云时代:大数据发展中的价值与面临的挑战

企业数据量在不断攀升的今天,被越来越多的人所提及,并经常和云计算联系在一起.随着企业用户对大数据的认识日渐成熟,大数据的规模已从数十TB发展成十几PB级的数据规模.对于企业来说,目前大数据有4个V的特点值得关注:海量数据Volume.规模化Velocity.多样化Variety和数据价值Value. 大数据无疑将给人类社会带来巨大的价值.科研机构可以通过大数据业务协助进行研究探索,如环境.资源.能源.气象.航天.生命等领域的探索.大数据正在影响企业商业模式的转变,对数据进行分析.优化正成为提升核

开建全国首个“健康城市大数据平台”

日前,全国首个"健康城市大数据运营管理平台"花落平度,由平度市人民政府.海尔电器集团日日顺物联网有限公司.深圳和而泰智能控制股份有限公司合作,共建健康大数据产业园. 按照健康中国国家战略部署要求,结合平度市作为山东省唯一的国家中小城市综合改革试点,三方将携手共建"健康平度大数据运营管理平台",打造全国首个以大数据为支撑.以物联网为媒介.全方位.多角度.立体化服务的动态大数据健康运营平台,共建"健康平度"智能化健康生态圈. 据悉,与医疗类大数据平台

李彦宏为何看好企业软件?因为云服务和大数据

在前不久的百度联盟峰会上,李彦宏提出两个趋势,一个是对中国企业级软件市场的看好,另一个则是大数据与智能硬件.李彦宏说这两个领域是BAT不会涉足的,不过笔者认为这只是烟雾弹.鉴于百度拥有大量的企业客户资源.基于百度云的技术基础以及百度进军O2O和传统行业的战略,几乎可以肯定企业级软件将是百度接下来的重攻领域. 企业级软件市场规模巨大 "企业级软件"是指支撑企业信息化需求的软件总称.比较典型的有企业办公软件.企业应用系统(CRM.ERP.BSS.BOSS).企业杀毒及防火墙.VPN客户端.