淘宝网技术专家:大型交易网站的设计和调优

2009年是挑战和机遇并存的一年,对大部分人来说,已经习惯了金融危机,并努力解决危机。在技术圈子也一样,被裁员的肯定也找到了工作,所以都在踏实做技术。言归正传,先念叨念叨2009年的一些故事,寻个回忆,找个乐子。

数据扩展性探讨和总结

金融危机是电子商务的机遇,所以09年是淘宝高速发展的一年。当一个网站从百万、千万记录的数据规模,增长到亿、十亿、几十亿记录的数据规模时,是一个量变到质变的过程,单纯的硬件升级已经达到了瓶颈,而需要在整体结构上做文章。09年一年,大部分时间都在数据的扩展性上努力。

对于一个电子商务网站来讲,订单是最核心的数据,也是增长最快的数据。对于数据的扩展性来讲,最传统也是最简单有效的模式是数据库的分库分表。当订单和分库分表相遇,会有什么火花迸发出来?09年初碰撞了很久,结果产生的火花很小。最大的问题在于数据分割的规则,无规则的水平分割肯定会带来数据合并的开销,而按照业务规则拆分,会因为买家和卖家的查询需求不同而导致数据不能分割,唯一可行的火花是把订单双份保存,买家卖家各自一份,只是成本比较高,而且对数据同步的要求非常高。

于是我们初步决定按照双份保存的方式拆分订单,而有一天,仔细查看了订单访问的情况,发现订单数据库90%以上的压力来自于查询,而查询中90%以上的压力来自于非核心业务,仅仅是订单数据的展现,对一致性和实时性的要求很低。

因为数据量大,造成数据库压力大,天然想到的是分散压力,其办法就是分库分表。有些时候我们想问题不妨直接一点,既然压力大,能不能减小压力呢?通过对订单访问情况的了解,发现昂贵的主数据库,有80%以上的压力给了不重要的需求,这个就是我们优化的关键,所以订单最后采用了读写分离的方案,高成本的主数据库解决事务和重要的查询业务,80%以上不重要的读,交给了低成本的数据库服务器来解决,同时对数据复制的要求也很低,实现无太大难度。

另外一个有意思的案例是商品的数据扩容,商品的水平分割非常容易,按照卖家进行拆分即可。有了订单的先例,首先想到了读写分离,因为成本可以做低。开始实施后一段时间,又仔细回想了一下商品的整体需求,突然发现商品其实不需要和订单同等的要求,一定要采用高成本的主数据库吗? 全部采用低成本的普通服务器来做数据库是否可行?经过仔细的评估,发现是可以接受的,而这样就导致之前已经启动的商品读写分离项目的一部分工作白做了!

故事讲完了总是要有点总结,来点虚的先:对于原始需求的清晰了解是系统决策的前提,否则弯路肯定要走,而对原始需求的了解并不容易,中间会有很多干扰和阻力,前面的实例看起来很简单,但是在一个运行了5年的系统上来了解本质,来进行变更,并没那么容易。另外,经验有些时候会成为系统决策的障碍,这个很矛盾,所以需要有归零的心态来思考问题。说到底,回归本源。

再来点稍微实际一点的,对于大型分布式系统的数据访问,一个统一的数据层是非常必要的,封装水平、垂直的数据分割,封装读写分离,封装数据访问的路由、复制、合并、搬迁、热点处理等功能,并且要对应用透明,应用针对性的,可以在JDBC层面包装,数据库针对性的,可以在数据库协议层包装,比如Amoeba。

关注系统和人的交互

还有一个故事,在数据层的前期版本,为了做到透明的路由,曾经采用无SQL的方式,所有的数据库访问都是写代码来做。上线后发现一个非常痛苦的问题,无法和SQL对应,排错非常难。曾经一次DBA发现数据库上一个查询耗费太多资源,把优化后的SQL给开发人员改进,开发人员好几天没找到具体是哪个查询。

另外一个在2009年的感触是业界服务化的实施情况,很多组织都在实施服务化,系统层面都很成功,通信、负载均衡、消息系统、服务容器等都有很多成果,但是实施一段时间以后的效果并不是非常好,依赖复杂,变更混乱,效率低下。究其根本,是对人的关注不够,缺少的产品化的服务运维,缺少服务治理。

上面的两个例子都是对人的关注缺失,技术人员做系统,大部分都更关注技术,而忽视技术的创造者和使用者——人。软件或服务的可测试性是对测试人员的关注、可维护性和可管理性是对运维人员的关注,而一个框架的易用性是对所有使用人员的关注。除非能做出自己进化的Skynet(注:Skynet(天网)出现在《终结者》系列电影中,是一个人类于20世纪后期创造的以计算机为基础的人工智能防御系统,最初是研究用于军事的发展。),否则还是要多关注系统和人的交互。

关注可用性

还有一个感触是业界对可用性这个基本指标的关注度不够。几乎所有的框架都会说自己的扩展性多高,性能多好,而很少会提到监控有多强、排错有多容易,很少提到在故障时怎么做隔离,怎么做降级;从这个角度看,商用的产品确实做得好很多;关于性能相关的文章搜索一下,很多,各种优化策略,各种优化方法,而可用性方面,找到的系统性的知识真的很少;希望是我了解的不多。

回顾过去,展望未来。2010年,很多可以做的事情,面向服务系统的隔离和降级、系统可维护性的提高、协程和异步模式在web应用的全面使用……

免责声明:我很现实,为解决问题和完成工作不择手段,并且不懂架构是什么意思,以上观点如有雷同,纯属巧合!如有异议,欢迎拍砖!

个人简介:岳旭强,淘宝网技术专家。2004年加入淘宝,见证了淘宝网业务以及技术上完整的发展过程;在过去5年的时间中,参与了淘宝几乎所有核心系统改造,并主导了用来支撑淘宝网未来高速发展的核心业务中心的建设。岳旭强现在负责网站整体业务架构的设计和规划,在大型交易网站的设计和调优方面有丰富的经验。

时间: 2024-11-03 10:14:57

淘宝网技术专家:大型交易网站的设计和调优的相关文章

仿当当网淘宝网等主流电子商务网站商品分类导航菜单_jquery

本文实现了一个分类导航的菜单,和大多数流行的电子商务网站类似. 菜单的实现难点主要在CSS的编写上,并没有用到太多的JS. 下面只介少几处关键点,详细的实现可以直接查看源代码.所有的代码都在一个sidebar.html文件中. (1) 在图片中的标号1的开口如何实现? 开口右边是一个postion被设置成absolute的div, 这个div向左刚好偏移了1px, 使得左边的菜单栏压住其边框,而选中的菜单又边框是白色,就形成了缺口. (2) 在图片中标号2处如何实现每个连接不会中间换行? 可以把

淘宝网架构师岳旭强的谈网站架构

"一场危机赢得高度关注的时候,它已经不是危机,人们是要处理这个危机."--马云 2009年是挑战和机遇并存的一年,对大部分人来说,已经习惯了金融危机,并努力解决危机.在技术圈子也一样,被裁员的肯定也找到了工作,所以都在踏实做技术.言归正传,先念叨念叨2009年的一些故事,寻个回忆,找个乐子. 数据扩展性探讨和总结 金融危机是电子商务的机遇,所以09年是淘宝高速发展的一年.当一个网站从百万.千万记录的数据规模,增长到亿.十亿.几十亿记录的数据规模时,是一个量变到质变的过程,单纯的硬件升级

淘宝网开放平台申请appkey接口指南

我也使用淘宝OpenAPI也大半年了.不过了,由于阿里软件的文档比较的乱,让很多初学者分不清头绪(注:淘宝OpenAPI是开放在阿里软件的一个平台上,是什么服务集群平台吧).当然了,在中国,能够将自己的http://www.aliyun.com/zixun/aggregation/17488.html">服务资源开放出来给第三方使用,特别是淘宝网这种大型商业网站来说,阿里巴巴的这种分享精神和开放的胸怀还是令人佩服的.因此在使用OpenAPI过程中,我们如果211.html">

解密淘宝网的开源架构

淘宝网,是一个在线商品数量突破一亿,日均成交额超过两亿元人民币,注册用户接近八千万的大型电子商务网站,是亚洲最大的购物网站.那么对于淘宝网这样大规模的一个网站,我猜想大家一定会非常关心整个网站都采用了什么样的技术.产品和架构,也会很想了解在淘宝网中是否采用了开源的软件或者是完全采用的商业软件.那么下面我就简单的介绍一下淘宝网中应用的开源软件. 对于规模稍大的网站来说,其IT必然是一个服务器集群来提供网站服务,数据库也必然要和应用服务分开,有单独的数据库服务器.对于像淘宝网这样规模的网站而言,就是

排序规则调整后淘宝网店推广的新途径

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 近期淘宝网对淘宝搜索的排序规则做出了调整,之前搜索排名靠前的很多商品受到了巨大影响,排名跌落到几页之后.许多淘宝卖家表示规则调整之后,每日的买家咨询量和商品销量跌破了50%.淘宝卖家不能依靠淘宝的排名坐以待毙,需要开辟更多的网店宣传途径.除了论坛.QQ.博客等常规途径外,分类信息网站是一个新兴的.也是被淘宝卖家所忽视的重要途径.那么,淘宝网利

淘宝网启动网购纠纷首问责任制

南方日报讯(记者/戴远程)昨日,国内最大网购零售商圈淘宝网宣布,即日启动网购纠纷首问责任制.淘宝网承诺:只要在淘宝网网购出现交易纠纷,买家和 卖家未达成有效协商的,淘宝网将一律先行垫赔消费者. 数据显示,2009年淘宝网消费者维权部一共介入处理网购纠纷数十万起,占总交易笔数的万分之五.除无效投诉及钓鱼网站等第三方欺诈情况外,98%的淘宝网消费者成功维权,而且都是在30天内处理完结,这些数字都远远优于线下购物. 值得注意的是,2009年网购交易纠纷的三大高发地带分别是虚拟类产品交易(如手机充值卡等

北京有人网上卖盗版淘宝网难逃其责

北京市东城区人民法院日前对中国友谊出版公司诉浙江淘宝网络有限公司.杨某侵犯出版者权纠纷案件一审宣判,判决淘宝网络公司与网上贩卖盗版图书的杨某共同赔偿友谊出版公司2000元. 新华社消息,原告中国友谊出版公司诉称,其享有在中国内地范围内以图书形式出版<盗墓笔记4>的专有权利.2008年11月,原告发现被告杨某以明显不合理的低价,在被告淘宝网上的网店销售<盗墓笔记4>,侵犯其专有出 版权.被告淘宝网作为提供交易服务平台的主体,对在其网上销售的侵权图书及销售主体的资格未尽到合理审查义务,

三部门联合淘宝网 推出“网货每周质量报告”

中介交易 SEO诊断 淘宝客 云主机 技术大厅 3月8日,亚洲最大网络零售商圈淘宝网宣布,为更好保障消费者利益,工商.质检.食品药品监管等三大职能部门联合淘宝网推出"网货每周质量报告".当天,"网货每周质量报告"还首批曝光了今年2月份查处的不合格商品名单. 据悉,与工商.质检.食品药品监管等三大职能部门联合淘宝网推出"网货每周质量报告",在政府部门监管并处理违规商品的同时,把这些不合格商品每周曝光,让网货消费者第一时间知晓. 报告首批曝光的今年2

媒体曝淘宝网店公然售假消费者无处说理

近日,接到多个消费者投诉,称最近在淘宝网上购买到假冒的箭牌马桶.记者随后根据投诉线索在淘宝网上查询,竟然发现有70多家销售假冒箭牌卫浴产品的商铺在正常营业.而更令人奇怪的是,箭牌卫浴总部的负责人告诉记者,该公司一直在配合淘宝网打假,唯一一家箭牌卫浴官方店就设在天猫(淘宝商城)里.既然如此,为什么那些坑害消费者的无良网店仍然大量存在?记者对此展开了调查. 售假网店获利丰厚 2012年4月6号,接到众多消费者投诉,称他们在淘宝网花了500多元钱买到了型号为AB1262的假冒箭牌马桶.据这些消费者反映