2010北京TechEd于12月1日,在北京国家会议中心如期而至,直到12月3日,这场许多技术人魂牵梦萦的盛典接近尾声,但是似乎整个会场的热情丝毫不见弱化的趋势,IT168将带您继续追踪TechEd最新技术资讯。
来自为微软的讲师Masashi Narumoto,介绍了《Architecting Applications for High Scalability》课程,他通过实例的形式展示了如何使用微软的云计算平台搭建高可扩展性的应用。
▲
▲Windows Azure架构
Masashi认为云计算是终极的分布式计算,要实现云计算的高可扩展性,最重要的是六个方面:数据分片、反规范化、Base规则,无状态、异步、并行。
分片:所谓分片就是把存储分成几个数据块,并对分区键使用哈希算法,分区一个典型的应用场景就是微博。对数据进行分片可以灵活地进行负载均衡,实现并行查询,从而提高了查询速度。同时也会带来一些挑战,比如单个跨分区的大查询问题、跨分区的连接问题、引用完整性问问难题、重新平衡等等。
反规范化:在设计关系型数据库的时候,我们都会被告知,应该尽量地遵照范式(NF)的原则去做(范式,在有的时候也称为规划化),范式的主要目标就是减少冗余。冗余主要的问题是:重复的数据和增加了操作的复杂性。但正如世界上很多的事情一样,数据库设计也不可能是生硬的。范式确实避免了冗余,但也带来了其他的问题,主要有两个问题:1. 性能问题。因为按照范式设计的时候,数据会被尽可能地拆分在不同的表格里面。这样的情况下,要找到一条完整的数据,就需要对多个表进行联接(join),这种操作毫无疑问地降低了速度。2. 历史数据问题。例如员工都会有职称的信息,但是要考虑到员工的职称会变动。如果仅仅保留一个职称信息,在某些系统中就会有问题。所以这种情况下,我们就必须考虑记录员工职称变动的情况。那么,如果为了解决上面两类问题,我们就可能要考虑“反规范化”,即允许部分的冗余。