浅谈闰秒对数据中心的影响

说起闰年、闰月,人们都知道这是为了弥补因人为历法规定造成的年度天数与地球实际公转周期的时间差而增加的。闰秒的概念也类似,由于地球自转的不均匀性和长期变慢性,会使世界时和原子时之间相差超过到±0.9秒时,就把世界时向前拨1秒或向后拨1秒,一般加在公历年末或公历六月末。从1972年开始,这已经是第26次增加闰秒。地球转了那么多年,误差日积月累,从量变到质变,如果不设法校准,那么所有的当日都有可能是昨日,所以必须对时间进行校对。闰秒说起来很容易,将手机手表等电子设备向后调整一秒钟就可以了,但是弄不好还会给我们带来大麻烦。在2012年闰秒就使得社交新闻聚合网站Reddit遇到了技术故障,当时在2012年7月1日7:59:59增加一秒,记为23:59:60,这增加的一秒,使得Reddit的服务器在这一刻出现了不同程度的CPU利用率增长,由于Java构建的开源数据库Apche Cassandra处理不当,Java和Mysql导致了服务器CPU占用率的升高,最后不得不重启。由此看来,闰秒表面上看只是给钟表额外增加一秒钟时间,但就这个看似微不足道的举动,对普通民众的日常生活不会产生影响,时间快一秒慢一秒大家都感觉不出来,更不会出现千禧年千年虫那样的问题。

 

不过闰秒对于全球的电子设备来讲,可能会给我们带来了不少麻烦,尤其是一些特殊行业,比如在航天领域,飞船1秒钟就要飞将近8公里的路程,要是差了这1秒,误差可就大了:飞船轨道可能偏移,飞船着陆地点可能差上十万八千里,更糟糕的是飞船的安全会受到巨大的威胁。再比如,网络通信上,协调世界时被用在很多互联网标准中,像网络时间协议就是其中的一种。如果出现1秒的误差,全世界那么多台电脑一下子都乱了套。另外,电网故障的维修、电网与电网之间的并网,都需要使用精密时间,如果出了1秒钟的误差,甚至有可能是整张电网的停电甚至崩溃。所有的电子设备在设计时很少考虑时间上会出现闰秒的现象,当我们突然对设备的时间进行人为干预的时候,就可能导致设备里记录的数据出现紊乱,最终可能设备无法理解这样的时间调整而最终走向崩溃。

虽然闰秒给我们带来不少的麻烦,但是调整是绝大部分人的公识,当然也有一些组织寻求废除闰秒制度,闰秒的反对者认为闰秒带来的好处并不比引发的技术问题更大,即使每年都出现闰秒,到3015年,地球的时间也不过慢了16分钟。目前来讲,提倡闰秒的依然是主流的声音。如何应对闰秒呢,尤其是在数据中心里有大量的电子设备,一旦设备出现异常将导致数据中心承载的业务受到影响。数据中心的新技术日新月异,每年都有大量代码和程序被创作出来。而最近十年只有三次闰秒,肯定会有很多开发者不熟悉这个概念,在编写一些对通讯依赖较多的程序时没有意识到闰秒可能带来的影响,埋下隐患,那么如何避免?首先,要在数据中心里部署同步授时设备,这些设备可以接收国家标准时间信号,当国家标准时间调整时,数据中心的授时设备很快随之调整,同时向数据中心里的所有设备更新时间,这个前提是要数据中心里的设备都要和授时设备进行时间同步。其次,对于设备可能存在闰秒风险要提前预知,当国家发布闰秒调整时,数据中心要向所有的设备供应商了解其设备是否可能存在闰秒风险,由设备供应商自己去查设备的代码实现,是否有考虑人为增加或减少时间对设备运行的影响,一旦发现可能有问题,在闰秒来临之间,及时更新软件或打上热补丁,解决响应的软件问题。当然很多时候,如果闰秒并不会导致系统崩溃,数据丢失等严重现象,也可以不进行软件的调整。第三,谷歌想到了更好的应对闰秒的问题,谷歌在其服务器时钟中每天人为添加数毫秒,以此避免闰秒出现。而当闰秒出现时,调整幅度已经不足以引发任何报警。之所以这样,是因为数据中心里的设备成千上万,我们是不可能,将所有的设备都检查下确认是否存在闰秒风险,这要耗费大量的人力与物力。这样莫不如像谷歌这样进行时间的微调,在闰秒来临之前,将数据中心所有设备的时间一点点调慢,最终达到闰秒的效果。最后,由于很多闰秒的调整可以遇上特殊的时间,比如股票交易,航空飞行等,这样闰秒的到来可能会带来未知风险,这样数据中心可以将闰秒的调整放到业务量少的后半夜进行,对数据中心业务冲击最小。虽然规定在统一时间进行调整,但是数据中心此时可以不选择时间同步,在业务量最少的时候再选择更新同步时间。有了这些应对措施,其实闰秒并不可怕,这十年内,我们经历了三次闰秒,虽然有些数据中心出现了一些差错,但是对于全球数百万个数据中心来讲,发生故障的概率还是很低的,所以要坦然面对闰秒事件,在闰秒来之前,做足功课,想好各种应对措施,消除闰秒对数据中心运行带来的任何影响。

讲到闰秒,有些媒体过分地夸大了它的影响,甚至说全国的数据中心会陷入恐慌,其实是对闰秒处理机制的不了解。实际上,目前很多服务器的操作系统Linux和Windows都自代处理闰秒的程序,当闰秒到来时,可以自动调整确保系统不出现任何问题。对于闰秒,完全没有必要过分担心,2000年的千年虫事件,当时也说的很恐怖,可能会造成世界所有计算机瘫痪,结果几乎没有发现什么故障,有时人就喜欢自己吓唬自己。虽然如此,我们还是要对闰秒事件做好充分准备,不怕一万就怕万一。

作者:harbor

来源:51CTO

时间: 2024-09-20 00:55:04

浅谈闰秒对数据中心的影响的相关文章

浅谈云计算与数据中心计算

云计算概念发端于Google和Amazon等超大规模的互联网公司,随着这些公司业务的成功,作为其支撑技术的云计算也得到了业界的高度认可和广泛传播.时至今日,云计算已被普遍认为是IT产业发展的新阶段,从而被赋予了很多产业和产品层面的意义.由于意义多重,各种概念纷繁复杂,众多公司和从业人员的眼中都有自己的一朵云,正如徐志摩在<偶然>一诗中所说:"我是天空里的一片云,偶尔投影在你的波心". 传统的系统设计考虑的主要是单机环境,而云计算主要考虑的环境却是数据中心.从单机到数据中心,

浅谈移动接入数据中心的技术难点

移动互联网是将移动通信和互联网二者结合起来,成为一体.据工信部统计,到2016年10月末,我国移动互联网用户总数已达10.77亿,使用手机上网的用户数达到10.2亿,数量庞大的移动互联网用户带来了巨大的商业机会,改变了人们的生活方式.数据中心作为移动互联网重要的组成部分,是其中最为关键的一环.数据中心是互联网海量处理的集中场所,绝大多数的数据中心数据都是为互联网用户服务的.现在,互联网用户里有十亿都是来自移动端.通过手机访问互联网,从而进入数据中心,享受数据中心提供的各种应用服务,这种生活模式已

浅谈OpenStack的数据中心级应用

程辉是OpenStack在中国最早期的推广者和实践者,UnitedStack的创始人,他将在"云计算核心技术架构论坛"深入讲解OpenStack如何构建云计算数据中心,同时也带来团队过去一年来在OpenStack产品化过程中的经验和体会. 开源云平台OpenStack被作为云计算的Linux,成为互联网公司.传统企业首选的开源云平台.传统数据中心由于云计算技术的高速发展,正面临新一轮变革和升级,使用开源云平台OpenStack是构建云计算数据中心最重要的一个选择. 程辉于2013年初带

浅谈信息安全与数据中心安全的关系

数据中心是数据信息处理的集中场所,无时无刻都在运行处理并产生海量的数据信息,保护这些信息安全是数据中心的重要职责.这几年,各类数据中心安全事故不断,让人们对安全问题普遍担忧,尤其是云计算.大数据.虚拟化等这些新技术的出现,更需要对海量数据进行频繁的交互.处理,人们担心这个处理过程中存在安全隐患.现实情况也是如此,这些新技术让安全防护体系更加难做,暴露出了不少的安全问题.比如:2015年8月,日本富士通集团在美国规格的数据中心遭遇停电,致使其一些云服务中断;2015年7月,腾讯云遭遇史上最强DDO

《程序员》:浅谈云计算与数据中心计算

云计算概念发端于Google和Amazon等超大规模的互联网公司,随着这些公司业务的成功,作为其支撑技术的云计算也得到了业界的高度认可和广泛传播.时至今日,云计算已被普遍认为是IT产业发展的新阶段,从而被赋予了很多产业和产品层面的意义.由于意义多重,各种概念纷繁复杂,众多公司和从业人员的眼中都有自己的一朵云,正如徐志摩在<偶然>一诗中所说:"我是天空里的一片云,偶尔投影在你的波心". 传统的系统设计考虑的主要是单机环境,而云计算主要考虑的环境却是数据中心.从单机到数据中心,

浅谈开源大数据平台的演变

浅谈开源大数据平台的演变 2015-04-16 腾讯大数据一说到开源大数据处理平台,就不得不说此领域的开山鼻祖Hadoop,它是GFS和MapReduce的开源实现.虽然在此之前有很多类似的分布式存储和计算平台,但真正能实现工业级应用.降低使用门槛.带动业界大规模部署的就是Hadoop.得益于MapReduce框架的易用性和容错性,以及同时包含存储系统和计算系统,使得Hadoop成为大数据处理平台的基石之一.Hadoop能够满足大部分的离线存储和离线计算需求,且性能表现不俗:小部分离线存储和计算

浅谈公安大数据的建设

ZDNet至顶网服务器频道 11月25日 新闻消息: 1公安大数据的建设需求 近年来随着信息化技术的不断发展,现有的公安警务数据中心无论是规模还是架构都很难适应在海量数据场景下的数据管理和分析,直接影响了公安形势预判和重大决策.因此,在现阶段建设新的能够匹配公安业务场景的大数据系统是公安部门的迫切需求. 新建设的公安大数据系统,将成为面向各警种的大数据管理和分析平台,通过对海量数据的收集.整理.归档.分析.预测,从复杂的数据中挖掘出各类数据背后所蕴含的.内在的.必然的因果关系,找到隐秘的规律,促

干旱对数据中心的影响

日前,美国加利福尼亚州的严重干旱仍在持续.人们常年的担忧的水资源可用性(尤其是在西方国家)终于引发了严重的问题.对数据中心运营商来说,水资源在冷却数据中心设施起着重要作用,但是企业如何解决这一问题?如何避免使用液体冷却技术并为数据中心冷却?用于高性能计算机(HPC)的液体冷却技术难道是唯一可行的选择吗?以下就来看看一些数据中心围绕水资源的一些思考.   水,无处不在,但却- 水是一种丰富的资源,几乎四分之三的地球表面被水覆盖.然而问题是,大部分是海水,使它不能饮用以及在其他情况下不可用.例如,腐

Facebook血拼压力测试:“拆毁”数据中心看影响

网站很担心意外导致的服务中断事故,社交网络巨头Facebook也不例外.不过脸书倒是敢于直面惨淡的事故,主动采取"毁掉"数据中心的方式来演练事故应对和处理,定期进行真实的事故压力测试. 在该公司Scale年度会议上,工程副总裁Jay Parikh表示,拆散一个数据中心比将其重新组装起来更容易,而该公司SWAT(Special Weapons And Tactics,特殊武器与战术)团队执行的定期压力测试正在让该公司软件工程师在数据中心重组方面分变得更优秀. Parikh将这项工作称为P