击破IT墨菲定律的10种方式

墨菲定律(如果有两种或两种以上的方式去做某件事情,而其中一种选择方式将导致灾难,则必定有人会做出这种选择。)是一种心理学效应,主要内容是:如果事情有变坏的可能,不管这种可能性有多小,它总会发生。墨菲定律起源于1949年加利福尼亚的爱德华兹空军基地。从那时候起它就成为IT界广泛引用的口头禅。这个定律的命名来自于美国空军的一位上尉工程师爱德华·A·墨菲,他参与的一个项目是为了测试人类瞬间加速度的承受力。根据传说,墨菲上尉在试验中因仪器失灵而发生了事故。他抱怨承担责任的技术人员,说,“如果有任何做错的地方,他就会找到。”

从那时候起墨菲定律似乎频繁发生在技术领域,所有IT人都应该在他们的锦囊中有一些墨菲应对机制。下面就是墨菲定律在IT故障中的现代化呈现方式——以及针对你如何解决故障的建议。

1、你的PowerPoint演示出现鼓掌

最精锐的公司都以PowerPoint演示的方式呈现他们的产品和战略,但是却会遇到演示技术发生故障。如果你是CIO,而你正在向总监们演示IT战略(以及预算需求)时,发生这样的鼓掌是非常令人尴尬的。对于折中特别的墨菲情况,要始终确保人手一套演示文稿。这样演示就可以进行下去,你的听众(从他们一方来说可能是受害者)将会表现出同情之心。

2、一个重大项目取决于某一个贡献者……而他感冒了

这可能是一种很困难的墨菲场景,但是你可以让这种情况不那么困难,坚持对项目进行文档记录(这将让其他人让容易接手),一个可靠的负责人和高技能的外部顾问,让你可以在需要的时候叫他们来。此外,一定要确保在你所有项目计划中包含应急计划,以便你可以找到关键人(以及如果他们不在的时候你应该怎么做)以及关键任务路径。

3、有人加载了错误的软件补丁或者发布版本,系统出现故障了

你认为你的软件管理技术是没问题的……但是“墨菲”却加载了错误的软件补丁或者发布版本,让系统崩溃,证明你是错的。处理这种情况的最佳方式就是立即联系你的用户,提醒他们发生了技术故障,收回错误的补丁或者版本发布,重新加载正确的。以后的审查以评估错误的是如何发生的,以及未来你该如何改进要遵循的流程。

4、数据中心

你不是住在多洪灾的地方,可能每年只有10英寸的雨水——但是不知怎的“墨菲”决定了让洪水在意想不到的雨季淹没了你的数据中心——或者大水是源自于内部冷却或者管道系统发生故障所导致。这时候就需要一个强大的灾难恢复和故障转移计划。如果你可以立即将数据中心的运转切换到另一个数据中心,甚至是切换到一个云数据中心,这将好于你把所有鸡蛋都放在一个数据中心的篮子里面。

5、关键业务的最大客户离开了

当说到IT服务的时候,要应对采购部门总是一场艰苦的战斗,但是只要用户要求的“弗雷迪”在那里,你就可以推动新的IT计划。现在“弗雷迪”告诉你,他的彩票中奖了,他打算搬到毛伊岛去。你面前是一条充满了不合作甚至是怀有敌意的(没有弗雷迪在的)艰苦道路。

最好的办法是立即与部门经理联系,最好是在某种比较轻松的场合以午餐的形式见面。你们俩应该面对探讨过去一直困扰你的问题,找出你们俩都可以接受的新的工作关系。

6、你测试了一个软件套件中的所有应用,唯独那个很少使用的应用——让给系统带来了灾难性的打击

除非所有应用和子程序都经过了彻底的测试,否则应用套件是不能投入生产环境的。但是当最后期限到来的时候,项目经理知道要决定“放行”哪些应用以满足不可改变的期限。他们通过一个应用可能被使用的频率来权衡风险,从而做出决定。如果答案是“很少”或者“可能从不使用”,那么他们可能会选择跳过对这个应用进行彻底检查,以满足最后期限。

这时候“墨菲”来了,一位最终用户使用了这个应用,应用发生故障,让整个系统崩溃。避免这种情况的最佳方式就是要求重新调整应用交付日期,以便进行彻底测试。如果你的最终用户完全拒绝考虑修改日期,或者如果有业务环境是不可动摇的,让你别无选择,那么要提醒离利益相关者和用户可能会发生这种情况,这样他们可以避免使用这款应用直到你有机会完成测试。甚至有一个更好的做法,就是把这个应用从最初部署中去掉,等到为投入生产环境做好准备的时候再添加进去。

7、你的供应商被你的前(敌对)供应商收购了

这是更换IT供应商的痛苦之处。也正是你为什么要试图避免更换供应商除非定价或者技术方面发生重大变化——或者与供应商的关系变得如此激烈让你不再想与他们合作。当后一种情况发生的时候,你会在市场中寻找一家新的供应商。不幸的是,如果一两年之后“墨菲”出现了,新的供应商被你的前供应商收购,你的公司再次陷入窘境。

在这种情况下保护你自己的最好方法就是在你与新供应商的合同中写入“管理变更”条款。该条款要指出,如果在供应商一方发生管理变更(例如供应商被收购)。你有终止合约的权利。

8、你的关键供应商负责人离开了

这个墨菲定律总会发生的一种情况。一家公司要出售新的IT产品。好的一方面是该供应商负责给公司上新的解决方案的负责人是友好且具有一定知识水平的。不幸的是,正当要执行完成的时候,这个负责人被新的负责人取代了,后者既不具备知识又不怎么有帮助作用。尤其是如果你开始进入一个新的IT领域,在你的供应商那里和一个既懂知识又有友好响应的负责人建立紧密关系是非常关键的。你可以在与该供应商的合同中明确规定你有权批准或者接受任何负责人任命/变更,避免被移交给一个较小的负责人。

9、对在线营销活动的响应高出你的想象

你的营销经理惊讶于你正在线上推广的商品被快速卖掉。事实上,订单处理系统中新的订单交易数字是空前的。不幸的是,你是根据历史使用数据在今年的预算下部署处理、库存和通信资源的规模。你的客户也看到了这一点,他们正在放弃交易因为系统无法跟上。唉,营销活动正在演变成一个“墨菲”噩梦。你如何避免这种情况?

为好消息准备额外的资源,方式之一就是从云供应商那里获得额外的计算、存储和通信资源。你可以根据需求购买这些资源,为营销推动的收入增长中支付费用,然后在销售需求过去之后释放资源。

10、你的云供应商也发生了故障

你将主要的系统托管到一家云供应商那里,因为这家供应商拥有可靠和同类最佳的声誉——然后这家供应商发生了故障,使得你所有的客户离线,对公司业务造成可怕的影响。你可以与不止一家云供应商建立管理,这样如果一家供应商出现故障的时候,就可以切换到另一家,从而赶走“墨菲”。另外,尽量避免与他们自己本身不拥有数据中心的云供应商签订IT协议。因为你与你的供应商正在使用的第三方数据中心供应商之间是没有合约关系的。

原文发布时间为:2016-7-14

 

本文作者:孙博

时间: 2024-09-19 09:59:58

击破IT墨菲定律的10种方式的相关文章

墨菲定律:一个参数Drop_caches导致集群数据库实例崩溃

李真旭@killdb Oracle ACE,云和恩墨技术专家 个人博客:www.killdb.com 在墨菲定律里,我们知道,有可能发生的故障就一定会发生,哪怕需要诸多因素的叠加才可能满足那复杂的先决条件.在以下案例中,我们抽丝剥茧,细致入微的追溯最终确定了导致数据库RAC实例崩溃的微小原因. 这是一个真实的客户案例,可以概括为一条参数引发的血案.现象大致是某天凌晨某 RAC 节点实例被重启了,通过如下是 alert log 我们可以发现 RAC 集群的节点2实例被强行终止掉了,如下是详细的告警

改善私有云自助服务门户网站的10种方式

私有云门户允许用户利用云计算的自助服务优势.企业按照以下10种方式和步骤来保证用户的满意度,并确保其运行顺利. 云计算以其自助服务模式而闻名,它允许用户配置和管理资源,而不需要直接的IT干预.大多数自助服务互动通过基于网络的门户进行.但只是为其私有云创建一个门户是不够的;开发人员需要以有意义的方式设计和实施它们.否则,门户网站和企业的私有云可能会被淘汰. 以下是创建高级私有云自助服务门户的10种方式. (1)满足用户的实际需求 如果不首先了解工具要解决的问题,就不能创建工具.有时,设计师投入大量

从流程的自动化中获得最大价值的10种方式

本文讲的是 :从流程的自动化中获得最大价值的10种方式,流程自动化很好,如果它可以节省时间并减少错误.但是如果它不能在业务流程中"很好地契合",那么会难以得到普及.问问有谁没有对语音助手感到伤脑筋. 所幸的是,某些最佳实践让你可以从流程自动化中获得最大价值,以下就是其中的10项. 1.保持简单 一个流程自动化项目越复杂,那么就会出现越来越多的故障点,就越难以修复.当数据切换简单易行,你不要做太多干预的时候,自动化的效果是最好的. 2.如果是语音自动化,必须是单音节! 转向采用基于语音技

2012年云计算将破坏企业的10种方式

2012年将带来什么?一个可能的座右铭为即将到来的一年可能是"云第一,但同时也要看到效益".云将成为仅仅是收购IT服务和新应用接受的方式.然而,伴随着公司的IT预算紧张,他们希望看到价值--通过已经应用的云计算. 正如我们总结了一年,现在让我们向前看,2012年云计算将带来什么: 1)"云"的概念炒作将渐渐变淡,因为这将是我们工作的一种方式,我们现在得到的云概念是应用程序和服务交付平台.云将保持甚至比以往任何时候都强,但是,具有讽刺意味的是,它可能也即将开始,似乎超

10种方式帮你最大限度利用IT审计

不管你喜欢与否,每个人都得留着预算,并定期进行IT审计.但是仍然有一些创造性的方法最大限度利用你的IT审计开支.这里有10种方法. 1.用最佳实践收紧政策和程序 审计公司和数千家企业合作,他们了解新法规和合规性要求.在很多情况下,这些公司制定策略模板和流程,当你与他们合作的时候他们愿意与你分享.这会简化你自己的策略和流程制定,因为一开始你就从审计师那里拿到了通用的"最佳实践"模板. 2.提高你的非正式审计能力 如果你希望提高你自己的内部审计能力,那么一个良好的开端就是,让你员工中那些负

在2016年挖掘云端能力的10种方式

在2015年,行业研究显示,88%的企业在使用某种云技术.尽管如此,仍然有很多种方法可以利用还没有被广大企业开发的云.下面就是其中10种方法. 1.应用开发和测试 通过将应用开发和测试活动外包到云中,一些大公司已经可以推迟甚至取消他们自己数据中心内昂贵的硬件升级.方法是在云上按需地.租赁的基础设施中进行应用开发和测试,然后在应用可以安装在生产环境中的时候导入这些应用. 2.用于灾难恢复的备份选择 大公司必须有资源在全球设置多个数据中心用于灾难恢复和故障转移.但是大多数中小企业却做不到这一点.即使

缩减IT预算又不必裁员的10种方式

你已经被高层警告了,你必须削减预算,否则要冒着裁员的风险--甚至丢掉你自己的工作.这种情况经常发生--有时是出乎意料的.但你如何在不裁员的情况下缩减预算呢. 当高层已经一锤定音了,你就必须执行.你必须让预算水平倒退回几年之前,同时保持公司向前发展.这是一种时间悖论,很少有人能在不需要帮助的情况下做到这一点.所幸的是,现在帮助来了.让我们看看,当你要缩减预算.又不让你的部门倒退回90年代,你能做的10件事情. 1.部署开源 如果你不需要把宝贵的预算用于购买微软或者其他第三方许可的时候,你就可以节约

两全其美!实现快速IT而不用冒失败风险的10种方式

:在过去三年中,很多IT项目的跨度从12-18个月缩短到2-3个月.企业用户和企业客户对于新设备的需求加快了,如今业务的步伐需要奏效的创新和试验性IT.但是大量IT工作必须在这个情况下进行.这些都是必须针对应用运行构建的技术基础(网络配置.数据库构建等),但这些又是IT最终用户从来都看不到的.同样用户也不会期望看到当项目仓促交付之后发生中断的情况.所以你如何以"快速IT"满足用户,又不会将自己暴露在因为短时间构建测试可能存在的IT故障风险中呢? 1.用户基于云的应用开发工具 IBM的B

IT部门可以利用自助服务的10种方式

当IT部门增加新技术项目的时候,其员工人数却多年来保持不变.与此同时,终端用户越来越习惯于"自助服务",IT部门应该遵循自助服务的工作原则吗?自助服务并不适用于所有情况--但是在IT有10个领域是它适合的. 1.越来越多的测试流程自动化 通过设置用户测试账户和资源.授权用户,让他们在方便进行测试的时候可以登录到系统和应用中,IT部门就不用打电话请求应用测试设置了.活动日志可以根据用户名或者部门获取测试资源使用情况,如果测试是内部计费项目的话,IT部门可以将账单发送给不同的用户部门. 大