与SDN的一步之遥:让机器自动做决策

当NASA在本月发射猎户座飞行器时,它不得不暂停自动风向传感器,转而由人工来确定风向是否正确。实际上,SDN工程师却没有太多的空间可以尝试停止网络自动化……

我也承认这个观点,我本身也是一位空间极客。更坏的是,我偶尔还是一位飞行员、认证调度员,我的IT生涯始于一家航空公司。上世纪70年代,我在孩提时就观看了阿波罗号发射升空,和许多工程师一样,我也在追随技术发展,从非凡的Werner von Braun手工焊接热机械似的庞然大物到现代更复杂的小型电子化空间系统。

在之前新型猎户座多用途航天飞行器的首次发射计划推迟后,我最近又观看了它的首次成功发射之后,我认识到SDN与可编程网络也将遇到与NASA发射系统相同的挑战。我们都在依赖网络自动化,但是有时候我们需要人工干预。两者的最大区别是,企业IT必须提供持续在线时间,几乎不存在允许一项事务暂停的可能性。

猎户座的主要通信方式是以太网

猎户座携带的中央数据网络是以太网。再详细点说,生命支持、导航、推进器点火、通信与模块交互协调等等,所有方面都通过时间触发的千兆以太网实现互连。确实,这个网络采用了一种IEEE 802.3的私有实现,但是它具有兼容性,增加了一种可靠消息交付分类。此外,它的速度比国际空间站采用的技术快1000倍,并且还包含抗辐射的ASIC,它很像每一个核心交换机都采用的技术。

和现代企业网络类似,最有意思的是猎户座网络将多个原本分散的服务集中到一个电路上。它混合了关键指令流量、最佳文件拷贝和中级语音及视频(但是延迟和抖动要求较高)。与企业网络不同的是,猎户座的网络工程师更关注于保持大带宽,更依赖于芯片,而不是路由器的QoS策略映射。

由独立软件定义的决策过程

在猎户座发射时,瞬时风力曾经两次让发射流程自动中止,而且中止就发生在倒数期间。这迫使飞行主管焦急万分地喊出:“中止!中止!中止!”然后团队作了一个预警决定——它禁用了自动风力传感器,转而采用阿波罗时代的控制方式——由人来观测风速和风向等指数。

回到SDN和网络自动化,我们也会遇到类似的问题。我们将来能交付一些自动决策系统,但是我们也知道在一些特定环境下需要一些人工干预。

然而,IT面临着一个NASA遇不到的特殊挑战。如果NASA没有备用系统,那么它可以选择推迟发射。但是企业IT不可能这样做。我们一直在压力中保持系统能够承受所有这些问题,然后保持不间断地正常运行。可是,在压力下快速作出决策时,安全性往往会成为网络质量中被牺牲的一个方面。

在猎户座首次发射时,有一位经验丰富的飞行主管专门负责监控一个简单的发射/不发射的倒数控制项。这位飞行主管将自己多年的经验用在监控一个重要的SLA指标值。但是在SDN的高度虚拟化聚合网络中,我们不可能有足够多的飞行主管去监控每分钟可能出现的100、1000或10,000个访问策略冲突。我们必须将服务交付需求加到应用程序之中,在SDN控制器中部署安全策略访问规则,然后再退一步,让自主配置的网络自行挑选。

报告:我们遇到了一个网络管理问题

我们的挑战是,在网络运营中心(NOC)控制台发出大量的策略冲突警报时,我们当前的管理与修复方法是无效的。想象一下现在的vMotioning的应用场景,它不仅可以监控一个集群中不同的ESX,也可以监控打包为支持用Docker传输的虚拟机,它们可以每天大批量、自动地从亚马逊迁移到本地数据中心或Azure。这些实例可能会经常与定义的访问策略发生冲突,因为我们的控制器会动态寻找更高效和更划算的配置。当找到这种配置时,我们就必须知道如何教会网络使用这些配置。

这也是从NASA学到的一个经验教训。无论是一个离火星20分钟的任务,或是一个离柯伊伯带4小时的任务,探测器都必须自主运行数十年时间。在30年前,这很多时候都由计时器和猜测来完成,但是现在他们使用一些机器学习技术和大量预编程策略定义,让机器自动作出重大决策。

作为管理员,我们必须学习如何将自己深厚的网络连接知识和从各个网络获得的专业技能转化为智能规则,而非只是一些静态配置。简单的允许或阻挡决策变成了在什么条件下允许或阻挡。QoS分类也需要感知时间/阻塞环境。我们的网络性能监控系统不仅需要监控IP范围,也需要基于设备发送的流量来自动发现设备。

NASA做到的我们也能做到

NASA的官方行为给了我们希望。NASA有着全世界最聪明的工程师,但是他们的探索激情需要经过一系列繁文缛节的考验,其复杂程度远远超过我们在办公室要面对的步骤。但是,他们仍然能够成功实现毫无差错的伟大工程壮举。只有少量的经费,一点点高明的管理,再加上正确的工具,SDN就可以让管理员给原本繁杂的手工配置网络添加真正的智能。但是,我们可能还需要在各个位置部署一些抗辐射的以太网。

原文发布时间为:2014年12月29日

时间: 2024-10-02 14:47:15

与SDN的一步之遥:让机器自动做决策的相关文章

马云对话创业者:我不喜欢人工智能,机器应做人类做不到的事

3月23日下午,阿里巴巴董事局主席马云受邀在马来西亚环球转型论坛(GTF)演讲,与近3000名来自20多个国家的创业者和年轻人交流. 马云说:"我们无法选择出生在怎样的家庭,如果你碰巧出生在比尔?盖茨家族,你很幸运.当然这不可能.但我们可以决定我们死在何处.以何种方式死亡.如果你想死在监狱里,很简单.如果你想去世时有很多朋友,你必须交到很多朋友,你必须改变你的性格.价值观." 博尔特要马云和他来张自拍. 图片来源:博尔特Twitter 曾是英语教师的马云很擅长给年轻人忠告,马云自称&q

MSN频现骚扰信息:官方称是机器自动生成

MSN何以成为垃圾信息重灾区 "你的MSN有没有一上线就被一堆人英文调侃问候?"近日,通讯方式基本靠MSN的白领群体频频遭遇类似的骚扰,更为严重的甚至直接是病毒,即便是已经升级到MSN目前的最高级别版本,也丝毫无法改变骚扰信息的强劲势头. 记者在调查过程中发现,这种MSN骚扰信息在各大白领群体中并不鲜见,一旦用户通过验证,那么,即使用户发现后立即删除了该联系人,也很难保证对方不会再发送此前的骚扰信息. MSN频现骚扰信息 不少白领已经习惯了这样的流程:到了公司以后,打开电脑,然后登陆M

python-怎么自动做支持Python,中文aiml,小白一个

问题描述 怎么自动做支持Python,中文aiml,小白一个

定义完SDN数据中心,接下来做什么?

定义完SDN数据中心后接下来做什么?实际上,这个问题的答案更多取决于企业自身. 事实上,许多关于软件定义网络的讨论都源于另外一个问题:什么是SDN?这里给定的定义是:"在一个软件定义网络中,网络管理员完全不需要接触任何一个交换机,就可以从一个中央控制台操控流量,并且还可以将服务交付到网络中任何需要这些服务的地方,完全不需要关心服务器等各种设备的连接状态." 听上去很简单吧?实现起来就没那么容易了.显示情况是,这一过程尚有许多复杂的问题有待解决,至少在数据中心中是这样的.虽然SDN技术在

SAP PP 为工单确认时自动做收货的设置

SAP PP 为工单确认时自动做收货的设置   TCode: OP67         Micro Message: JINYULIN_SH_

阿尔法狗是怎么用机器学习做决策的

雷锋网(公众号:雷锋网)注:本文作者许铁, 法国巴黎高师物理硕士 ,以色列理工大学(以色列85%科技创业人才的摇篮, 计算机科学享誉全球)计算神经科学博士,巡洋舰科技有限公司创始人, 曾在香港浸会大学非线性科学中心工作一年. 阿尔法狗这个被大家热议过很久的主题, 里面其实包含了非常深刻的机器学习智慧. 是一部学习机器学习甚至是人类决策的绝好教材.机器学习是Alphago取胜的关键,为什么它会发挥巨大作用,请看下文. 了解一门科学技术最好的方法就是找出其核心论文, 让我们看看阿法狗的核心论文是怎么

(转)阿尔法狗是怎么用机器学习做决策的

  阿尔法狗是怎么用机器学习做决策的 雷锋网  作者: 混沌巡洋舰 2016-09-18 18:05:23 查看源网址 阅读数:26 雷锋网注:本文作者许铁, 法国巴黎高师物理硕士 ,以色列理工大学(以色列85%科技创业人才的摇篮, 计算机科学享誉全球)计算神经科学博士,巡洋舰科技有限公司创始人, 曾在香港浸会大学非线性科学中心工作一年. 阿尔法狗这个被大家热议过很久的主题, 里面其实包含了非常深刻的机器学习智慧. 是一部学习机器学习甚至是人类决策的绝好教材.机器学习是Alphago取胜的关键,

前Windows事业部总裁写给CEO和管理者:如何做决策?

编者按:本文作者 Steven Sinofsky,软件工程师与经理人.他现在是美国顶级风投 Andreessen Horowitz 的合伙人,曾担任微软 Windows 事业部总裁.本文为 CEO 和管理者提供了一些做决策的建议和方法,并给出了一个决策角色模型并加以详尽分析. 要成为一位管理者的最高门槛大概就是决策能力了.一间创业公司的 CEO 往往需要面对一系列的决策:从招人解雇.开发安卓版还是 iOS 版,到该购买宜家 Lack 还是 Billy 系列的家具.当一支创业团队成长至 10-20

企业如何成功地利用大数据?基于事实做决策,而不是凭直觉

大数据术语专指21世纪企业所面对的各种数据渠道和信息来源.随着数字领域的开始,这些不同的渠道也越来越多,同时产生越来越多的数据,这些数据量已超过以往任何时候.从更广义上来讲,大数据仅仅是指企业营销(即市场调研和分析)的一个组成部分. 大数据能够帮助企业确定客户的需求.偏好和愿望,并能够帮助他们了解如何满足这些不同的需求.特点怪癖和特性.如果企业能够成功地分析这些数据,那么他们将从这些数据分析中获得比竞争对手更多竞争优势.如果企业不能很好的分析和利用这些数据,那么再多的数据也没有用,企业也无法利用