拨开迷雾 将机器学习转化为真正的安全收益

机器学习已成为安全界最流行的新主题。似乎每家厂商都在采用这一能力,力求在竞争激烈的市场上脱颖而出。这就造成了混乱,因为“机器学习”这个词汇本身往往被误解,而其使用的影响也是各有不同。

 


 

不仅每个人对“机器学习”的理解都不相同,不同厂商应用机器学习的方式也各种各样。所有这一切,让买家难以区分炒作和现实,难以弄清机器学习给他们带来的实际价值。

为拨开机器学习迷雾,不妨从澄清它“不是”什么开始。

1. 机器学习不是一种防护形式

最大的误解之一,就是机器学习是某种形式的安全新产品或新功能。事实上,机器学习并不切实提供防护,而是通过驱动更快、更准确、更广泛、更深入的威胁数据分析,来指导防护操作。面对令人疲于应付的安全威胁数据巨浪,机器学习可以提供人类分析师无法达到的处理效率。

2. 机器学习不是过时方法的权宜之计

大多数杀软都用机器学习来分析文件属性,以确定文件是否恶意。但这基本上就是杀软这些年来一直在干的事情——扫描新文件属性与已知恶意软件属性做对比来做判定。其中问题是:对静态已知文件熟悉的依赖,意味着没有任何一点机器学习可以用来阻止未知或无文件威胁。无文件,就没有东西可供扫描。

3. 机器学习未必总能更聪明

与任何其他分析工具类似,基于机器学习的安全解决方案效果取决于可用的数据。但是,众所周知的“垃圾进,垃圾出”。用于训练的正确功能/属性集,大量高品质常更新的数据,是有效防护的倚仗。机器学习模型还必须用及时、相关、高保真的数据经常重训练。

虽然机器学习确实改善了端点安全,我们显然还未达到最好效果。

为能有效阻止今天高度复杂的恶意软件,比如无文件攻击、CPU级漏洞利用、基于脚本和宏的威胁,还有尚未到来的威胁,端点安全机器学习必须适应当前的环境。它必须能够从众多威胁参数和系统配置中,实时辨别软件的好坏。

于是,要兑现炒作承诺,驱动真正革命性的端点安全新浪潮,机器学习需要做什么呢?

1. 必须分析文件行为,而不仅仅是文件属性

将安全决策建立在文件属性上,只在以下2种情况下有效:

有文件可供分析

这些属性事先已被识别并嵌入到了模型中

于是,当涉及到检测并阻止新型未知变体、无文件攻击和脚本/宏攻击时,这就留下了一大片空白。端点安全里对机器学习更新更灵敏的使用,可分析实时行为——程序运行过程中的系统调用和程序指令,驱动这些解决方案在恶意行为刚开始时就识别并阻止之,提供更广泛更可靠的防护。

2. 必须受及时严格反复训练过的模型的指导

大多数厂商每几个月就更新一次模型,但鉴于当前新威胁涌现的快节奏,软件更新的波动性,模型更新的速度显然不够快。真正灵敏的解决方案,利用机器学习以近实时(每24小时)的频率更新其模型,提供能切实跟上当今威胁态势的最准确及时的解决方案。

3. 必须兼顾合法软件

正如每天有数千新恶意软件变体威胁端点,合法软件也在不停更新和整合。基于文件属性的传统安全解决方案,往往难以持续区分好应用和坏程序,无法分辨有益进程和恶意攻击。这就造成了高误报率,迫使用户在等待模型更新的数月中维护白名单和黑名单。

反应灵敏的解决方案,则不仅仅基于当前恶意软件数据,还根据已知良好软件的最新数据,摄入并建立模型,解决这一问题。这么做可以提供更具适应性的敏捷模型,在大幅减少误报和用户麻烦的同时,确保更高的精准度和更广覆盖面。

毫无疑问,机器学习已经,并将持续改变端点安全。但理解该技术实际运作原理及其局限性,是十分重要的。理解了这些东西,公司企业便可以通过询问正确的问题,在快速进化愈趋复杂的威胁态势下,获得充分保护自身所需的准确、全面、前瞻性的安全覆盖。

本文转自d1net(转载)

时间: 2024-10-29 01:05:09

拨开迷雾 将机器学习转化为真正的安全收益的相关文章

拨开迷雾 用ASP寻找到真实IP地址的方法

ip地址 众所周知,得到IP地址的方法是 <%=Request.ServerVariables("REMOTE_ADDR")%> 可如果客户使用的代理服务器,那么用这个方法得到了就是代理服务器的IP了,下面是穿透服务器得到真实IP的代码: function GetIp()dim realip,proxyrealip = Request.ServerVariables("HTTP_X_FORWARDED_FOR")proxy = Request.Serve

探访太平洋电信 拨开迷雾看云计算

作为近年来出镜率最高的IT名词,云计算一直备受关注.目前,云计算已被视为重要项目列入了"十二五产业规划".据权威机构预测,未来几年中国云计算产业规模年均复合增长率将超过80%,到"十二五"末,产值将破千亿.但不少人对云计算认识还是云里雾里,而"深圳云"已经化雨落地:深圳是国内五个云计算试点城市之一,深圳在全国率先发展云计算产业,成立首个云计算产业协会,建立云计算中心和成立云计算产学研联盟. 今天,我们将带你探访深圳着名云计算企业--太平洋电信,这

拨开迷雾 彻底掌握DIV CSS网页布局

css|网页 你正在学习CSS布局吗?是不是还不能完全掌握纯CSS布局?通常有两种情况阻碍你的学习: 第一种可能是你还没有理解CSS处理页面的原理.在你考虑你的页面整体表现效果前,你应当先考虑内容的语义和结构,然后再针对语义.结构添加CSS.这篇文章将告诉你应该怎样把HTML结构化. 另一种原因是你对那些非常熟悉的表现层属性(例如:cellpadding,.hspace.align="left"等等)束手无策,不知道该转换成对 应的什么CSS语句.  当你解决了第一种问题,知道了如何结

创业路上难免遇到困惑成功人士的心得可以伴你拨开迷雾

⒈ 大师兄.大师兄,现在二师兄的肉比师傅都贵了喔! -- 佚名 ⒉ 社会的进步让你有钱投资身体,社会的压力又让你出卖了健康的身体. -- 佚名 ⒊ 做学问,不能靠二手货,不懂的字,要查<说文>,查<尔雅>,查<水经>.要查这个字第一次出现的地方,这样才可靠.<辞源>这一类书,是二手货.我们做学问要有穷根究底的精神才行. -- 古直 ⒋ 董事长是从基层业务员一步一步做起来的.我当然遇到过令人窝火的顶头上司,但没有一走了之.这么多年过去了,我还在,原来的领导呢?

拨开迷雾看本质,剖析国内云计算

关于云计算,我们并不清楚这一平台的具体规模,我们了解的是它支持主流的PHP + Mysql但是出于安全原因有大量修改,未来可能会加入对JAVA.Python等语言的支持,模式与Google App Engine类似,开发者可以在这个平台上快速开发并运行应用. 如果云计算能够提供完善的支持链,未来的互联网创业也许会变得更简单,至少服务器.带宽.运维这部分可以省下很多精力.现在国内很多IDC都是打着云计算的幌子骗钱,本质上说只是多了几台服务器毫无技术含量.幸而公共云计算能够让基础资源得到更加合理的配

28款GitHub最流行的开源机器学习项目(二):TensorFlow排榜首

推荐:28款GitHub最流行的开源机器学习项目(一):TensorFlow排榜首 15. XGBoost XGBoot是设计为高效.灵活.可移植的优化分布式梯度 Boosting库.它实现了 Gradient Boosting 框架下的机器学习算法.XGBoost通过提供并行树Boosting(也被称为GBDT.GBM),以一种快速且准确的方式解决了许多数据科学问题.相同的代码可以运行在大型分布式环境如Hadoop.SGE.MP上.它类似于梯度上升框架,但是更加高效.它兼具线性模型求解器和树学

机器学习和人工智能:2016 重大进展和 2017 主要趋势

编者按:AlphaGo战胜李世石在2016年再次掀起了人工智能浪潮,得益于算法升级.计算机能力提升以及大数据的不断产生,人工智能在过去几年取得了过去几十年没有取得的成就.Kdnuggets 网站汇集了十几位人工智能的专家,包括人工智能公司创始人.大学教授.算法发明人等等,让他们聊一聊关于2016年人工智能的发展,以及展望2017年. "2016年机器学习及人工智能领域的最大亮点和 2017年的重要趋势是什么?"Kdnuggets 网站汇集了十几位专家的看法,AlphaGo 无疑成为今年

蒙板、通道、选区的本质和联系

蒙板.通道.选区,这是PS中最容易让人产生困惑的三个概念.蒙板的种类繁多,如图层蒙板.矢量蒙板.剪贴蒙板.快速蒙板;制作选区的手段也是琳琅满目,让人应接不暇;通道的概念又极尽晦涩,让人不知所云,恰似一头雾水.在对这三个概念的理解上,可谓众说纷云,莫衷一是.本帖旨在探究三者的内涵实质及其内在联系,以期拨开迷雾,明辨是非,成蒙板.通道.选区之大统. 需要说明两点:一是本帖不是告诉大家如何使用蒙板.通道和选区的教程,而是试图从理论上阐释三者的内涵实质,并进一步探究三者之间的内在联系,因此,本帖属于理论

从Hello World说程序运行机制

开篇 学习任何一门编程语言,都会从Hello World 开始.对于一门从未接触过的语言,在短时间内我们都能用这种语言写出它的hello world.然而,对于hello world 这个简单程序的内部运行机制,我相信还有很多人都不是很清楚. hello world 这些信息是如何通显示器过显示的?cpu执行的代码和程序中我们写的的代码肯定不一样,她是什么样子的?又是如何从我们写的代码变成cpu能执行的代码的?程序运行时代码是在什么地方?她们是如何组织的?程序中的变量存储在什么地方?函数调用是怎