机器学习提供大数据分析欠缺的防护功能。大数据搞定数据泄露发生的原因,机器学习则是在泄露发生时就识别出来。
网络安全专家看到大数据兴奋得双眼放光,因为这就是数据科学界的CSI(犯罪现场调查)。如果公司被黑,客户信息被泄,可以使用大数据技术从公司各系统、用户和客户身上收集大量信息,让数据分析师得以据此得出哪里出了纰漏的洞见。
但是,虽然大数据可以在事后帮助解决案子,却无益于第一时间防止案件发生。数据泄露的遗留影响依然有待解决:愤怒的客户、HIPAA和 PCI DSS之类的数据隐私标准合规问题,甚至政府罚款和集体诉讼。
大数据的短板正在于此:它在数据泄露发生后才进场。正如老话所言:“事后诸葛亮总是对的。”网络攻击发生后使用大数据,无疑能给出最好的洞见。然而,它不能给你的,是意识到数据泄露正在发生或将要发生的能力,在造成重大损失前阻断攻击的能力也提供不了的。因此,大数据,若单独使用,是无法保证公司各系统、业务,或者敏感数据的安全的。
大数据拥护者会说,你可以用后见之明来修复黑客用以入侵的漏洞。毕竟,既然知道哪里出了错,就能打上补丁防止此类事件再次发生,对吧?
虽然这话可能是对的吧——确实可能预防该特定问题再次发生,但网络安全可不是这么简单的事儿。威胁态势是动态的,每天都有新技术出现,相应的,新漏洞也在不断涌现。
而且,黑客与其他任何罪犯都不一样:他们精通科技,适应性强,知道怎么玩弄人类天性。他们总能找到你的弱点——而你最大的弱点就是你的人,那些你信任的可爱员工们。大多数黑客才不从后门突破系统,他们直接染指合法登录凭证,基本上,都是从正面大大方方走进来的。
因此,大多数案例中,大数据分析会揭示出:黑客是通过网络钓鱼邮件之类社会工程骗局,搞到员工口令,然后登录某服务器,进入你的系统。(或者,更糟糕的情况,恶意内部人士拱手交给黑客凭证。)
面对这种新情况,或许你会决定为员工提供网络安全最佳实践培训,比如怎样识别钓鱼邮件和点击可疑连接的危险。雇员网络安全培训是很基本的东西,有助于保持公司系统更安全,但它不是灵丹妙药。
人类是很容易犯错的。累了,分心了,着急了,就疏忽了。另外,再多的培训都挡不住恶意内部人士——心怀不满的雇员、前雇员、决意报复或在暗网售卖机密数据搞点快钱的承包商等等。
幸运的是,解决方案也是现成的:机器学习——一门建立在数学算法基础上的尖端技术,实时更新,让计算机无需显式编程即可学习。驱动自动驾驶汽车的也是机器学习技术,我们用来对抗黑客的强力武器就是它了。
机器学习提供了大数据分析欠缺的防护功能。不同于大数据在事后分析数据泄露原因,机器学习是在泄露发生或将要发生时就识别出来,然后出发系统警报,在真正的损害造成前挡住泄露。
机器学习技术不仅让大数据有用;还能以远快于人工的速度分析数据并从中抽取出洞见。由于其预测能力,应对威胁就可以变得积极主动而非被动反应。机器学习技术可以实时标出利用被盗凭证登录的黑客,并阻止他们登入系统。
该技术没有刻录进网络中,而是嵌入到了应用/数据里。这种认知性的防护盾会监视对应用的每一次登录,观察该登录ID使用者对应用做的任何事,确认该登录会话中的“用户行为”符合该用户ID的惯常参数或基线行为特征。
举个例子,如果某员工凭证在公司外的位置被使用,该员工还试图访问完成其工作用不到的内容,或者登录尝试行为发生在午夜,那么机器学习算法就会注意到此类行为。因为已经分析了该雇员的正常计算机使用,建立了基准模式,机器学习技术就能识别出特定登录尝试是不正常且危险的,将据此在公司IT部门可以调查情况作出决策前锁定该用户。
机器学习能快速给出对用户数据的可行性洞见,提供大数据分析给不了的实时防护。因为一直在学习和修正正常用户行为模式,能立即依据基准模式在黑客造成切实伤害前做出反应,机器学习是防护系统安全的最佳方式。
该技术已有现实应用,正帮助抓捕盗取敏感数据的罪犯,投放数据泄露和隐私侵犯的早期预警。该网络安全技术是高性能数据保护解决方案的未来。如果大数据是犯罪现场调查员,那么,机器学习就是巡逻中的警察:保护你的系统不受网络罪犯攻击,执法,阻止正在进行中的犯罪。
本文转自d1net(转载)