你的大数据安全么?“Hadoop集群遭遇勒索软件攻击 ”

免费开通大数据服务:https://www.aliyun.com/product/odps

近期,各大安全组织检测到勒索软件正在攻击Hadoop集群,再次表明黑客正在尝试从“大数据”中获利,你的数据资产有没有被黑客get了?

◇◆◇◆◇

勒索软件攻击Hadoop事件综述

最近,部分黑客组织针对几款特定产品展开了勒索攻击。截止到上周,已有至少34000多台MongoDB数据库被黑客组织入侵,数据库中的数据被黑客擦除并索要赎金。随后,在2017年1月18日当天,又有数百台ElasticSearch服务器受到了勒索攻击,服务器中的数据被擦除。安全研究人员Niall Merrigan表示,截止到目前,受攻击的ElasticSearch服务器已经超过了2711台。紧随上述两次攻击事件,目前已经有黑客将目标瞄准了Hadoop集群。这些勒索攻击的攻击模式都较为相似,在整个攻击过程中并没有使用任何勒索软件,也没有涉及常规漏洞,而是利用相关产品的不安全配置,使攻击者有机可乘,轻而易举地对相关数据进行操作。

◇◆◇◆◇

勒索攻击模式

Hadoop框架的两个核心设计是HDFS(Hadoop Distributed File System)和MapReduce。HDFS是一个分布式文件系统,具有高容错性的特点,并且被设计用来部署在廉价的硬件上;而且它能够以高吞吐量来访问应用程序的数据,尤其适合那些有着超大数据集的应用程序。MapReduce是一个使用简易的软件框架,基于它编写出来的应用程序能够运行在由上千个商用机器组成的大型集群上,并以一种可靠容错的方式并行处理上T级别的数据集。

最近出现的针对MongoDB、ElasticSearch和Hadoop的勒索攻击模式都较为相似。在攻击过程中并没有涉及勒索软件和常规漏洞,而是利用相关产品不安全的配置,这为攻击者打开了方便之门。以MongoDB为例,这些受攻击的数据库没有采取任何身份验证,直接暴露在Internet公网上,一旦攻击者登录到这些开放的数据库就可以对其中的数据进行删除等恶意操作了;而针对ElasticSearch服务器的勒索攻击手段也是类似,ElasticSearch的TCP访问模式的默认端口为9300,HTTP访问模式的默认端口为9200,如果这些端口不做任何保护措施地暴露在公网上,那么对它的访问将没有任何身份认证,任何人在建立连接之后,都可以通过相关API对ElasticSearch服务器上的数据进行增删查改等任意操作。

而黑客针对Hadoop的勒索攻击,也是利用了暴露在公网上的端口。Hadoop集群的使用者往往出于便利或者本身安全意识不强的缘故,会将Hadoop的部分端口,比如HDFS的Web端口50070直接在公网上开放。攻击者可以简单使用相关命令来操作机器上的数据,比如:

使用上图格式中的命令可以递归删除test目录下的所有内容。

根据shodan.io的统计结果显示,在中国有8300多个Hadoop集群的50070端口暴露在公网上,如下图所示:

(该图片来自shodan.io)

勒索软件屡禁不止  数据泄露愈演愈烈,企业何去何从?


接下来我们回到国内,看看阿里云在大数据安全性方面是如何保护企业数据资产的。

2016年10月,阿里云数加发布大数据产品MaxCompute V2.0,MaxCompute(原名ODPS)是一个多租户的大数据计算平台,默认情况下,各租户间数据不共享,彼此隔离,但用户可以通过MaxCompute提供的授权机制将数据共享给其他人。https://www.aliyun.com/product/odps

2016年10月,阿里云通过公安部组织的云计算等级保护新标准试点示范工作,成为全国首家通过国家级权威测评的云计算服务商。其中公共云平台、电子政务云平台、大数据平台、云运营系统、云运维等五大系统通过等级保护三级备案、测评,金融云平台通过等级保护四级的备案、测评。 

在2016年6月29日成都云栖大会上,阿里云资深总监肖力介绍,阿里云通过了由全球顶级审计师事务所安永执行的第三方数据安全审计,结合阿里云在会议上发布的《阿里云数据安全白皮书》,https://help.aliyun.com/knowledge_detail/42566.html ;至此,阿里云数据安全管控体系算是正式出现在公众视野。

每一天,阿里云实时保护全中国35%的网站,这使得阿里云具备国内最丰富的攻防对抗数据和样本。再辅以强大的人工智能、机器学习和计算能力,阿里云能够及时从海量的安全数据中抓取到攻击线索、漏洞信息和威胁情报等高价值信息,提升云上用户的整体安全水平,结合云盾、安全管家和安全生态等增值服务帮助云上用户安全、合规。

随着云计算、大数据时代到来,不论是互联网企业还是制造业将时刻释放出海量数据,数据将成为企业最大的能源。数据挖掘、分析及整合将使社会经济、文化等各领域受益,数据的共享、共融也将成为社会发展的必然趋势。然而,在此进程中,数据安全受到前所未有的挑战,请谨慎选择你的数据资产管家,不要让黑客轻易get你的信息;

时间: 2024-09-16 17:11:07

你的大数据安全么?“Hadoop集群遭遇勒索软件攻击 ”的相关文章

Hadoop集群遭遇勒索软件攻击 据称中国有8300多个Hadoop集群暴露在互联网上

继上周绿盟科技发布 ElasticSearch专项报告 以来,又监测到勒索软件正在攻击Hadoop集群,这再次表明黑客正在尝试从"大数据"中获利,绿盟科技给出的建议是关闭端口.启用安全认证机制.使用WVSS Web应用漏洞扫描等方式进行安全扫描.绿盟科技发布的专项报告全文如下: 勒索软件攻击Hadoop事件综述 最近,部分黑客组织针对几款特定产品展开了勒索攻击.截止到上周,已有至少34000多台MongoDB数据库被黑客组织入侵,数据库中的数据被黑客擦除并索要赎金.随后,在2017年1

威胁蔓延 Hadoop集群面临勒索风险

2017年初,大数据生态基础软件就陷入了一场全球范围内的大规模勒索攻击.随着MongoDB.ElasticSearch等软件系统遭遇勒索攻击以外,战火已经蔓延到Hadoop集群系统,黑客删除或破坏用户数据后,利用比特币平台进行匿名勒索,称缴纳赎金以后才能提供恢复数据的方法.该事件已在全世界范围内造成了广泛的影响并给相关组织造成了严重的经济损失. 勒索事件综述: 从2016年12月27日发现一些裸奔的MongoDB用户数据被黑客删除起截至2017年2月3日根据shodan.io的统计结果显示,在中

Hadoop-2.8.0集群搭建、hadoop源码编译和安装、host配置、ssh免密登录、hadoop配置文件中的参数配置参数总结、hadoop集群测试,安装过程中的常见错误

25.集群搭建 25.1 HADOOP集群搭建 25.1.1集群简介 HADOOP集群具体来说包含两个集群:HDFS集群和YARN集群,两者逻辑上分离,但物理上常在一起 HDFS集群: 负责海量数据的存储,集群中的角色主要有NameNode / DataNode YARN集群: 负责海量数据运算时的资源调度,集群中的角色主要有 ResourceManager /NodeManager 25.1.2服务器准备 本案例使用虚拟机服务器来搭建HADOOP集群,所用软件及版本: ü Vmware 11.

Hadoop集群中利用HBase更加高效地进行查询和优化海量数据

本文将帮助读者在大数据云计算 Hadoop 集群应用中利用 HBase 更加高效.直观.便捷地进行存储,查询和优化海量数据. 2006 年 11 月,Google 发表了一篇名为< BigTable >论文 , 2007 年 2 月,Hadoop 的开发人员对其进行实现并命名为 HBase. HBase 是基于 Hadoop 之上的一种新型的基于列存储的开源数据存储架构,用于解决大数据问题,是 Hadoop 的分布式数据库. HBase 现在已经比较成熟,最新的稳定版本是 0.94.x.HBa

大数据虚拟化零起点(六) 使用CLI创建Apache Hadoop集群

在大数据虚拟化基础运维第五步创建Hadoop集群开始之前,我想先说明,这里我不通过BDE提供的可视化界面来创建集群.原因是,我们之前部署好的vApp包括BDE管理服务器,是通过虚机的方式在运行.此时,它还没能跟vSphereWeb Client进行绑定,从而暂时无法交付可视化管理界面.在之后的博客文章里,我将介绍如何交付可视化界面. 但大家不要担心,BDE管理服务器自身已经提供了完备的对外服务接口(RestAPI),用户只需通过命令行(CLI)的方法操控它,就能开始对Hadoop集群进行快速部署

如何为大数据处理构建高性能Hadoop集群

越来越多的企业开始使用Hadoop来对大数据进行处理分析,但Hadoop集群的整体性能却取决于CPU.内存.网络以及存储之间的性能平衡.而在这篇文章中,我们将探讨如何为Hadoop集群构建高性能网络,这是对大数据进行处理分析的关键所在. 关于Hadoop "大数据"是松散的数据集合,海量数据的不断增长迫使企业需要通过一种新的方式去管理.大数据是结构化或非结构化的多种数据类型的大集合.而Hadoop则是Apache发布的软件架构,用以分析PB级的非结构化数据,并将其转换成其他应用程序可管

大数据-三台机器能够构建HA的hadoop集群吗 hadoop-2.6.0 64位版本

问题描述 三台机器能够构建HA的hadoop集群吗 hadoop-2.6.0 64位版本 我设计的架构如图,理论上任意一台机器宕机,集群仍然可以正常工作,不知道这样是否可行. 求大神指导. 解决方案 keepalive 常用于HA, 不过你这里的hadoop 是怎么实现的内部我不是很清楚,不过正常HA 可以实现一台宕机立马切换到备用集群. 我测试过keepalive

大数据探索:在树莓派上通过 Apache Spark on YARN 搭建 Hadoop 集群

有些时候我们想从 DQYDJ 网站的数据中分析点有用的东西出来,在过去,我们要用 R 语言提取固定宽度的数据,然后通过数学建模来分析美国的最低收入补贴,当然也包括其他优秀的方法. 今天我将向你展示对大数据的一点探索,不过有点变化,使用的是全世界最流行的微型电脑----树莓派,如果手头没有,那就看下一篇吧(可能是已经处理好的数据),对于其他用户,请继续阅读吧,今天我们要建立一个树莓派 Hadoop集群! I. 为什么要建立一个树莓派的 Hadoop 集群? 由三个树莓派节点组成的 Hadoop 集

Hadoop集群让大数据分析平台化

咨询师Wayne Eckerson说,Hadoop提供了一个平台,机房动力环境监控为单独数据分析和商业用户建立起的spreadmart(报表集市)提供更为方便的控制,同时还让他们有地方进行自助服务分析. Spreadmart是spreadsheet data mart的简称,在商务智能领域,指多个个人和团队创建的各不相同的电子数据表格.因为数据不一致,所以给业务带来很大的麻烦. 几十年来,所有数据分析人员都使用自助服务分析工具来访问和操纵数据,确定趋势和反常现象,展示商务智能的洞察力等.虽然在这