看了这篇文章,再也不用担心邮件被误删除了

一.故障描述
由8块盘组成的RAID5, 上层是EXT3文件系统,由于误删除导致文件系统中的邮件丢失
二.镜像磁盘
为防止数据恢复过程中由于误操作对原始磁盘造成二次破坏, 使用winhex软件为每块磁盘做镜像, 以后所有的数据恢复操作都在镜像盘上进行, 不会对原始磁盘造成影响
镜像结果如下:
图一

三.组建RAID
通过分析数据在硬盘中分布的规律, 获取RAID类型, RAID条带的大小,以及每块磁盘的顺序。根据分析结果使用UFS组建RAID。
结果如下:
图二

四.导出目标分区
从组建好的RAID中可以看出,上层划分了好几个EXT3分区,通过对每个分区中底层数据的分析, 发现605G的分区里面有大量的邮件头,并且有nsmail目录, 确认此分区是数据恢复的目标分区,使用UFS软件将此分区导出,以便后续处理。
图三

RAID中的所有分区如下:

nsmail文件夹:
图四

邮件头示例:
图五

五.邮件恢复
由于EXT3文件系统中文件删除后,节点中的文件大小和块指针都被清零, 因此很难通过常规手段去恢复。针对EXT3文件系统的特点和邮件文件本身的结构,确定算法概要:
在整个文件系统范围内,做全盘扫描,将找到的邮件文件全部取出,然后根据邮件本身记录的收件人、发件人、抄送、主题等信息进行整理,最后再将数据迁移到263平台上
详细过程:
1.完成邮件标识程序,识别收发人、主题等memi标识程序编写。
2.完成ext3超过48k邮件提取程序编写。
3.按小于48k、大于48k两种算法对邮件进行提取。提取同时,生成邮件索引信息库,并且提取非自由空间和非邮件区。
4.对3中提取的非自由空间和非邮件区进行人工分析,确定有无遗漏的邮件,如果有,确定遗漏的原因,调整算法,重新进行扫描。
5.重复3,4过程,直到最后的非自由空间和非邮件区中没有遗漏的邮件。
6. 对所有提取出的邮件,按照数据库中解析到的收件人和发件人归类,每个账号一个文件夹,内含收件和发件两个文件夹。
结果:
第一次 导出邮件 68.2G, 数据量 692,767 个文件
第二次 算法改进后, 导出邮件 77.2G, 数据量 720,209 个文件, 多了3万文件左右
第三次 再次改进算法, 导出邮件 84.8G, 数据量 895,032 个文件, 比第二次多了174823
总的存储空间是605G, 邮件区占用84.8G 剩下的有491.6G 自由空间,属于全零区域,肯定没有邮件了,非自由空间和非邮件区的垃圾数据有28.6G
经过3次大的算法改进,以及中途无数的细节增删,至此,剩余的非自由空间和非邮件区经人工验证也已经无法找到新的邮件文件,只剩下一些邮件的中间碎片,无法进行拼接,以及一些杂乱数据,此结果经北亚数据恢复总监亲自审核。
示例如下,邮件中间碎片:
图六

垃圾数据:
图七

六.验证数据
验证数据分为两部分,一个是邮件数据量的验证,通过对几个已知账号的收件和发件数量的统计,大概估算一下邮件的回复比例。二是邮件正确性的验证,用FoxMail打开提取出的邮件,查看内容是否正常.几个账号的数量如下:
图八

一些邮件内容:
图九

图十

七.移交数据
配合客户将所有提取出的邮件迁移到263平台

时间: 2024-08-07 12:20:32

看了这篇文章,再也不用担心邮件被误删除了的相关文章

【区块链之技术实战】有了区块链做公益,再也不用担心我的捐款啦

在[区块链之技术实战]之前的部分内容里,咱们首先分享了来自银行业,金融证券业以及互联网金融业的"大佬"对于区块链实践场景的观点,之后的两篇文章分别分享了关于区块链技术在银行业.金融证券业的应用场景,让大家对于区块链的广泛的应用实践场景有了一定了了解和认识,而且在上一篇文章中咱们也为写代码的攻城狮和程序媛妹子们分享了比较不错的开源的区块链技术的相关项目,想必是码农们最爱的技术干货资源.而今天的这篇文章是[区块链之技术实战]部分的最后一篇,在这篇文章里,咱们来分享一个目前看来在区块链技术上

如果看了这篇文章你还不懂傅里叶变换,那就过来掐死我吧(下)

上一篇文章发出来之后,为了掐死我,大家真是很下工夫啊,有拿给姐姐看的,有拿给妹妹看的,还有拿给女朋友看的,就是为了听到一句"完全看不懂啊".幸亏我留了个心眼,不然就真的像标题配图那样了.我的文章题目是,如果看了这篇文章你"还"不懂就过来掐死我,潜台词就是在你学了,但是没学明白的情况下看了还是不懂,才过来掐死我. 另外,想跟很多人抱歉,因为评论太多了,时间有限,不能给每个人回复,还望大家谅解.但是很感谢一直在评论区帮忙解答读者问题的各位,就不一一@了. 这里郑重感谢大

支付宝将关闭这个功能,再也不用担心“被转账”了

本文讲的是支付宝将关闭这个功能,再也不用担心"被转账"了,2月14日,支付宝官方微博发布消息称,为了防止诈骗,从2月20日起,支付宝首页上的付款码将专码专用,只用于线下付款,不再具备线上转账收款功能. 也就是说,2月20日之后,在超市.商场.便利店等场景中使用如下付款码支付不会受影响. ▲支付宝付款码 但如果仍想使用二维码实现转账(比如非好友之间),只能通过扫描支付宝右上角"我要收款"的二维码进行操作. ▲收款码位置引导 支付宝付款码的转账功能被骗子盯上 支付宝的付

看了这篇文章怎么 怎么生气呢。。。。

问题描述 看了这篇文章怎么怎么生气呢....有同感的支持下.想骂作者....http://www.nb99.net/art.asp?id=1266 解决方案 解决方案二:把.netframework说的巨恶心!解决方案三:看那个人把Java吹的富丽堂黄的,他自己那开发出比Vista更好的系统来吗?解决方案四:这就是不懂乱吹解决方案五:顶解决方案六:这有什么好生气的?.NET不是给网吧机用的...Vista更不是给网吧机用的...至少在目前来看...因为他们的配置无法享受到快感只好发发牢骚...等

看了一篇文章,说天猫的商品详情页面是先存在本地,想请教这个想法的可行性

问题描述 我是初入行的实习生,比不了各位大牛,所以想请问一下,看了一篇文章,说天猫为了双十一,商品详情页这种访问量可以说是最大的类型页面,是先将页面框架保存在本地的,然后用户点开之后,请求数据时,将数据填充进去.我想了想,先用cookie保存现这种访问量超大的页面静态码html+js,然后ajax请求数据json,然后通过js动态绑定数据,感觉理论上好像可行,但是不知道具体实现是不是很难,还有这种做法对性能的提升和对服务器压力的影响有多大,望各位大牛指点一二 解决方案 解决方案二:文章的链接也共

有了Google Now 再也不用担心自己坐过站了

[TechWeb报道]在北京这样的城市,无论是你公知或是草根,公共交通都是最多人选择的出行工具,但在公交地铁上我们经常会由于起太早或者疲劳在车上睡着,或因为玩手机太过投入而坐过了站.近期国外用户就发现了Google Now具备的一项人性化功能,它将尽量帮你减少坐过站的情况.在公共交通工具上打开Google Now会出现一个闹钟,当我们开启这项功能,Google Now就可以在到达目的地之前提醒你.让你再也不用担心坐过站的囧况.Google Now是一款出色的应用,通过日常使用,它会全面了解你的各

国外通过3D打印技术设计微型装置,让我们再也不用担心用水安全

国外通过3D打印技术设计微型装置,让我们再也不用担心用水安全!据麦姆斯咨询报道,英属哥伦比亚大学-奥肯那根分校(UBC's Okanagan campus)的研究人员设计了一款3D打印微型装置,该装置可以实时监测饮用水质量并防止水传染病. Mina Hoorfar教授 该学校工程学院的院长Mina Hoorfar教授指出,此次研究表明,他们设计的小型化水质传感器制作成本便宜,可以连续操作,并部署在供水系统的任一节点. Hoorfar表示,"目前的水安全实践只包括定期的手动测试,这限制了采样频率,

看完这篇文章后,别再说自己不懂用户画像了

用户画像是一个挺新颖的词,最初它是大数据行业言必及之的时髦概念.现在我们运营谈及用户画像,它也是和精准营销.精细化运营直接钩挂的.这篇文章主要讲产品和运营角度的用户画像. 希望看完后,解决你一切关于用户画像的疑问. 什么是用户画像 用户画像一点也不神秘,它是根据用户在互联网留下的种种数据,主动或被动地收集,最后加工成一系列的标签.比如猜用户是男是女,哪里人,工资多少,有没有谈恋爱,喜欢什么,准备剁手购物吗? 我们常把用户标签和用户画像对等.但凡用户画像的文章,类似上文图片都会出现,有用烂的趋势.

DLL文件修复神器 再也不用担心DLL缺失了

1.打开DllFiles.comFixer之后切换到"安装dll文件"的标签.   2.在搜索框中输入缺少的dll文件名称.这里小编输入"Cryptui.dll"文件进行搜索. 3.点击搜索结果,直接进入下载并自动安装.(注意:该软件会自动安装到DLL文件缺失的目录中,所以不用担心安装路径会错误.)   4.此时进入安装进度中.   事实上DllFiles.comFixer除了安装dll文件之外,还能检查注册表.在"扫描注册表"标签下进行扫描,并