数据清理的遗留问题处理(二)

之前尝试了历史数据的清理，在逻辑层面清除了数据，可以参见 http://blog.itpub.net/23718752/viewspace-1814000/
但是从物理层面来看，数据文件还是那么大，空间还是没有释放掉。
从计划的500多G数据空间清理到了90G
SEGMENT_TYPE          SIZE_MB
------------------ ----------
INDEX PARTITION        260279
TABLE PARTITION        294120
然后在经过一番清理之后，对应的段空间一下子就将下来了。
EGMENT_TYPE          SIZE_MB
------------------ ----------
INDEX PARTITION         31823
TABLE PARTITION         47218

最后全部清理完
check segement size summary from year xxx
no rows selected

现在问题来了。清理数据文件该怎么做。思路应该是在dba_segments里面去找是否存在相应的段。如果没有即代表着可以删除这些数据文件。
有的朋友可能会说为什么一定要清掉这些数据文件，这个也有历史原因，就是表空间和时间也有关系，比如某年的某月可能就会根据逻辑生成一个表空间，按照这种思路，尽管我清除了端数据，但是放着那些数据文件，它们是不会被使用到的，还是占着地方，所以需要直接清掉，给后续的数据留空间。
目前想达到的效果就是，根据表空间能够查出来，如果某个表空间没有对应的段对象，显示为0，标志着可以清理。
select tablespace_name,count(*) from dba_segments where tablespace_name in ('xxxxx','xxx') group by tablespace_name;
xxxxx 0
xxx 0
但是实际上去写的时候发现还是没那么好弄，经过一番折腾写出了一个基本实现要求的语句，但是算是一个初始版本，因为结果显示还是有些牵强。
select tablespace_name,count(*)cnt from dba_segments where tablespace_name like '%DATA%2012%' group by tablespace_name
union
select tablespace_name,null cnt from dba_segments where tablespace_name like '%DATA%2012%' group by tablespace_name

TABLESPACE_NAME                       CNT
------------------------------ ----------
SERLOG_DATA_20120705                  0
SERLOG_DATA_20120705                 11
SERLOG_DATA_20120706                  0
SERLOG_DATA_20120706                 19
SERLOG_DATA_20121007                  0
SERLOG_DATA_20121007                 31
SERLOG_DATA_20121008                  0
SERLOG_DATA_20121010              0
按照这个情况，只有表空间SERLOG_DATA_20121010是可以删除的。其他的都会和一个dummy列并存。
当然sql写成这样也是醉了，能实现基本需求也行，但是成百上千的表空间，我觉得还是不好。继续改进。使用了minus的方式。
select tablespace_name from dba_tablespaces s1 where tablespace_name like '%DATA%2012%'
minus
select tablespace_name from dba_segments s1 where tablespace_name like '%DATA%2012%' group by s1.tablespace_name

这种方式就会做一个减法，先把相关的表空间罗列出来，然后在dba_segements里面过滤组合只会显示有段对象的表空间。
这样那些隐藏着的表空间都会一一罗列出来。
直接使用drop tablespace来清理。
查看asm磁盘空间，清理前剩余80多G
GROUP_NUMBER NAME                              FREE_MB   TOTAL_MB
------------ ------------------------------ ---------- ----------
           1 ARCH                               204740     204800
           2 DATA                                84336    6383104
清除多余的数据文件，可以看到立马剩出了快400G.
GROUP_NUMBER NAME                    FREE_MB   TOTAL_MB
------------ -------------------- ---------- ----------
           1 ARCH                     204740     204800
           2 DATA                     390360    6383104
这个时候别被这些成绩所迷惑，删除分区的同时会清楚分区索引，这些分区索引的空间又是不少。至于有多少呢，我们还是使用minus的方式来清理。
清除多余的索引数据文件，清理之后剩余了近1T的空间。
GROUP_NUMBER NAME                    FREE_MB   TOTAL_MB
------------ -------------------- ---------- ----------
           1 ARCH                     203906     204800
           2 DATA                     981640    6383104
这个例子不是说明minus清理有多好，是想说清理的时候，逻辑清理100%完成，物理清理很可能会漏掉，清理了不到50%,这样我们的工作就不彻底，半途而废。

时间： 2024-09-24 06:36:44

数据清理的遗留问题处理(二)

数据清理的遗留问题处理(二)的相关文章

数据清理的遗留问题处理

介绍一款数据清理，数据重构软件--TIBCO CLARITY

java实现数据备份和数据清理

CYQ.Data 轻量数据层之路使用篇二曲 MAction 数据查询(十三)

大数据清理软件公司Trifacta融资3500万美元

MySQL数据清理的需求分析和改进

一个60亿数据表改分区表+数据清理的改进思路

Spark Streaming 数据清理机制

CYQ.Data 轻量数据层之路应用示例二在线聊天(六)