Linux下rar及zip压缩包中批量替换某文件脚本

本需求是自己负责的一个生产系统上,有大量以zip和rar结尾的压缩文件散落在文件系统的各个文件夹,先在需要把压缩包里包含某一个特定文件(如tftpd32.exe或Tftpd32.exe,版本较旧),全都替换成比较新的tftpd32.exe版本。压缩文件总数约5000个,需要替换的数量约1500个。

因为是生产环境,不敢轻易乱动,所以脚本考虑的因素就非常多,不允许中间执行过程出现异常,所以找到文件后实际执行替换操作之前做好备份,并且将操作过程记录日志。

以下几点需要考虑:

  • 分别处理zip和rar文件,为减低脚本的复杂程度,分作两个shell脚本。
  • rar在Linux下默认是没有安装解压缩工具,下载rarlinux-x64-5.2.0.tar.gz
  • zip包中文件含有中文文件名,unzip测试解压缩或列出内容时出现文件名乱码,原因是zip在压缩时不记录当时的编码格式。这个问题非常棘手,乱码打进压缩包是绝对不允许的,网上有几种解压办法有几种办法都不能很好的应对我的场景:并不需要实际解压zip文件,而只需使用 l ——列出文件列表、获取目录及文件名,d ——从压缩包中直接删除某个文件,a ——向压缩包添加一个文件。实际解压到文件系统上是不是乱码我们并不关心。
    最后的解决办法是使用p7zip工具,配合LANG变量解决。
  • 向压缩包里添加新文件时,要保持里面的目录结构,则必须在文件系统上存在同样的 相对目录/文件 。所以每次都要在脚本执行目录下创建临时目录tmp_dir,还要及时删除。但如果文件在压缩包的根目录下,这个临时目录就是当前脚本执行目录。
  • 有可能会存在一个压缩包中多个文件夹中包含不止一个tftpd32.exe文件。
  • 每个文件都有一个CRC值,处理文件名大小写不同但实质是同一个文件时有效。

以下脚本使用说明:

  • 变量说明

    • filelist 变量设定你所需要检查的压缩文件列表(绝对路径),可以通过find /your/dir/ -name *.rar | sort | uniq > testfile。与脚本在相同目录下
    • existlist 变量是从filelist文件中得到的包含特定文件的列表,脚本执行完后可以查看
    • errorlist 变量是从filelist文件列表中得到的不包含特定文件的列表,当然也有可能这个压缩文件本身不完整
    • filebak 变量指定要替换的那个压缩文件备份的目录
    • oldfile 指定要替换的那个文件名
    • newfile 指定新文件的文件名,注意这个文件一定要在脚本当前目录下
    • binrar,bin7z 指定解压缩命令目录,因为7zrar都不是CentOS自带的
    • fl 是filelist文件列表里的每一条记录
    • exist 压缩文件fl的内容列表里包含tftpd32.exe的记录,可能有多行
    • dirfiles 处理exist的结果,形如压缩包里的目录结构 your/dir/tftpd32.exe,可能有多行
    • df 是dirfiles中的单行记录,它的前面目录部分便是tmp_dir
  • 是否有必要root用户执行看个人情况,执行后部分文件的属主可能会变,可用chown user1.user1 -R /your/dir/恢复
  • 有部分zip文件无法使用7z,但文件本身正常,从日志可以看到error信息
  • tftpd32.exe区分大小写,如果要查找替换Tftpd32.exe请修改后在执行(确保grep没有-i选项)
  • 可以处理的情况
    • 压缩文件中无tftpd32.exe
    • 要替换的tftpd32.exe文件在压缩文件根目录下
    • 要替换的tftpd32.exe在嵌套子目录中
    • 压缩文件中存在多个tftpd32.exe
    • 压缩文件本身存在问题
  • 该脚本有一定的危险性(虽然已备份),在正式环境中运行之前一定要多做测试。并且运行一次之后,谨慎运行第二次,因为可能会导致备份被覆盖(可换备份目录)
  • 假如出现异常,要从备份文件恢复所有修改的文件,可以根据$existlistfilebak下的目录列表拼凑cp语句
  • 建议执行方法./rar_new.sh | tee your.log,事后可从your.log中查看日志

处理rar的脚本rar_new.sh:

#!/bin/bash

filelist="testfile"
# filelist="crm_rar.txt"
existlist="${filelist}.exist"
errorlist="${filelist}.not"
filebak="/crmbak/rarbak"
oldfile=tftpd32.exe
newfile=tftpd32.exe
binrar="/usr/bin/rar"

IFS=$'\n'

echo "files list bellow have ${oldfile}:" > $existlist
echo "files list bellow do not have ${oldfile} or may have error:" > $errorlist

for fl in `cat $filelist`
  do
    # ${oldfile} exist or not, file error or not
    exist=`$binrar l $fl |grep ${oldfile}`
    if [ $? -ne 0 ];then
       echo "$fl" >> $errorlist
       continue
    else
        # get extracting dir and filename, could be more than one file
       dirfiles=`echo "$exist" | awk '{for (i=5;i<=NF;i++) printf $i" " ; print ""}'`
    fi

#    echo "$exist"

    if [ "$dirfiles" != "" ];then
      echo "$fl" | tee -a $existlist
      # backup original file
      /bin/cp -af "$fl" "$filebak/"
      echo "--- $fl is backed up in $filebak"
      echo "    $dirfiles"

      for df in `echo "$dirfiles"`
        do
          # create temp directory to put new ${newfile} for compress
          tmp_dir=$( echo "$df" | awk -F '/' '{for(i=1;i<NF;i++) printf"%s/",$i} {print ""}' )
          if [ ${#tmp_dir} -ne 0 ];then
            mkdir -p "$tmp_dir" && cp -af ${newfile} "$tmp_dir"
          fi
          # start delete old file and add new one
          $binrar d "$fl" "$tmp_dir"${oldfile} && $binrar a "$fl" "$tmp_dir"${newfile}
          if [ $? -ne 0 ];then
            echo "--- rar file $fl may have error, you SHOULD check it"
          fi

          if [ ${#tmp_dir} -ne 0 ];then
            rm -f "$tmp_dir"${newfile} && rmdir -p "$tmp_dir"
            if [ $? -ne 0 ];then
              echo "--- tmp_dir $tmp_dir delete fail"
            fi
          fi
        done

      echo "--- old deleted, new added"
    fi

  done

处理zip的脚本zip_new.sh:

#!/bin/bash

# filelist="test_filelist"
filelist="crm_zip.txt"
existlist="${filelist}.exist"
errorlist="${filelist}.not"
filebak="/crmbak/zipbak"
oldfile=Tftpd32.exe
newfile=tftpd32.exe
bin7z="/usr/bin/7z"

export LANG="zh_CN.GB18030"
IFS=$'\n'

echo "files list bellow have ${oldfile}:" > $existlist
echo "files list bellow do not have ${oldfile} or may have error:" > $errorlist

for fl in `cat $filelist`
  do
    # ${oldfile} exist or not, file error or not
    exist=`$bin7z l $fl |grep ${oldfile}`
    if [ $? -ne 0 ];then
       echo "$fl" >> $errorlist
       continue
    else
        # get extracting dir and filename, could be more than one file
       dirfiles=`echo "$exist" | awk '{for (i=6;i<=NF;i++) printf $i" " ; print ""}'`
    fi

# echo ===== "$dirfiles"

    if [ "$dirfiles" != "" ];then
      echo "$fl" | tee -a $existlist
      # backup original file
      /bin/cp -af "$fl" "$filebak/"
      echo "--- $fl is backed up in $filebak"
      echo "    $dirfiles"

      for df in `echo "$dirfiles"`
        do
          # create temp directory to put new ${newfile} for compress
          tmp_dir=$( echo "$df" | awk -F '/' '{for(i=1;i<NF;i++) printf"%s/",$i} {print ""}' )
          if [ ${#tmp_dir} -ne 0 ];then
            mkdir -p "$tmp_dir" && cp -af ${newfile} "$tmp_dir"
          fi
          # start delete old file and add new one
          $bin7z d "$fl" "$tmp_dir"${oldfile} && $bin7z a "$fl" "$tmp_dir"${newfile}
          if [ $? -ne 0 ];then
            echo "--- zip file $fl may have error, you SHOULD check it"
          fi

          if [ ${#tmp_dir} -ne 0 ];then
            rm -f "$tmp_dir"${newfile} && rmdir -p "$tmp_dir"
            if [ $? -ne 0 ];then
              echo "--- tmp_dir $tmp_dir delete fail"
            fi
          fi
        done

      echo "--- old deleted, new added"
    fi

  done


时间: 2024-08-07 08:36:10

Linux下rar及zip压缩包中批量替换某文件脚本的相关文章

linux下rm命令删除文件名中包含特殊字符的文件【转】

转自:http://blog.itpub.net/143526/viewspace-1060083/ 1. 删除带"-"的文件名的方法 2. 删除包含其它特殊字符的文件 3. 删除系统打不出的乱码文件名 [@more@] 1. 删除带"-"的文件名的方法 大部分是由于误操作的原因,产生了一些 特殊字符的文件 如 -foo rm --help用法:rm [选项]... 目录...Remove (unlink) the FILE(s). -d, --directory 

解决Codeigniter不能上传rar和zip压缩包问题

 使用Codeigniter开发文件上传程序时,默认不支持rar和zip压缩包格式,这方面还有待完善.但是我们可以通过自己定义格式来解决这个问题 codeigniter在上传文件时对格式的限制是在application文件夹下config中的mimes.php文件中定义的.该文件默认不包含rar,而且对zip的定义不能上传压缩包.我们在类中,加入以下代码,即可解决这个问题:    代码如下:"zip" => array("application/x-zip",

技术-js可以可以直接读取zip压缩包中的内容吗?

问题描述 js可以可以直接读取zip压缩包中的内容吗? js可以可以直接读取zip压缩包中的内容吗? 如果可以,通过何种方式读取? 解决方案 js不能和本地文件系统交互,更不能读取zip中的内容. 解决方案二: 不能,你需要先在后台键zip或者rar压缩文件解压出来,如果是excel文档的话还要将excel文档解析完后再将数据传到前台页面中: 解压压缩包和解析excel文档的源码我上传(csdn)上去了,如果需要的话可以去下载下来就可以了. 解决方案三: js是不直接读取的,需要解压缩后再读取

解压zip压缩包中的指定文件(害死人的错误)

使用Java 解压zip压缩包中的指定文件时遇到了问题. 且听我细细道来: 主要方法如下: Java代码   public static byte[] getContent2(final ZipFile zipFile, final ZipEntry zipEntry)               throws IOException {           InputStream inputStream = zipFile.getInputStream(zipEntry);          

c#获取rar和zip压缩包里面内容

问题描述 c#获取rar和zip压缩包里面内容 怎么用c# winform获取rar和zip压缩包里面内容,或者获取指定文件名的文件完整路径,求代码 解决方案 调用 rar private string RunCmd(string command) { //实例一个Process类,启动一个独立进程 Process p = new Process(); p.StartInfo.FileName = "cmd.exe"; p.StartInfo.Arguments = "/c

python如何从zip压缩包内过滤出指后缀文件

问题描述 python如何从zip压缩包内过滤出指后缀文件 比如压缩包中有.jpg..txt..doc而我只想打印出.txt的文件列表,如何实现,初学pyhton还请有经验的朋友帮忙指导,我的简单代码如下: #coding = utf-8 -*- coding: cp936 -*- import os import fnmatch import zipfile def iterfindfiles(path, fnexp): for root, dirs, files in os.walk(pat

文件上传-不同机器压缩的zip压缩包,在上传文件解压后存在乱码,求帮忙分析分析

问题描述 不同机器压缩的zip压缩包,在上传文件解压后存在乱码,求帮忙分析分析 有的机器的压缩包上传解压后没问题,有的上传解压后有中文乱码,不知道这是不是跟操作系统有关系

linux下tomcat部署应用后如何通过url访问文件

问题描述 linux下tomcat部署应用后如何通过url访问文件 是这样的,我的tomcat是在linux的/opt/server/tomcat这个目录下,端口9080.tomcat里部署的应用有写文件的功能,将文件写在/opt/awr/这个目录下,文件是html格式,1.html.现在我想在tomcat启动后,在浏览器里输入url就访问到这个html文件,请问该怎么办

axis liunx 异常-axis接口部署到linux 下调用不了,但可以访问wsdl文件。 调用时候会报以下错误

问题描述 axis接口部署到linux 下调用不了,但可以访问wsdl文件. 调用时候会报以下错误 [cmall] DEBUG [http-bio-8080-exec-10] SimpleChain.invoke(86) | Exit: SimpleChain::invoke [cmall] DEBUG [http-bio-8080-exec-10] NetworkUtils.getLocalHostname(76) | Failed to lookup local IP address jav