最全的用正则批量去除Teleport Pro整站下载文件冗余代码

tppabs 

html原文件中tppabs标记是Teleport Pro软件留下的标记。该软件是离线浏览器,下载完整个网页后,它会在图片或超级链接标签内插入tppabs标签,以记录该图片或超级链接指向的原始地址。因为这个标签不是合法标签,所以普通浏览器会忽略它。但可以通过element.getAttribute("tppabs")在JS中读取这个属性。

如我们手动清除的话,那将是一个无法估计的工作量,需要批量清除。利用DreamWeaver正则表达式批量清除tppabs标签更加容易、快捷。

方法如下:

使用DW替换功能:
查找范围:整个当前本地站点
搜索:源代码
查找:\btppabs="h[^"]*"
替换:(为空)
勾选:使用正则表达式
点替换全部按钮即可

匹配javascript代码:
<a href="javascript: if(confirm('http://www.xxx.com \n\n文件并未依 Teleport Pro 取回,因为服务器报告错误导致无法读取。 \n\n你要从服务器上打开它吗?'))window.location='http: //www.xxx.com'" >

方法如下:
查找范围:整个当前本地站点
搜索:源代码
查找:href="javascript:if\(confirm\('htt[^"]*"
替换:href=www.xxx.com
勾选:使用正则表达式
点替换全部按钮

注:如果该表达式中含有不同的网址,可使用if\(confirm\('htt[^"]*\)(注意其他代码是否使用此类语法表达)匹配不带网址的部分,替换成空。

css文件有一些类似/*tpa=http://www.xxx.com/test.gif*/代码

方法如下:
查找范围:整个当前本地站点
搜索:源代码
查找:\/\*tpa=http://[^\s]*\/
替换:空
勾选:使用正则表达式
点替换全部按钮

字符 匹配 示例 ^ 输入或行的起始部分。 ^T 匹配“This good earth”中的“T”,但不匹配“Uncle Tom's Cabin”中的“T”。 $ 输入或行的结尾部分。 h$ 匹配“teach”中的“h”,但是不匹配“teacher”中的“h” * 0 个或多个前置字符。 um* 匹配“rum”中的“um”、“yummy”中的“umm”以及“huge”中的“u” + 1 个或多个前置字符。 um+ 匹配“rum”中的“um”和“yummy”中的“umm”,但在“huge”中没有任何匹配项 ? 前置字符最多出现一次(即,指示前置字符是可选的)。 st?on 匹配“Johnson”中的“son”和“Johnston”中的“ston”,但在“Appleton”和“tension”中没有任何匹配项 . 除换行符外的任何单字符。 .an 匹配短语“bran muffins can be tasty”中的“ran”和“can” x|y x 或 y。 FF0000|0000FF 匹配 bgcolor=”#FF0000” 中的“FF0000”和 font color=”#0000FF” 中的“0000FF” {n} 恰好 n 个前置字符。 o{2} 匹配“loom”中的“oo”和“mooooo”中的前两个“o”,但在“money”中没有任何匹配项 {n,m} 至少 n 个、至多 m 个前置字符。 F{2,4} 匹配“#FF0000”中的“FF”和“#FFFFFF”中的前四个“F” [abc] 用括号括起来的字符中的任何一个字符。用连字符指定某一范围的字符(例如, [a-f] 等效于 [abcdef])。 [e-g] 匹配“bed”中的“e”、“folly”中的“f”和“guard”中的“g” [^abc] 未在括号中括起来的任何字符。用连字符指定某一范围的字符(例如,[^a-f] 等效于[^abcdef])。 [^aeiou] 最初匹配“orange”中“r”、“book”中的“b”和“eek!”中的“k” \b 词边界(例如空格或回车符)。 \bb 匹配“book”中的“b”,但在“goober”和“snob”中没有任何匹配项 \B 词边界之外的任何内容。 \Bb 匹配“goober”中的“b”,但在“book”中没有任何匹配项 \d 任何数字字符。等效于 [0-9]。 \d 匹配“C3PO”中的“3”和“apartment 2G”中的“2” \D 任何非数字字符。等效于 [^0-9]。 \D 匹配“900S”中的“S”和“Q45”中的“Q” \f 换页符。

\n 换行符。

\r 回车符。

\s 任何单个空白字符,包括空格、制表符、换页符或换行符。 \sbook 匹配“blue book”中的“book”,但在“notebook”中没有任何匹配项 \S 任何单个非空白字符。 \Sbook 匹配“notebook”中的“book”,但在“blue book”中没有任何匹配项 \t 制表符。

\w 任何字母数字字符,包括下划线。等效于 [A-Za-z0-9_]。 b\w* 匹配“the barking dog”中的“barking”以及“the big black dog”中的“big”和“black” \W 任何非字母数字字符。等效于 [^A-Za-z0-9_]。 \W 匹配“Jake&Mattie”中的

时间: 2024-10-03 01:52:48

最全的用正则批量去除Teleport Pro整站下载文件冗余代码的相关文章

最全的用正则批量去除Teleport Pro整站下载文件冗余代码_正则表达式

tppabs html原文件中tppabs标记是Teleport Pro软件留下的标记.该软件是离线浏览器,下载完整个网页后,它会在图片或超级链接标签内插入tppabs标签,以记录该图片或超级链接指向的原始地址.因为这个标签不是合法标签,所以普通浏览器会忽略它.但可以通过element.getAttribute("tppabs")在JS中读取这个属性. 如我们手动清除的话,那将是一个无法估计的工作量,需要批量清除.利用DreamWeaver正则表达式批量清除tppabs标签更加容易.快

批量去除Teleport Pro整站下载文件冗余代码

teleport pro tppabs标签批量删除 teleport pro tppabs标签批量删除 使 用Teleport Pro下载的网页代码中包含了很多垃圾代码,比如下载的html网页代码中会出现tppabs标签,而且还会将所有的href标签中加入了很多垃圾代码, 在css会加入了tpa标签,这些都是冗余代码,可以将其全部删除,但是由于代码太多,我们不可能一个个删除,因此可以使用Dreamweaver的查找 /替换工具中的正则表达式来进行替换.1.替换tppabs标签,使用Dreamwe

网页-怎么解决网站被人用整站下载工具下载全静态代码的问题?

问题描述 怎么解决网站被人用整站下载工具下载全静态代码的问题? 怎么解决网站被人用整站下载工具下载全静态代码的问题?怎么保护代码呢?或者说像百度一样混乱代码,但是不好维护呀 解决方案 判断ip地址请求频率,过去直接干掉这个ip或者要输入验证码后才能继续访问

整站下载工具Teleport Ultra V1.41简体中文绿色特别版下载_常用工具

Teleport Ultra 所能做的,不仅仅是离线浏览某个网页 (让你离线快速浏览某个网页的内容当然是它的一项重要功能),它可以从 Internet 的任何地方抓回你想要的任何文件,它可以在你指定的时间自动登录到你指定的网站下载你指定的内容,你还可以用它来创建某个网站的完整的镜象,作为创建你自己的网站的参考. 如果你也和我一样,曾想把整个网页抓回来慢慢欣赏,如果你也曾像我一样,费尽千辛万苦只为了重复抓取同一网站的文件而做一些机械性的动作,Teleport Ultra 简直是我们的救星!它可以迅

PHP批量去除BOM头代码分享

        这篇文章主要介绍了PHP批量去除BOM头代码分享,本文直接给出实现代码,代码比较简单,容易看懂,需要的朋友可以参考下     ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 <?php /** * 去除bom头信息 */ header("Content-Ty

批量去除PHP文件中bom的PHP代码_php实例

需要去除BOM,就把附件里的tool.php文件放到目标目录,然后在浏览器访问tool.php即可! 复制代码 代码如下: <?php //此文件用于快速测试UTF8编码的文件是不是加了BOM,并可自动移除 $basedir="."; //修改此行为需要检测的目录,点表示当前目录 $auto=1; //是否自动移除发现的BOM信息.1为是,0为否. //以下不用改动 if ($dh = opendir($basedir)) { while (($file = readdir($d

BAT批量去除文件首行以及批量合并文件脚本_DOS/BAT

bat批量去除文件首行 复制代码 代码如下: set n=1 :starline for %%j in (*.txt) do ( :3 if exist D:\work\test\new_%n%.txt (set /a n+=1&goto 3) set file=%n%.txt for /f "skip=1 delims=" %%i in ('type "%file%"') do ( echo %%i >>D:\work\test\new_%n%

PHP批量去除BOM头内容信息代码_php实例

什么是bom头? 在utf-8编码文件中BOM在文件头部,占用三个字节,用来标示该文件属于utf-8编码,现在已经有很多软件识别bom头,但是还有些不能识别bom头,比如PHP就不能识别bom头,这也是用记事本编辑utf-8编码后执行就会出错的原因了. 批量去除bom头代码如下所示: <?php if (isset($_GET['dir'])){ //设置文件目录 $basedir=$_GET['dir']; }else{ $basedir = '.'; } $auto = 1; checkdi

PHP批量去除BOM头代码分享_php实例

<?php /** * 去除bom头信息 */ header("Content-Type:text/html; charset=utf-8"); $auto = 1; checkdir("D:\wamp\www\sales"); function checkdir($basedir){ if ($dh = opendir($basedir)) { while (($file = readdir($dh)) !== false) { if ($file != '