php正则去除网页中所有的html,js,css,注释的实现方法

如下所示:

$search = array ("'<script[^>]*?>.*?</script>'si", // 去掉 javascript "'<style[^>]*?>.*?</style>'si", // 去掉 css "'<[/!]*?[^<>]*?>'si", // 去掉 HTML 标记 "'<!--[/!]*?[^<>]*?>'si", // 去掉 注释 标记 "'([rn])[s]+'", // 去掉空白字符 "'&(quot|#34);'i", // 替换 HTML 实体 "'&(amp|#38);'i", "'&(lt|#60);'i", "'&(gt|#62);'i", "'&(nbsp|#160);'i", "'&(iexcl|#161);'i", "'&(cent|#162);'i", "'&(pound|#163);'i", "'&(copy|#169);'i", "'&#(d+);'e"); // 作为 PHP 代码运行 $replace = array ("", "", "", "", "\1", "\"", "&", "<", ">", " ", chr(161), chr(162), chr(163), chr(169), "chr(\1)"); //$document为需要处理字符串,如果来源为文件可以$document = file_get_contents($filename); $out = preg_replace($search, $replace, $document);

也可以使用php的内置函数strip_tags()清除html,js,注释等标记

以上就是小编为大家带来的php正则去除网页中所有的html,js,css,注释的实现方法全部内容了,希望大家多多支持脚本之家~

时间: 2024-10-07 09:02:40

php正则去除网页中所有的html,js,css,注释的实现方法的相关文章

php正则去除网页中所有的html,js,css,注释的实现方法_php实例

如下所示: $search = array ("'<script[^>]*?>.*?</script>'si", // 去掉 javascript "'<style[^>]*?>.*?</style>'si", // 去掉 css "'<[/!]*?[^<>]*?>'si", // 去掉 HTML 标记 "'<!--[/!]*?[^<>

java正则去除字符中img标签src值为空的数据

问题描述 java正则去除字符中img标签src值为空的数据 获取一个字符串,其实就是HTMLEncode过来的HTML数据,有一个img标签,但是src属性为空,怎么正则将该img标签去除掉? 解决方案 用jquery对img标签进行遍历,,取到src属性后进行判断,,为""或null的删除

写了ocx控件 在网页中调用显示 对象不支持此属性或方法

问题描述 写了ocx控件 在网页中调用显示 对象不支持此属性或方法 我用的是 vs2010 用模版自动生成的只加了一个方法,然后自己写了一个vbs脚本调用这个方法正常,用的是控件名创建的对象.在网页中控件也创建成功的用的是classid方式创建的,但是调用这个方法就是提示对象不支持此属性或方法.我用activex control test 工具测试一切正常,也能看到这个方法,但是一到网页中就提示对象不支持此属性或方法 麻烦大家帮忙分析分析(我是初学者) 解决方案 应该是浏览器安全性阻止了控件的加

关键字-搜索网页中的内容html+js

问题描述 搜索网页中的内容html+js 用js实现,按照输入的搜索关键字,筛选网页当中的内容.网页上主要是新闻链接.只显示包含关键字的新闻链接.然后在别的网页搜索的时候,如果选择搜索新闻,也会跳转到这个网页,然后执行新闻的筛选. 解决方案 获取页面上的所有a对象变量innerHTML属性是否包含你的关键字,包含就显示,不包含隐藏.不知道你的新闻链接怎么导入页面的,如果是iframe框架别人的网页跨域了是获取不到链接对象的 <a href="#">关键字1</a>

c++-Activex如何在网页中插入一段Js

问题描述 Activex如何在网页中插入一段Js 基于ATL模板,如何插入JS.下面是已经写的部分代码,在这基础上怎么加呢? CComPtr isp; CComPtr ppBrowser; CComPtr pDispDoc; CComPtr pDocument2; HRESULT hr = S_OK; DISPID dispid; CComVariant avarParams[1]; avarParams[0].vt = VT_UI1; DISPPARAMS dispparams = {avar

Yii2中使用asset压缩js,css文件的方法_php实例

官网文档 http://www.yiiframework.com/doc-2.0/guide-structure-assets.html yii目录下运行 asset/template assets.php 生成assets.php,这是一个配置模板,并修改如下 <?php /** * Configuration file for the "yii asset" console command. */ // In the console environment, some pat

Yii2中使用asset压缩js,css文件的方法

官网文档 http://www.yiiframework.com/doc-2.0/guide-structure-assets.html yii目录下运行 asset/template assets.php 生成assets.php,这是一个配置模板,并修改如下 <?php /** * Configuration file for the "yii asset" console command. */ // In the console environment, some pat

利用IE10的跟踪保护功能过滤去除网页中广告

说到在网页中展示广告,小编觉得这个事情不是不好.但是为什么要写这么一篇教学呢?小编能接受网页广告,前提是只要不影响网页的正常浏览即可.但现在不少网站展示的广告已经远远超出我们的忍受范围了,左右漂浮.弹窗就算了,点击网页链接的时候还得先弹出一个广告页面,然后在点一次才能打开你想查看网页.这种强迫式的广告严重影响了体验,因此才会写了这篇教学. 要过滤网页中的广告,我们无需安装任何插件,只需开启IE10浏览器自带的跟踪保护功能即可(同时也适用于IE9). 另外,该功能的本意其实并非用来过滤广告,只是帮

IE10浏览器怎么过滤去除网页中广告

要过滤网页中的广告,我们无需安装任何插件,只需开启IE10浏览器自带的跟踪保护功能即可(同时也适用于IE9). 另外,该功能的本意其实并非用来过滤广告,只是帮助使用者杜绝第三方网站的跟踪行为而已.但这同时也表示该功能能够拦截网站所投放的第三方广告代码,以下小编就以最简单的方式来叙述如何使用IE10的跟踪保护来去除网页上的广告. 我们先在看看使用跟踪保护功能过滤广告的效果,某网页过滤前的广告情况: 过滤去除广告后,网页干净了很多: 设置方法 1.点击IE10右上角的齿轮图标,再依序点击"安全&qu