谈谈敏感词和非法网址过滤的重要性

  生活在当今的网络时代的个人站长真的是不容易,做个网站,担心的事情真是太多。黑客、挂马、网络攻击、服务器故障、数据丢失,好容易服务器稳定了,为了提高流量赚点广告费,又处心积虑的给网站做优化、推广、seo,费尽千辛万苦,绞尽脑汁。费尽千辛万苦流量有了起色,网警和管局又来了,说你有非法信息,断网、关站、整改、罚款。

  个人站长真是太不容易,最近我的“收多多”被封了,当初是想把它做成一个网络收藏夹,被封也是因为这个,原因是有人用它收藏了不良信息,收藏的信息先是被搜索引擎收录,继而被网警查到,于是顺藤摸瓜就找到了我的网站。管局和机房也不管你那么多,什么托管协议全是一纸空文,说拔网线就拔网线,让你进去维护你都得感恩戴德谢天谢地。

  好容易通融打点进去删了不良信息,网站被关禁闭后得以重新开放。那就要吃一堑长一智,在社会主义初级阶段,在当今中国的网络管理体制下,看来想要活着,就必须对不良信息做好提前预防,对于那些利用网站收藏不良信息的用户,虽然给网站带来了流量,可是也只能很无奈的说不。

  症结找到,就要开始制定安全策略,首先是敏感词过滤机制的建立,这个并不难,到网上找来一堆敏感词,放到一个数组里面,在用户提交信息的时候遍历数组,若数组中的敏感词在用户提交的信息也存在的话,则拒绝收录用户信息。即使更新和丰富敏感词数组,很容易的就把敏感词封锁掉了,我甚至连“mm”都加为敏感词,唉,这也是没办法啊。

  可有些人就不用敏感词了,把“A片”换成“B片”、”C片”、“M片”逃避你的过滤,这真是一个令人头大的问题,总不能把所有字符的组合都设定为敏感词吧。于是我想到了网址,因为收藏的部分是由标题和网址组成,标题可以千变万化,但网址总是不能变的。于是又建立网址的过滤机制,这个只能用笨办法,人肉审核。这可是需要定力的,因为你面对诸多有色网站却还要有一颗事业心,HOHO,自持,自持吧~~。

  把所有见到的非法网址,提取域名,加入黑名单,同样像敏感词一样的过滤机制,如果用户提交的内容中含有可疑网址,则拒绝收录。然后继续人工审核,逐步发现和丰富非法网址,我就不信这世界上非法网址的发现速度比我的封杀速度还快。

  最终,我的“收多多”又恢复了和谐安详。人有七情六欲,谁也不是圣人,可是当今世界,个人站长真的是很无奈,只对那些收了不该收的网址被K了的用户说声抱歉,不是我拒绝你,而是他们不让我接纳你。

  欢迎同类站长交流经验,我的”收多多”网络收藏夹地址:http://shoudd.com

时间: 2024-11-08 19:20:50

谈谈敏感词和非法网址过滤的重要性的相关文章

php过滤敏感词实例代码

<?php  /**    * Created by JetBrains PhpStorm.    * User: lsl    * Date: 13-8-28    * Time: 下午2:58    * 敏感词过滤工具类    * 使用方法    * echo FilterTools::filterContent("你妈的我操一色狼杂种二山食物","*",DIR."config/word.txt",$GLOBALS["p_me

php过滤敏感词的示例

 这篇文章主要介绍了php过滤敏感词的示例,需要的朋友可以参考下  代码如下: $badword = array(     '张三','张三丰','张三丰田' ); $badword1 = array_combine($badword,array_fill(0,count($badword),'*')); $bb = '我今天开着张三丰田上班'; $str = strtr($bb, $badword1); echo $str;   代码如下: $hei=array( '中国', '日本' );

敏感词过滤-cocos2dx如何过滤敏感词

问题描述 cocos2dx如何过滤敏感词 cocos2dx如何过滤敏感词,用正则表达式移植出现问题,用树形的不懂得写,求大神帮助 解决方案 http://hellohank.iteye.com/blog/1327903 解决方案二: cocos2dx-屏幕设置

php 敏感词过滤高级版

只要用户可以发言的地方,就可能出现广告或者其他敏感词,因此必须加入敏感词过滤机制来保持站点的"纯洁". 过滤机制:加入php关键字正则匹配 //$str 为用户数据 function wordFilter($str) {        /*     获取敏感词列表     敏感词的存储方法:     1:存储在txt文件中(一般的方法)     2:存储在缓存(比较好的方法)     我是存储在memcachd中.     */     $words = getSensitiveWor

Java实现敏感词过滤(转)

敏感词.文字过滤是一个网站必不可少的功能,如何设计一个好的.高效的过滤算法是非常有必要的.前段时间我一个朋友(马上毕业,接触编程不久)要我帮他看一个文字过滤的东西,它说检索效率非常慢.我把它程序拿过来一看,整个过程如下:读取敏感词库.如果HashSet集合中,获取页面上传文字,然后进行匹配.我就想这个过程肯定是非常慢的.对于他这个没有接触的人来说我想也只能想到这个,更高级点就是正则表达式.但是非常遗憾,这两种方法都是不可行的.当然,在我意识里没有我也没有认知到那个算法可以解决问题,但是Googl

DFA算法 及java版本实现敏感词过滤

DFA应用于检测敏感词,说到底就是建立了以敏感词为基础的许多敏感词树. 敏感词.文字过滤是一个网站必不可少的功能,如何设计一个好的.高效的过滤算法是非常有必要的.前段时间我一个朋友(马上毕业,接触编程不久)要我帮他看一个文字过滤的东西,它说检索效率非常慢.我把它程序拿过来一看,整个过程如下:读取敏感词库.如果HashSet集合中,获取页面上传文字,然后进行匹配.我就想这个过程肯定是非常慢的.对于他这个没有接触的人来说我想也只能想到这个,更高级点就是正则表达式.但是非常遗憾,这两种方法都是不可行的

使用PHPWIND敏感词机制 使网站干干净净

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 大家好,我是衡水信息网的Vern,现在国家打击色情与低俗信息可堪称古往今来史上第一例.只要网站有色情或LUOGU或低俗信息,或着是说GONGDANG不好的全部被咔嚓了.闹的站长们是鸡犬不宁呀.所以我提醒站长们的是最好使用带有过感词过滤功能的程序.我的用是PHPWIND.也有站长会问,PHPWIND是论坛.我们做的是信息站或文章类的站.无法去使

搜狐微博有1千多个敏感词 每天屏蔽5千条微博

微博的兴起,使得人们多了一个畅所欲言的场所, 但是,一些人却在网上发帖卖假证, 有的甚至卖枪弹毒品,这些自然在被禁止之列.昨天,搜狐公司相关人士告诉记者,微博监控有1000多个敏感词,主要是涉枪.涉暴.涉黄等. 上千敏感词监控网络安全目前,新浪.搜狐.网易.腾讯.人民网等各家网站均提供有微博,上微博发言被网民称为"织围脖".但是,微博的 快速发展也出现了一些问题,一些涉黄.涉暴的内容也在微博上出现.搜狐网监控中心负责人王国欣告诉记者,包括微博.博客在内的网民互动式的互联网产品,文字帖一

浅谈用户体验之“不明确的敏感词”

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 相信对于网站来说"不明确的敏感词"的出现并不陌生,很多站长为了管理常常启用的敏感词过滤,还有就是商家也进行了敏感词过滤,严重的商家出现敏感词之后连网站都无法打开,对于站长来说,当用户提交文章时也出现敏感词无法提交时,用户会怎么做呢!下面从用户角度分享作为站长启用敏感词过滤与商家敏感词过滤降低用户体验的后果. 首先是商家启用