搜狐微博有1千多个敏感词 每天屏蔽5千条微博

微博的兴起,使得人们多了一个畅所欲言的场所,
但是,一些人却在网上发帖卖假证,
有的甚至卖枪弹毒品,这些自然在被禁止之列。昨天,搜狐公司相关人士告诉记者,微博监控有1000多个敏感词,主要是涉枪、涉暴、涉黄等。  
上千敏感词监控网络安全目前,新浪、搜狐、网易、腾讯、人民网等各家网站均提供有微博,上微博发言被网民称为“织围脖”。但是,微博的
快速发展也出现了一些问题,一些涉黄、涉暴的内容也在微博上出现。搜狐网监控中心负责人王国欣告诉记者,包括微博、博客在内的网民互动式的互联网产品,文字帖一般采用1000多个敏感词进行过滤,如果其中含有敏感词的就直接删除。这些敏感词有1000多个,主要是涉枪、涉黄、涉暴的内容。“AK47可以说,但是教人怎么做炸药或者直接贩卖枪支弹药毒品的帖子
肯定要删除,绝大多数国家都不允许网上出现这种不健康不安全的内容。”据悉,微博被过滤掉的内容,绝大多数是涉黄,另外就是发帖做广告,或者是用语言攻击其
他人。“网络口水战的内容可以发出来,但是‘国骂’就不行了。”王国欣说,搜狐微博是24小时
都有人做过滤监控,微博每天出现的七八万个帖子,过滤掉的大约有5000多个。在搜狐社区每天出现的20多万个帖子中,有4万多个会被过滤掉。  图片过滤“软件+人工”除了文字要进行过滤监控,图片过滤也是互联网监控的一个重要内容。王国欣称,搜狐对网民在搜狐社区上传的图片采取软件自动过滤加人工审核的方法,搜狐使用的软件名为图片过滤器,能通过肤色、纹理、动作、人脸等多个参数,对图片进行要素的提取。“人的肤色介于红黄之间,当肤色大于一张图片面积的40%,图片就基本认定为情色图片,进入人工审核程序。”狮子的皮毛是黄颜色,这样的图片会不会直接过滤掉呢?对于这样的疑问,王国欣说,图片过滤的一个选项是纹理,通过软件可以发现狮子的边缘很杂乱,与人体图片的边缘不同,不会被过滤掉。记者在搜狐公司看到,一位负责网络监控的员工正在进行图片的人工审核。网民上传的照片按照每行5张、每屏40行的标准显示在电脑屏幕上。当发现照片有露点、挑逗动作内容时,他
就会在图片下面的方框内点一下,图片就不会上传到网上公开发表了。  妈妈评审团置顶过滤器文字和图片过滤,拿捏的火候很难掌握。昨天,搜狐举行“快乐假期,绿色家园”活动,10多位家长和儿童,以及搜狐社区的多位版主来到搜狐公司,现场交流“绿色网络”的建设。搜狐网副总编辑梁春元说,网络在删除一些不良信息的同时,也要保证正常网民不能受到伤害,对于正常的网上交流帖子不能删除,也不能人为耽误上传的时间。在网络扫黄中,北京网络媒体协会组建的妈妈评审团曾经引起社会关注。昨天,“妈妈评审团”成员之一冯云对这种图片过滤器软件很感兴趣。她
认为应该在各家网站大力推广这种软件过滤技术。同时,她希望网站能做出视频过滤器软件,对网上一些不良视频进行过滤。搜狐媒体副总裁于威说,自己是个两岁女儿的妈妈,搜狐网上的内容是否做到让女儿将来放心上网,现在还不敢说。北京网络媒体协会魏莞说,国内网民数量已经达4.3亿,其中三分之一左右是未成年人,媒体有责任提供健康绿色的内容。“搜狐的好经验值得在全行业进行推广。”(记者 贾中山)

时间: 2024-09-13 11:34:48

搜狐微博有1千多个敏感词 每天屏蔽5千条微博的相关文章

基于DFA敏感词查询的算法简析

文章版权由作者李晓晖和博客园共有,若转载请于明显处标明出处:http://www.cnblogs.com/naaoveGIS/ 1.背景 项目中需要对敏感词做一个过滤,首先有几个方案可以选择: a.直接将敏感词组织成String后,利用indexOf方法来查询. b.传统的敏感词入库后SQL查询. c.利用Lucene建立分词索引来查询. d.利用DFA算法来进行. 首先,项目收集到的敏感词有几千条,使用a方案肯定不行.其次,为了方便以后的扩展性尽量减少对数据库的依赖,所以放弃b方案.然后Luc

SEO从零开始第五章——新闻源与百度敏感词

  营销手段中包含了SEO,SEO是营销一部分如果想在SEO界有所成就那一定要学会网络营销手段,网络营销会了SEO自然就会了,因为SEO是根本网络营销而变的.2013年5月28日百度外链工具全新升级,我记得在SEO从零开始第2章节说过,快照全部停留在27号,28号百度肯定有动作,百度拒绝外链技术越来越成熟, 回到正题,最近很多灰色行业在大量收购百度新闻源来做百度敏感词语,先说说我自己理解的原理,先知道原理然后再推荐百度如何针对这些问题.目前主流获得敏感词语排名的方案企业,新闻源站劫持获取排名.百

php过滤敏感词实例代码

<?php  /**    * Created by JetBrains PhpStorm.    * User: lsl    * Date: 13-8-28    * Time: 下午2:58    * 敏感词过滤工具类    * 使用方法    * echo FilterTools::filterContent("你妈的我操一色狼杂种二山食物","*",DIR."config/word.txt",$GLOBALS["p_me

php过滤敏感词的示例

 这篇文章主要介绍了php过滤敏感词的示例,需要的朋友可以参考下  代码如下: $badword = array(     '张三','张三丰','张三丰田' ); $badword1 = array_combine($badword,array_fill(0,count($badword),'*')); $bb = '我今天开着张三丰田上班'; $str = strtr($bb, $badword1); echo $str;   代码如下: $hei=array( '中国', '日本' );

使用PHPWIND敏感词机制 使网站干干净净

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 大家好,我是衡水信息网的Vern,现在国家打击色情与低俗信息可堪称古往今来史上第一例.只要网站有色情或LUOGU或低俗信息,或着是说GONGDANG不好的全部被咔嚓了.闹的站长们是鸡犬不宁呀.所以我提醒站长们的是最好使用带有过感词过滤功能的程序.我的用是PHPWIND.也有站长会问,PHPWIND是论坛.我们做的是信息站或文章类的站.无法去使

谈谈敏感词和非法网址过滤的重要性

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 生活在当今的网络时代的个人站长真的是不容易,做个网站,担心的事情真是太多.黑客.挂马.网络攻击.服务器故障.数据丢失,好容易服务器稳定了,为了提高流量赚点广告费,又处心积虑的给网站做优化.推广.seo,费尽千辛万苦,绞尽脑汁.费尽千辛万苦流量有了起色,网警和管局又来了,说你有非法信息,断网.关站.整改.罚款. 个人站长真是太不容易,最近我的&

c++-ACM编程题,找出敏感词串,并删除,要求时间和空间效率很高,我写的程序通不过,

问题描述 ACM编程题,找出敏感词串,并删除,要求时间和空间效率很高,我写的程序通不过, Censorfrog is now a editor to censor so-called sensitive words (敏感词). She has a long text p. Her job is relatively simple -- just to find the first occurence of sensitive word w and remove it. frog repeats

淘宝发布“关于集市店铺名含敏感词的整改通知”

淘宝日前http://www.aliyun.com/zixun/aggregation/549.html">发布"关于集市店铺名含敏感词的整改通知",个人认证店铺名称不得包含让用户混淆的词汇,例如特许经营.总经销.总代理.加盟等;此外还明确指出,"旗舰"与"专卖"是天猫特有词.10月份,淘宝将对含有此类词汇的个人认证店铺进行关键词的剔除. 淘宝通知如下: 据工商总局规范网络店铺名称专项整治的通知精神,结合淘宝平台的实际情况,淘宝网

敏感词过滤-cocos2dx如何过滤敏感词

问题描述 cocos2dx如何过滤敏感词 cocos2dx如何过滤敏感词,用正则表达式移植出现问题,用树形的不懂得写,求大神帮助 解决方案 http://hellohank.iteye.com/blog/1327903 解决方案二: cocos2dx-屏幕设置