搜索服务中基于云计算的垃圾网页识别研究

搜索服务中基于云计算的垃圾网页识别研究

李艳平  徐雅斌  陈俊伊

为了快速、有效地对垃圾网页进行识别,提出了一种基于云计算平台的垃圾网页识别方案.在Hadoop分布式平台下构建一个基于页面内容和连接结构的支持向量机分类器,对垃圾网页进行识别,通过对数据进行分析.结果表明:垃圾网页的识别准确率较高,处理时间随着集群节点数的增加而明显减少.

关键词 搜索服务;垃圾网页识别;支持向量机;云计算;Hadoop;MapReduce

搜索服务中基于云计算的垃圾网页识别研究

时间: 2024-07-31 23:41:41

搜索服务中基于云计算的垃圾网页识别研究的相关文章

CDNs中基于云计算的资源分配控制器设计

CDNs中基于云计算的资源分配控制器设计 宋亭 陈立 基于云技术的自适应视频流分发网络,本文提出一种控制机制,并采取反馈控制技术,设计一种动态资源分配控制器,通过调节云技术CDN网络中的虚拟机数量,在向用户提供最高质量视频服务的同时,实现传输成本最小化.实验结果表明,本资源分配控制器大大降低了传输成本,提高了用户视频服务的质量. CDNs中基于云计算的资源分配控制器设计

安全管理平台中基于云计算的日志分析系统设计

安全管理平台中基于云计算的日志分析系统设计 陈洁 于永刚 刘明恒 潘盛合 徐克付 安全管理平台(SMP)是实现安全管理工作常态化运行的技术支撑平台,在实际应用中需要实时处理来自安全设备所产生的海量日志信息.为解决现有SMP 中海量日志查询效率低下的问题,设计基于云计算的SMP 日志存储分析系统.基于Hive 的任务转化模式,利用Hadoop 架构的分布式文件系统和MapReduce 并行编程模型,实现海量SMP 日志的有效存储与查询.实验结果表明,与基于关系数据的多表关联查询方法相比,该系统使得

基于云计算的远程诊断关键技术研究

基于云计算的远程诊断关键技术研究 郑州大学   朱朝鹏 本文针对云计算当中的分布式存储与并行计算技术进行研究.研究Hadoop平台上故障诊断数据的存储管理方案以及基于Map/Reduced的相关智能故障诊断算法的并行计算方式,为在Hadoop或其它云计算平台上开发远程诊断相关应用程序打下一定的基础.基于云计算的远程诊断系统具有灵活性.低成本.高效率等特点,在云计算环境中研究适合于设备远程诊断相关技术的解决方案,可以同时促进云计算以及设备故障诊断技术的进步. 基于云计算的远程诊断关键技术研究

基于云计算的病毒恶意软件分析研究

基于云计算的病毒恶意软件分析研究 南京航空航天大学  孟超 本文提出了基于云计算的动态行为分析方案,该方案利用云计算分布式计算的特点,在云计算多个虚拟机结点上并行的完成对病毒恶意软件多条执行路径的分析,对虚拟机中系统调用的监控发现病毒恶意软件在特定的条件下触发的恶意行为.采用PIF算法来形式化的描述可疑文件分析和报告返回的过程,对该算法的改进也同时提高了分析的效率,PIF算法是分布式算法特别适合在云计算环境中执行.实验结果表明,该模型能够检测出病毒恶意软件的条件触发行为,并且可以发现触发恶意行为

[文档]基于云计算的信令监测平台研究

基于云计算的信令监测平台研究 徐雷  张云勇  陆斌  蒋志刚  曹秋红 云计算的出现,使信令监测平台向整合统一方向发展,信令分析向海量数据挖掘方向发展.本文分析了现有信令监测平台的不足,论述了信令监测平台的发展趋势,并提出发展目标和平台架构,讨论了信令监测平台的关键技术. 关键词:信令监测平台 云计算 数据挖掘 temp_12061508236220.pdf

基于云计算的数据存储技术研究

基于云计算的数据存储技术研究 孙知信 黄涵霞 以云计算环境下大数据存储技术为研究对象,首先介绍了云计算环境下主要的两种典型的分布式存储系统,即Google的GFS 和Hadoop的HDFS:对其中的数据存储技术进行了专门分析,从可扩展性和延迟性(如何支持海量小文件的存储).容错性(在数据丢失时进行数据恢复)和海量数据存储的实时性这3个方面对现有技术进行了评价.在此基础上,提出了分布式文件系统的系统架构.最后给出了研究展望. 基于云计算的数据存储技术研究

基于云计算的信息服务通用模型研究

基于云计算的信息服务通用模型研究 王峰 王伟 概括了云计算技术的普遍特征,分析了云计算技术在信息服务业的典型应用案例及其局限性,继而针对性得提出了一种基于云计算的信息服务通用模型,并通过量化分析论证了该模型的可行性. 关键词: 云计算 信息服务 通用模型 基于云计算的信息服务通用模型研究

基于云计算的产学研协同合作研究

基于云计算的产学研协同合作研究

谷歌停止.kz域名搜索服务跳转谷歌哈语网页

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 据悉,谷歌俄罗斯分公司第一副总裁比尔·卡兰8日在自己的博客里透露,谷歌公司决定停止www.google.kz的搜索服务,放弃在哈萨克斯坦直接经营搜索引擎. 卡兰在博客里表示,哈萨克斯坦网络信息中心一个月前通知谷歌俄罗斯分公司,说根据哈萨克斯坦电信部的规定,所有以".kz"结尾的域名网站均必须将服务器等设备安置到哈萨克斯坦境