网络 搜索引擎与智能代理技术

搜索引擎|网络

互联网在全球范围内的迅速发展与成熟,促使社会各领域信息飞速膨胀,为人们查找、获取

有用信息提供了丰富的信息源,但也给信息的准确定位提出了挑战。提供网上资源的检索是

网络信息服务的重要内容之一,加之现代人也对信息把握的正确性和全面性提出了越来越高

的要求,因此,当务之急是开发性能优越的网络信息检索工具。

1993年,第一批搜索引擎诞生后,发展至今已经逐渐走向成熟,伴随着计算机智能化研究的

不断发展,具有适应性和学习性特征的智能代理技术也正从试验阶段过渡到实际应用。目前

,搜索引擎(search engine)与智能代理(intelligent agent)已经成为网络信息搜索的关键

技术与核心思想。

1 搜索引擎技术的发展现状

1.1 搜索引擎技术

目前,网络信息检索技术最主要的是搜索引擎技术,搜索引擎实际上是一个专用的WWW服务

器,也可以说是因特网上的一类网站,这类网站与一般的网站不同,其主要工作是收集网络

上成千上万的网站和网页信息,组成庞大的索引数据库。使用优秀的搜索引擎可以达到事半

功倍的效果。目前网络上大约有3000多种搜索引擎,我们较为熟悉的提供中文搜索引擎的站

点有sina、sohu、 Yahoo、netease和中文Excite等。

一般来说,搜索引擎主要采取两种方式实现对网络信息资源的检索,一是采用分类主题目录

形式,将网站进行树状的分类,所链接的网站必须至少归属于其中一个类别,形成类似图书

馆目录一样的分类主题目录,用户通过逐级浏览这些目录来找寻自己需要的内容,采用这种

检索方式的搜索引擎有Yahoo、sohu等,由于使用了专家进行归纳和分类,为信息导航带来

了极大的方便,但这种方式在分类和目录整理中需要大量的人力;二是使用关键词匹配方式

,其处理对象主要是文本,它能够对大量文档建立由字(词)到文档的索引库,在此基础上,

用户使用关键词对网页进行搜索时,系统将会显示含有该检索用词的所有网站、网页和新闻

等匹配信息。关键词检索能解决对网页细节的检索问题,只要用户输入关键词,系统通过蜘

蛛机器人自动在选定的范围内进行检索,并将所检索到的信息自动标引导入索引数据库中,

匹配所检范围中的网页,就能得到检索结果。

1.2 搜索引擎使用的信息检索技术及其不足

目前搜索引擎使用的信息检索技术主要有:Robot技术、索引技术、翻译技术、转换技术、过滤技术、数据库技术、结果处理技术等。搜索引擎的最大优点是:信息的覆盖面较大,信息

新颖,而且对搜索结果的相关性排列上,搜索引擎将其认为相关性高的检索结果排列在前。
但由于搜索引擎使用的信息检索技术智能水平的限制,以及对自然语言理解的制约,对网络

信息的检索存在许多不足之处。主要有如下几方面。

(1)现在的搜索引擎主要通过Robot将网页的全部或部分内容下载到自建索引库中,由于下载的页面许多是无用或暂时信息,既影响检索速度,也增加了用户检索负担。

(2)由于搜索引擎一般都采用关键词检索方式,但许多情况下,用户很难简单地用关键词或

关键词之间的组配来准确地表达真正需要的信息内容,表达困难导致检索困难。

(3)每个引擎的覆盖面都相当有限。经考察研究发现,没有一个搜索引擎的索引量超过整个

网页的1/6。

(4)搜索的结果不精确。搜索结果的精确性是由查询词与网页的相关性来确定的,常常输入

一个单一的查询词能返回数万篇结果,或者零篇结果。

2 智能代理技术

2.1 智能代理

智能代理又称智能体,是人工智能研究的新成果,它是在用户没有明确具体要求的情况下,根据用户需要,代替用户进行各种复杂的工作,如信息查询、筛选及管理,并能推测用户的意图,自主制定、调整和执行工作计划。具有智能性,是可进行高级、复杂的自动处理的代理软件。智能代理可应用于广泛的领域,是人工智能领域近年来研究的一个热点,应用于信息检索领域之后,成为开发智能化、个性化信息检索的重要技术之一。

2.2 智能代理的特点

①智能性。具有丰富的知识和一定的推理能力,能揣测用户的意图,并能处理复杂的难度高的任务,对用户的需求能分析地接收,自动拒绝一些不合理或可能给用户带来危害的要求,而且具有从经验中不断学习的能力,适当地进行自我调节,提高处理问题能力。

②代理性。在功能上是用户的某种代理,它可以代替用户完成一些任务,并将结果主动反馈给用户。

③移动性。可以在网络上漫游到任何目标主机,并在目标主机上进行信息处理操作,最后将结果集中返回到起点,而且能随计算机用户的移动而移动。

④主动性。能根据用户的需求和环境的变化,主动向用户报告并提供服务。

⑤协作性。能通过各种通信协议和其他智能体进行信息交流,并可以相互协调共同完成复杂的任务。

3 搜索引擎技术与智能代理技术的结合

搜索引擎与智能代理技术有着各自的优势与不足,把这两种技术结合起来,将为开发新一代功能更强大的网上信息搜索系统提供广阔的天地。智能代理主要集成客户端特殊的环境,配合用户兴趣完成搜索。它对用户信息需求、偏好进行甄别、归纳、总结,分析用户的兴趣爱好,并借助学习好的规则,自动、独立地代理用户查找其感兴趣的信息。将搜索引擎与智能代理技术结合起来是建立新的检索模式的必然趋势。

3.1 服务器端的个性化服务的引入

在服务器端吸收智能代理技术的思想,引入个性化和人性化服务的思想。引入用户反馈机制来完善检索机制、提高检索命中率,同时也可以提供面向个人的特殊检索服务。这种方式可以通过帐号制形式来实现,即为每一位用户提供一个帐号(类似于个人邮箱),以记录该用户查询踪迹,从而在用户再次登录时结合以往的用户检索记录来配合提供相关的检索服务。

这种模式体现了个性化服务的特色,对于用户一贯查询的信息就可以直接从用户的信息库中提取,避免了重复查询。另外,通过对用户的反馈意见进行跟踪,获取用户对结果的评价,据此提高检索质量。检索入口的自然语言化发展将有助于优化检索界面,提高界面的人性化。

时间: 2024-08-08 14:22:43

网络 搜索引擎与智能代理技术的相关文章

想要抢占移动网络时代制高点?搜索引擎优化优化技术很重要

据最新数据统计表明,移动网络的发展已经进入了快速道,2011年移动互联网的用户数已经超过4亿,在2012年,移动互联网用户数将会首次超过传统互联网的用户数,移动网络时代的到来已经不可逆转了,那么作为移动互联网主要的供应商,移动互联网上的网站如何获得更好的用户数,如何占据更好的搜索引擎排名,就成了头等大事了!换句话说,谁懂得了移动网络的搜索引擎优化优化技术,谁就占领了移动网络时代的制高点! 可是我们知道,移动互联网因为手持终端的差异非常明显,屏幕尺寸千变万化,如果仅仅把传统互联网上的网站移植到移动

地方门户站长关注网络搜索引擎

网络搜索引擎横扫互联网,现在中文搜索引擎就数百度为尊,从之前的站长们把GOOGLE看做比较客气合理的标准,直到GOOGLE退出中国市场之后大家就把百度看做重要的研究对象了,百度的收录信息数目和快照的方式成了大家评判一个网站权重高低的重要标准之一,再加上2010年的时候GOOGLE员工"透露"pr值不再更新的时候,百度的重要在各位站长的心目中越发重要了. 有心的站长研究了一个简单的规律很有意思,百度是中国网络市场重要的搜索引擎机构,google是针对全球的网络搜索引擎,但是百度的地图却是

运营级WLAN网络架构及关键技术探讨

本文讲的是 :  运营级WLAN网络架构及关键技术探讨  , 随着移动互联网时代的来临,无线数据流量呈现爆发式增长,国内三大运营商越来越多的依靠WLAN来承载这些无线数据流量,分担3G网络的压力.2011年中国电信启动"宽带中国翼起来",全力打造"无线中国",预计2012年WLAN热点将达100万个.中国移动计划在三年内将全国范围内的WLAN热点数量增加至100万个.中国联通也计划在2012年底覆盖至少4万座单体楼宇,并启动了数十万部WLAN设备的招标.这样大规模W

演讲实录丨丨Young-Jo Cho 基于网络的机器智能机器人技术的发展

基于网络的机器智能机器人技术的发展 Young-Jo Cho 韩国科学技术研究委员会智能机器人收敛集群主任 Young-Jo Cho:大家好,我主要负责的是韩国通信电子研究院相关的机器人集体智慧方面的工作.我来自于韩国,主要在电信领域,也就是我们所说的通信和IT领域有很多经验,同时我也是韩国机器人学会副主席,在明年将会成为这个委员会主席,非常荣幸有机会和大家一起分享韩国的一些经验,并且促进两国合作.     我想给大家介绍一下我所做的一个五年期项目--机器人集体性智慧科技.我将会给大家介绍一下我

纵谈网络加密及解密技术方法_网络冲浪

    一.为Windows系统文件夹加密 说起来每个人都会有一些不乐意被人知道的隐私,比如工作计划.个人信息等等,为了保护这些秘密,加密软件便成了许多人的首选.不过网上流行的加密软件基本上都是对文件或文件夹直接进行加密处理,所以在文件较大或文件很多的情况下就需要花费较多的时间,而且当要使用这些文件的时候,还需要对其进行解密,使用完毕以后,又要重新加密,十分麻烦.有没有既能加密,又能像普通文件一样方便使用的工具呢?当然有,实际上利用Windows自带的功能就能满足您这个要求. 1.文件加密 (1

2017年5个网络行业快速发展技术趋势

在每个新年伊始,来自不同公司的专家和预测者都会开始预测在未来12个月内可能影响技术行业的趋势.对于2017年,下面是可能对IT专业人员带来影响的主要技术和趋势: 2017年5个网络行业快速发展技术趋势 ▲Image: harrivicknarajah0/Pixabay 1.人工智能 人工智能(AI)在2016年开始崭露头角,该技术在2017年可能会快速发展.企业正在试图利用AI技术来帮助他们了解其大数据(特别是物联网数据)以及帮助他们为客户提供更好的服务.在2017年,Forrester公司预测

云计算中心网络大容量交换机关键技术与系统”课题通过验收

近日,"十二五"863计划信息技术领域"云计算中心网络大容量交换机关键技术与系统"课题通过技术验收. 该课题由华为技术有限公司承担.该二课题取得了以下成果: 第一,创造性地采用正交架构设计,突破技术难点,省去背板走线,极大提升系统的带宽和演进能力:第二,采用创新的散热设计方案,严格的前后风道,线卡和交换网采用完全独立的风道,无级联散热,大幅提升散热效率,提升整个设备系统绿色节能水平:第三,实现独一无二的整网虚拟化功能,支持一台物理交换机虚拟成16台虚拟交换机,还支持

拿什么拯救网络诚信:革新技术还是给人洗脑

越来越扁平化的新型信息获取渠道,使网络欺诈行为层出不穷,有关"网购诈骗"."QQ诈骗"."飞信诈骗"等词语频频见诸报端,到2009年末的 "手机扫黄",到处弥漫着对诚信的质疑.近日,一场关于网络诚信的讨论在广州展开.网络诚信危机,归罪于技术还是人?最前沿的信息技术,能否改善这种局面? 阿里巴巴副总裁李俊凌在回答关于"淘宝卖 假货"的问题时表示,网络只是一种技术,它仅仅给社会提供了一个平台,所以真正错的不是技

网络营销究竟是技术发力还是策划发力?

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 贾君鹏事件之后,似乎一下子火爆了整个整个的营销市场,随后爆发了很多的营销知名事件,无疑中国网络营销迎来了第一个绝对的蓝海时代.无论你是出于什么样的目的去开展网络营销,也不论你现在网络营销的成绩怎么样,做的好不好,其实目的都是为了在线上或线下多卖些东西嘛!创造产品的销售业绩亦或者打造品牌的知名度. 但当我们我们来仔细的审视和分解这句话的时候,其