互联网信息搜索技术—对称搜索

互联网


信息搜索是互联网信息共享领域不可阻挡的用户需求。搜索技术的突破性进展对于互联网本身和互联网用户来说同样举足轻重。

搜索技术发展现状

第一代搜索引擎采用的基本方法是由网页制作人自行建立网站名称、网站内容的文字摘要,并将其加入到搜索引擎的资料库中。搜索引擎根据用户键入的信息进行匹配、排序和显示。这种方法的最大缺点是无法针对网页内容进行全文搜索;另外,它必须由网页制作者自行键入供搜索的资料。

第二代搜索引擎采取的基本方法是由搜索引擎使用一个程序在网络上撷取资料,并自动将得到的结果存入资料库中。搜索引擎根据用户键入的信息进行匹配、排序和显示。它的优点是:不需要网站制作人单独键入供搜索的信息,并且从理论上讲,可将任意网站的所有网页加入到它的资料库中。而它最大的缺点是搜索到的结果太多,实际上使用者仍然难以找到真正想要的资料,并且数据库容量呈不断膨胀的趋势。

如何从庞大的资料库中精确地找到正确的资料,已被公认为是下一代搜索技术的竞争要点。

' 当前新兴的技术有:

● 智能搜索

其基本方法是通过对搜索内容相关性的自动学习,提高搜索结果的可用度。但问题是面对海量且庞杂的信息发布内容,如果没有一个在发布端和检索端共享的信息匹配模块,仅靠智能搜索很难根本改善信息搜索的精确度,使用户真正需要的信息一定显示在前两三页搜索结果之中。

● 垂直搜索 是针对图像信息、音乐信息等领域的搜索技术。

P2P搜索是未来的搜索技术之一,它的基本方法是用户共享所有用户硬盘上的文件、目录乃至整个硬盘。搜索无需通过Web服务器,也可以不受信息文档格式和宿主设备的限制,可达到传统目录式搜索引擎(只能搜索到20%~30%的网络资源)无可比拟的深度(理论上将包括网络上所有开放的信息资源)。P2P搜索的首要问题是解决信息匹配精度问题,以及有可能带来的个人信息和公共信息的失衡。计算机中存储的信息通常是个人信息,而服务器中的网站信息才是公共信息的主流。

未来另一种搜索技术是“信息服务网络”,其主要特点是它不仅包括计算机和网页信息的搜索,而且包括各种信息资源,例如数据库、软件以及各种信息获取设备的信息处理功能一体化。整个网络如同一台巨大无比的计算机,向每个用户提供一体化的服务。它的主要问题与开展电子商务有某种相似性,即整合所有信息服务环节和相关技术需要建立统一的标准,而这类标准的建立和推广绝非三五年之功,并且很难想像只有一种标准出现。另外,从商业角度看,服务的性能价格比也是令人担忧的问题。

对称搜索技术

1.对称搜索原理

从本质上讲,“发布信息”和“检索信息”是一种对称的信息沟通需求。因此,我们可以建立“发布信息”和“检索信息”的对称数据库和对称搜索技术。而现有搜索技术的盲点在于,浪费了信息检索方在信息检索时付出的大量劳动和庞大的信息资源。

2.对称搜索的实现

(1) 建立“对称信息摘要通用模版”,其中包括发布/获取选择、数据类型、内容摘要、发布者域名、邮件地址、发布起止时间;

(2) 建立“对称信息摘要”数据库;

(3) 信息发布和信息获取用户都在“对称信息摘要通用模版”上输入信息;

(4) 搜索引擎根据用户要求,对“对称信息摘要数据库”进行多次匹配;

(5) 根据对称信息的匹配程度进行排序;

(6) 根据对称信息双方提供的地址进行匹配结果双向自动推送;

(7) 由用户选择是否链接至相关站点的详细内容。

信息分类、信息摘要、用户端基本信息是对称信息匹配的基本内容,只有合理整合这三类信息要素,才能设计出一个所有用户都方便并乐意使用的“对称信息人机交互模版”和高质量的“对称信息数据库”。

3.对称搜索技术的优越性

对称搜索技术使对称信息匹配的准确度空前提高;同时,一次性搜索可多次享用不同时间的搜索结果,使用户搜索操作简便;另外,摘要数据库与全文数据库相比,不会无限膨胀;还有一点很重要,由发布信息方自行提供摘要信息和保留时间,加上摘要数据库空间占用收费,这实际上是控制垃圾信息的最有效手段,从而使垃圾信息大幅度减少。如果既可以大幅度提高信息发布的针对性,又有操作十分方便的“对称信息摘要通用模版”,已经做了网页和更新了网页内容的用户,又岂在乎填一下摘要?

4.对称搜索技术的商业应用

(1) 对称搜索技术实例——“对称广告”

互联网现有的广告形式存在一些缺点,如大幅广播广告的成本高,多数中小企业难以承受;分类广告其信息发布无强制性,多数厂商和用户不感兴趣;搜索引擎的隐性广告要根据广告方支付费用的高低决定检索结果排名顺序,对用户不利;邮件广告仅依靠用户基本注册信息和已有业务的信息发布广告,用户的针对性不强,多数被用户视为垃圾广告。

对称广告的比较优势有以下两方面:一方面,对广告发布企业而言,前所未有地提高了广告发布的针对性;其广告价格任何小型企业都可以承受;同时,企业一次性发布信息,可多次自动推送至相关客户;企业可以得到潜在用户的准确信息。另一方面,对广告对象用户而言,它真正做到用户需求至上,根据用户自己提出的具体需求推送广告信息,根据广告信息和用户需求信息的客观匹配程度进行广告排序;用户一次“检索”信息,可多次获得相关信息的自动推送服务;消除了垃圾邮件,减轻了用户负担。

(2) 对称搜索的商业运作模式

● 对称搜索连锁经营

各类门户网站可以通过“对称信息数据库”共享和提供本地客户结算服务,共享“对称信息”资源,联手实现服务覆盖面的最大化。

● 对称广告浏览积分换免费邮箱

邮箱是互联网用户最无法放弃的钢性需求。用对称广告浏览积分换免费邮箱,既是一种用户可接受的强制广告方式,也是一种用户可接受的邮箱变相收费方式。

由于网上对称广告具有难以取代的性能价格比,因此可以预计,对称广告作为一种廉价通用的点到点广告方式,将成为大多数中小企业首选的广告投放方式,从而为互联网广告业带来光辉灿烂的明天!

5.对称搜索技术的扩展

如果能够提供“对称信息”的高质量多语种转换技术,便可实现无语言障碍的“对称信息”全球通用检索服务。而“文本语义人机交互统一编码技术”、“全域数码知识信息定位技术”在解决多语种翻译质量问题上也已取得决定性突破。因此,预计在一年内,单语种“对称信息检索”服务将进入普及阶段;两年内,用户即可享受到可靠实用的多语种通用“对称信息”检索服务。

时间: 2024-08-31 12:20:57

互联网信息搜索技术—对称搜索的相关文章

中国开发新的搜索技术 提高搜索准确度

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 面对搜索引擎一再拿一些五花八门的结果来忽悠我们时,我们盼望未来的技术能改变这一现状;当我们每天如饥似渴的等待来自google的最新消息时,也许最后改变这一切的正是我们自己. 如今我们在网上进行搜索的时候,最郁闷的事情莫过于搜索引擎答非所问,给我们弄出一些令人哭笑不得的无用信息. 我们都有类似的经历,敲下几个关键词,搜索引擎反馈的将是一些与之只

Google创始人佩奇:搜索技术将会改变世界

 1990年代末,当时还是斯坦福大学计算机博士生的拉里·佩奇和塞尔盖·布林发现了一种全新的互联网搜索计算方法.他们提出了一个极具创造性的想法:通过扫描以太网的连接结点来确定网页的浏览频率.今天的全球搜索巨擎Google就诞生于当初的这一想法,Google使互联网搜索得到了质的飞跃. 今天,31岁的佩奇,这位语调温和.头发略带灰色但泛着光泽的年青人已经身价倍增,成为全球瞩目的焦点人物.作为负责产品部门的总裁,他全身心地投入到了Google美好前景的规划工作中.<商业周刊>记者Ben Elgin对

复杂的1秒 图解Google搜索技术,互联网营销

谷歌(Google),一个非常成功,但又十分神秘,而且带有几分理想化色彩的互联网搜索巨人,它还是一家相当了不起的广告公司,谷歌首页上的那个搜索按钮是其年赢利200亿美元的杀手级应用,也是Internet首屈一指的商业和技术神话.近日国外一家网站(PPCblog)精心绘制了一张谷歌搜索流程图,这张流程图展示了每天拥有3亿次点击量的Google搜索按钮背后搜索引擎在那不到1秒的响应时间内所进行的处理. 在你点击了Google搜索按钮之后到看到结果这不足1秒钟的时间内,它做了什么?互联网上的内容如何被

Google 搜索技术图解 - 用户按了搜索按钮之后都发生了什么?复杂的1秒!

class="post_content" itemprop="articleBody"> 在你点击了 Google 搜索按钮之后到看到结果这不足1秒钟的时间内,它做了什么?互联网上的内容如何被谷歌找到?什么样的内容会被收录?想必大家一定都想知道谷歌搜索按钮背后的秘密吧.别急,开始之前我们先来看一下神秘的谷歌数据中心-- 谷歌自家设计服务器 谷歌的数据中心高度机密,我们所能得到的信息十分有限.我们先来看几个数据:谷歌在美国本土的数据中心有19个以上,另有17个分

坎坷百度的灯火阑珊处:下一代搜索技术在那

坎坷百度的灯火阑珊处:下一代搜索技术在那

下一代搜索技术:软件管家堪比真人管家

智能代理不但能够预测用户所需信息,而且可以在无需用户操心的情况下根据这些信息执行事件. 5月6日消息,随着全球互联网技术和服务水平的整体提升,在线搜索这一领域也在不断地进化发展,与目前"用户输入关键词,搜索引擎随之呈现相关结果"的"先指令后执行"式搜索不同,未来,用户不再需要主动"搜索"信息,需要的信息将"自动"找上门来,目前,实现这一愿景的三项至关重要的技术--情境搜索(指综合考虑用户背景.兴趣爱好以及所处环境等的智能化和个

1.搜索引擎的历史,搜索引擎起步,发展,繁荣,搜索引擎的原理,搜索技术用途,信息检索过程,倒排索引,什么是Lucene,Lucene快速入门

 一: 1  搜索引擎的历史 萌芽:Archie.Gopher Archie:搜索FTP服务器上的文件 Gopher:索引网页   2  起步:Robot(网络机器人)的出现与spider(网络爬虫) Robot基于网络的,可以执行特定任务的程序 Spider:特殊的机器人,网络爬虫,爬取互联网上的信息(可以是文件,网络)----网络自动下载程序   3   发展阶段:excite,galaxy,yahoo这些公司做搜索   4   繁荣:infoseek,AltaVista,Google和

广东医保基金安全监管再创新,推广人脸识别技术;eBay App 上线人工智能图片搜索技术

eBay App 上线人工智能图片搜索技术 Google 早前推出了 Google Lens 应用,是全新的 AI 驱动的图像搜索.用户只需拍摄一些东西,Google 那令人难以置信的高级算法就会尝试找出它是什么,并为您提供搜索结果.eBay 现在已经为其移动应用添加了类似(但不太先进)的功能,目的是为了加速 AI 布局. 用户只需按下应用程序顶部的相机按钮,然后选择新的"图像搜索"选项.经过这个操作之后您就可以拍摄照片,也可以从相册中选择一幅照片.然后,eBay 的机器学习服务器将尝

腾讯SOSO宣布正式采用独立搜索技术

9月3日消息,腾讯SOSO(搜搜)新闻发言人向网易科技证实,旗下搜索业务腾讯SOSO正在采用自有搜索引擎技术进行试运营,但与谷歌的合作仍会继续.网易科技于7月9日独家报道腾讯阿里巴巴酝酿推出独立搜索引擎,不到两个月后,腾讯SOSO就宣布采用自己的独立搜索技术. 从今天开始,腾讯SOSO搜索结果页面已经去掉"以下结果由Google提供"字样.以相同关键字搜索出来的结果,已经与谷歌搜索出现明显差异.此前腾讯SOSO一直由谷歌中国为其提供搜索技术支持. 腾讯公司表示,目前SOSO使用了自主研