搜索引擎技术及趋势1-搜索引擎技术

搜索引擎走到今天,已经是一个结束过去,开辟未来的时候了。为了说清楚我所讲的第三定律,我们先来回顾一下第一和第二定律。
 
■ 第一定律 相关性定律
 听起来象是一篇学术论文,的确,就连第一,第二定律的提法以前也没有过,但是第一,第二定律的内容确早已在业界和学术界得到了公认。其实这第一定律是早在互联网出现之前就被学术界广泛研究过的,那就是所谓的相关性定律。这个领域那时叫情报检索,或信息检索,也有叫全文检索的。
 那时的相关性都是基于词频统计的,也就是说,当用户输入检索词时,搜索引擎去找那些检索词在文章(网页)中出现频率较高的,位置较重要的,再加上一些对检索词本身常用程度的加权,最后排出一个结果来(检索结果页面) 。早期的搜索引擎结果排序都是基于本文的第一定律的,如Infoseek,Excite,Lycos等,它们基本上是沿用了网络时代之前学术界的研究成果,工业界的主要精力放在处理大访问量和大数据量上,对相关性排序没有突破。
 词频统计其实根本没有利用任何跟网络有关的特性,是前网络时代的技术。然而,网络时代的主要文献是以网页的形式存在的,而几乎每个人都可以随心所欲地在网上发表各种内容,词频相同的两个网页,质量相差可以很远,可是按照搜索引擎的第一定律,对这两个网页的排序应该是一样的。为了能够派在某些检索结果的前几位,许多网页内容的制作者绞尽脑汁,在其页面上堆砌关键词,搜索引擎对此防不胜防,苦不堪言。这种情况到了 1996年开始有了改变。
 
■ 第二定律 人气质量定律
 1996年4月,我到赌城拉斯维加斯开一个有关信息检索方面的学术会议,会议的内容就象拉斯维加斯的天气一样,照例比较枯燥乏味。但远离公司的我,却难得有一个静下心来认真思考问题的机会。就在听一个毫不相干的论文演讲的时候,我突然把科学引文索引的机制跟Web上的超级链接联系起来了 - 感谢北大,她在我上大三的时候就教授了我科学引文索引的机制,美国恐怕没有一所大学会在你本科的时候教这玩艺儿。
 科学引文索引的机制,说白了就是谁的论文被引用次数多,谁就被认为是权威,论文就是好论文。这个思路移植到网上就是谁的网页被链接次数多,那个网页就被认为是质量高,人气旺。在加上相应的链接文字分析,就可以用在搜索结果的排序上了。这就引出了搜索引擎的第二定律:人气质量定律。根据这一定律,搜索结果的相关性排序,并不完全依赖于词频统计,而是更多地依赖于超链分析。

时间: 2024-12-17 03:36:35

搜索引擎技术及趋势1-搜索引擎技术的相关文章

从搜索引擎优化的角度分析HTML5技术的三个改进

昨日谷歌再次利用HTML5技术设计了其搜索主页的LOGO,这一LOGO是一架可以让我们弹奏不同音符并且可以记录和播放的合成器.此次谷歌再一次让我们体验到HTML5技术强大的WEB交互体验.而HTML5技术在wen是否仅仅只是有与用户交互的功能?其实不然,我们站在搜索引擎优化的角度上看HTML5技术的话,就可以发现很多HTML5功能都对搜索引擎更加的友好.不论是作为开发人员或者是SEOer,我们都需要从今天开始了解HTML5技术,为明日的WEB做准备.下面笔者就简单的分享三点HTML5技术的改进.

浅述搜索引擎的分词算法 了解全文检索技术

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 21世纪互联网的快速发展让人们生活越来越便利,当日益剧增的海量信息让我们眼花缭乱时,搜索引擎的出现可以让我们快速找到自己想要的答案.因此多了解搜索引擎的分词算法,可以让网站在搜索引擎上获得更好的展现机会.在讲解中文分词技术之前,先来了解下全文检索技术. 全文检索技术 全文检索是指索引程序扫描文章中的每个词并建立对应索引,记录该词出现的位置和次

一起谈.NET技术,Silverlight的搜索引擎优化

什么是SEO,为什么它是如此重要? SEO(搜索引擎优化)是改善交通的数量和质量,从搜索引擎网站的过程. 这意味着,做搜索引擎优化您的网站将使其更具可转位及更多的人参观. 下面是你的规则应该坚持以做最好的搜索引擎优化几点: <title>标签应包含有关您网站的最重要的信息 最重要的内容应留在本页面(开始后<body>标记) 所有图像标记号(<img />)应界定上的Alt标签-这是搜索引擎理解什么是图像的唯一途径说' 简短的开场白,RIA的世界 如今,网络空间是完全不同

如何分析Google Analytics搜索引擎流量变化趋势?

做SEO或是站长,我们通常要看很多数据,比如:PV,UV,IP等,今天我们就重点说说IP流量来源这个数据.流量来源主要有三种类型:引荐,直接,搜索引擎.不同的站点,这三种流量类型的比例也都不一样,当这三中流量来源中有一种类型流量比例较高或占大部分时,我们就可以说这个站点主要依赖这种类型的流量.但是对于一些CMS内容型网站来说,通常情况下,搜索引擎的流量比例会最大,当然这也会非常危险,因为一旦SEO出现问题或搜索引擎调整算法,全站的流量就会出现大的很大.从网站的整体运营来讲,我们希望各种形式的流量

趋势利用“云计算”技术服务新老客户

本文讲的是趋势利用"云计算"技术服务新老客户7月22日,趋势科技在主题为"Web安全云时代"的发布会上,展示了公司基于云安全技术架构(Cloud-Client)构建的下一代内容安全防护解决方案,用于解决当前面临的快速增长和极具动态性的网络威胁.     根据AV-Test.org的最新统计,全球恶意程序已超过1100万个,传统的代码比对技术正面临着越来越大的困境.SecureCloud云安全技术作为下一代内容安全架构,旨在通过动态对被访问信息的安全等级进行评估,在恶

探索和揭秘今后搜索引擎的算法趋势

摘要: 搜索引擎一直在寻找新的排名算法以便能够改善搜索质量并能更好的服务网络使用者.事实上,用户满意度是增加搜索引擎市场份额的最重要的因素,这也是驱使搜索引擎不断改进,取 搜索引擎一直在寻找新的排名算法以便能够改善搜索质量并能更好的服务网络使用者.事实上,用户满意度是增加搜索引擎市场份额的最重要的因素,这也是驱使搜索引擎不断改进,取悦用户的原动力.让我们来探索和揭秘一下今后搜索引擎的算法趋势. 曾几何时,搜索引擎是以关键字为中心的.大量的关键字堆砌和隐形文本的使用可以获得很好的搜索排名.而后,谷

冷链物流行业RFID技术应用趋势解析

目前,物联网技术已从单纯技术上升到一种经济形态的新经济形态,物联网产业已成为国家战略,冷链物流需要更多的复合网络技术信息.如GPS.温度控制等领域的应用成为冷链物流领域的一个趋势. 物联网技术支持农产品冷链物流 突破长途冷链运输限制目前是一个挑战. 提高多式联运基础设施和硬件建设水平不断通过原始创新.集成创新和引进等多种形式的消化.吸收和创新. 加强生产.存储.加工.运输.销售.技术改造升级的所有节点和促进农产品冷链物流的跨越式发展,促进农产品冷链物流发展突飞猛进. 信息技术支持冷链物流"不断链

3D 打印的自卫装甲 - 这种高大上的服装会是可穿戴技术的趋势?

class="post_content" itemprop="articleBody"> 设计师表示,这款 Spiderdress 装甲可以为用户提供侦测和防卫设备. 如果没有3D打印技术的支持,可穿戴科技就不可能在2014年新兴技术中拔得头筹.今年该类产品无论在价格.品种.媒体关注度和公众接受程度上都有了新的飞跃,我们正准备迎来2015年的可穿戴技术风暴.荷兰设计师(工程师)  Anouk Wipprecht 计划在今年一月推出一款可穿戴设备,让自己赢在来年

近几年前端技术盘点以及 2016 年技术发展方向

我从 12 年底开始接触前端,12 年之前的前端发展情况只能从上一辈的笔触中领会.本文会盘点从 09 年开始到 15 年间前端技术的革新,同时也会从多个角度,解读近几年前端技术发展的潜在因素,其中穿插了若干对前端演进的拙见,难免会有错误和疏漏,望读者可以补充和斧正. 那些年,一度追捧,一度放弃 下面,花一些篇幅简单回顾下 09 年到 15 年前端的发展历程. 09 年,基础类库完善,寻求突破 09 年之前,JavaScript 还处于对自身语言的完善过程中,而到了 09 年,JavaScript

容器技术获取IOSO9001认证云技术技术|睿云智合Wise2C

随着我公司业务的不断扩大,为了适应发展的需要,尽快与国际接轨为客户提供更优质的服务,引入ISO9001国际质量体系标准已成为迫切需要. 2017年3月23日,经授权公司认证专家的严格审核,国家质量体系委员会认可,我司管理体系符合ISO质量管理体系要求,获得GB/T19001-2016/ISO9001:2015认证证书.本次通过认证的范围如下:云计算的开发与销售.云计算服务:网络设备及软硬件的开发.销售与维护:计算机系统集成.网络技术开发与销售:经营电子商务:信息化平台销售及提供相关方案与技术服务