搜索引擎原理和用户使用习惯

摘要: 搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。当用户在搜

搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。当用户在搜索框输入一个关键字后,我们应该给用户返回什么内容呢?

一、搜索引擎原理和用户使用习惯

1.1 搜索引擎是一个可供所有人检索的数据库

图1:搜索引擎简单的人机交互过程

其中:

1)被检索的数据库即搜索引擎所抓取的网页数据。

通过蜘蛛爬取到原始数据后,搜索引擎会对其进行处理后才入库。即搜索引擎的搜索算法,比如大家熟知名字( 当然是名字啦,内容原理是最高机密) 的Google的PageRank。

2)搜索引擎是高度简化后的产品。

用户需要做的即是输入想要检索的关键词,确定,查看结果。这里有个需要说明的是,用户连搜索条件都不需要输入。而对搜索引擎来讲,不仅要在海量数据中快速找到相关结果,还要揣测用户的期望并提取正确的内容给用户,内部的机制已经不能用繁琐来形容了。

这个难度就好比在大量图书中快速准确找出某一个未知问题的答案一样。

图2:刚拍摄的国家图书馆,使用了滤镜。

1.2 搜索引擎数据处理过程

搜索引擎是一个超级复杂的系统,内部具体的处理规则和技术原理不可能是简单的阐述清楚。我们通过产品的思维来理解一下这个过程即可。拿写论文的例子分析即可,论文在成文之前材料的整理过程大致如下:

1)从网络、图书馆、书籍杂志、讲座等等收集大量原始资料

2)排除相关重复内容

3)排除跟主题关联性不大的内容

4)根据主题、逻辑顺序、优先级等进行人为的计算、分析、排版、处理等。这个过程是最为繁琐和耗时的,使用的武器便是史上最牛逼的工具:人脑!!!

5)成文输入结果

忍不住再重申一下:所有的产品其实都是在模仿人类的实际社会活动。。。明白这个对于产品经理很重要哦。

搜索引擎数据处理流程基本类似(想要了解的可以自行搜索相关资料),唯一的也是搜索引擎想消除的区别 :

一个是有感情有逻辑的人脑在分析,一个是机器按照一定规则来分析。

所以,想要搜索结果更精准,那就让它像人脑一样分析输入数据并输入结果。

恩,我也觉得不怎么现实,但是可以想办法让他比较精准。

二、获取信息的方式

我们还是先从日常行为的来入手然后再推导产品的操作方式。

2.1 通常,我们从周围环境如下获取信息:

1、 已知获取途径和方法

如想获知今天美元对人民币的汇率抑或北京飞青岛的机票价格和时刻表,因为途径已知,此类信息只要按图索骥即可。差别在于不同途径的成本。汇率可通过网络查询、电话咨询、银行网点询问等,显然第一种方法更便捷。(的确是废话)。

这些信息都是规则化,概念明确的。

2、了解核心关键需要整理的

如刚才提到的论文写作,假设题目为弱关系社区设计,我们就需要去询问什么弱关系,和强关系有什么区别,已有的设计案例是什么。

这些信息的获取建立在人为分析的前提下。

2.2 提问方式

还是举两个例子。

1、 在形成完整的序言逻辑前,小孩子提问的方式是最简单的关键词,大人们要做的便是通过他的咿呀来理解孩子的需求。一般大人都能准确预测,原因在于其非常了解孩子的习惯、行为、方式、特征 等。

2、有了完整的语言逻辑后,我们一般选择直接提问:今天的汇率是什么?北京飞青岛的票价多少,都是几点的?人脑也完全可以处理这些问题。当然,人是复杂的感情动物,好多东西还不能完全通过字面意思去理解。说一个不是很恰当的例子:约会中,女孩提问你觉得现在的房价如何。字面意思是房价,潜在意思是你的购房能力如何。

2.3 搜索引擎该这么处理

假设搜索引擎具有跟我们一样的大脑的话,那他处理问题的方式应该是这样的:

1、分析所查询的问题是检索关键词还是提问

2、结果分为三种,

答案已知直接输出结果;

途径已知,输入解决途径;

提供最符合用户预期的排序结果共用户挑选

3、不同的情况下会出现相互组合。当搜索引擎对关键词理解越充分时,结果越准确。

三、改进方法和策略

再总结一下用户的操作行为:

3.1 当用户输入的为关键词时:

1)已知用户的特征,根据其特征对搜索结果进行符合其本身的排序

2)未知用户特征,则视为普通的查询。提供结构话的搜索结果,即具有相关性的提示,相关性越高,结果越靠前。

3.2 当用户进行提问时:

1)分析提问的语义,简单的语义输出结果或途径

2) 无法分析确切的语义,提供多个结果给用户,同时根据用户的反馈不断调整结果。这也是用户特征的一部分。

3.3 搜索结果出现交叉时,痛痒还是需要参考用户的行为特征来对结果排序。

有几个名词,感兴趣的可再去搜索一下:Baidu-框计算;Google-知识图谱;Facebook-社交图谱搜索;Siri-语义搜索;概率-马尔可夫模型 。

说白了,就是

搜索引擎对用户的搜索意图越理解,资料库越完备,输出的结果越精准 。

还是举个例子来佐证一下:同样一个问题,好朋友的解答一般比陌生人要好,因为好朋友更了解你提问的动机,背景甚至期望得到的答案。

问题来了,计算机毕竟不是生物,他执行的仅仅是规则。能做的便是收集你的一些行为和特征来推断你的喜好:

1、个人信息:姓名、性别、籍贯、职业、行业、兴趣爱好、使用偏好等。

2、个人行为:搜索记录、浏览记录、社交行为等

3、处理方法:聚类、分类、数据挖掘

恩,其实是一个推荐引擎。更多知识和操作方法可以看一下Ibm Developer的文章:探索推荐引擎的秘密。

时间: 2024-09-22 23:58:39

搜索引擎原理和用户使用习惯的相关文章

搜索引擎排名算法与设置符合用户搜索习惯的关键字

1. 针对搜索引擎蜘蛛的体验,搜索引擎蜘蛛模拟用户的浏览方式爬行网站,这就是我们现阶段seo的网站内部结构优化需要做的--满足搜索引擎的爬行需求.例如:内部链接布局.sitemap.制定URL标准等等,多说一句,google虽然倡议使用动态链接,但是国内最大的搜索是百度,所以还需要照顾一下,我觉得目录结构不超过三层为宜,比如这样http://www.111cm 2. 网站展现在搜索结果里的用户体验,主要就是标题描述,用户通过搜索引擎首先看到你的是你在搜索结果里的标题和描述,怎样写才能吸引用户点击

致青春2:必须从搜索引擎原理开始学习SEO

大家好,我是颜江峰,上一篇文章<致青春:写给新手SEO们的一些话>发表以来,近期陆陆续续有不少朋友加了我的QQ:793030022.写完这篇文章我发现内容太多了,时间限制也没能写更加详细,写一篇文章有时候打字要打接近两个小时,还请大家体谅一下. 最近时常接受到了一些朋友的咨询,尤其是打算接触这个行业的朋友.其中有一位山西的朋友,问我SEO有没有学历要求.我回答SEO对学历要求不高,只要你有一颗坚持和肯学习的心.对方又告诉我,他不懂编程,不会代码,会是障碍吗?这位朋友让我想起笔者初时对SEO的抗

解析用户搜索习惯与百度分词的关联性

2012年的搜索营销较之以前发生了根本性的变化,我们在搜索领域提到最多的莫过于"用户体验"一词.什么是用户体验呢?这个词给人的印象比较含糊,百度百科的解释是:用户在使用产品过程中的主观感受,对于不同用户群体来说,是一种不同的共性.于是笔者想到了,用户体验与用户的搜索习惯分不开,而用户的搜索习惯又和关键词分不开,说到关键词,自然离不开百度分词技术,因此,今天就为大家解析一下用户搜索习惯与百度分词之间必然存在的关联: 一:用户的搜索习惯 我一直以来对朋友和客户都强调一个观点,要想把自已的产

Siri+WolframAlpha……正在改变用户搜索习惯

Siri的强大是有目共睹的.当然,它的强大是与它使用的技术是密不可分的.Siri使用了2种非常先进的计算技术,人工智能及云计算,具体来说,人工智能主要是语音识别以及语音合成技术,云计算主要是以Wolfram http://www.aliyun.com/zixun/aggregation/1541.html">Alpha为代表的知识搜索技术(或者知识计算技术)和以Yelp为代表的问答以及推荐技术. 语音识别以及语音合成技术语音识别技术,也被称为自动语音识别(英语:Automatic Spee

为什么要了解搜索引擎原理

摘要: SEO行业在中国经过多年的发展,已经风风火火起来了,也有越来越多的人加入了SEO的行业中,不过SEO在中国起步的时间不算长,加上许多外在因素的影响,导致很多SEO新人们在学习的过 SEO行业在中国经过多年的发展,已经风风火火起来了,也有越来越多的人加入了SEO的行业中,不过SEO在中国起步的时间不算长,加上许多外在因素的影响,导致很多SEO新人们在学习的过程中吃尽了苦头,今天和大家分享一些关于我自己在学习SEO过程中走过的一些弯路,系统给后来新人提个醒! 我们学习某样东西至少要先了解这样

搜索引擎原理-搜索引擎技术

    搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库.     搜索引擎,也不能真正理解网页上的内容,它只能机械的匹配网页上的文字.     真正意义上的搜索引擎,通常指的是收集了互联网上几千万到几十亿个网页并对网页中的每一个文字(即关键词)进行索引,建立索引数据库的全文搜索引擎.当用户查找某个关键词的时候,所有在页面内容中包含了该关键词的网页都将作为搜索结果被搜出来.在经过复杂的算法进行排序后,这些结果将按照与搜索关键词的相关度高低,依次排列.     现在的搜索引擎

搜索引擎已经成为用户获取App第一入口,占比44.8%

智能手机和移动互联网发展给了创业者"一款应用能创富"的机会.近日有报告指出,搜索引擎已经成为用户获取App(应用程序)的第一入口,占比44.8%. 而在使用搜索引擎搜索和下载App的人群中,有八成用户表示未来将更倾向于使用搜索引擎的"即搜即下"方式下载App. 北京大学市场与媒介研究中心发布的<移动互联时代的App下载分流研究>报告显示,用户使用App的需求更加明确,而开放的安卓系统和部分苹果iOS系统被"越狱",打破了原本封闭.单一

搜索引擎原理简析 不懂搜索引擎原理的SEOer就是在裸奔

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 不懂搜索引擎原理的SEOer就是在裸奔. 嗯,在结束废话之前,再插一句:中国第一个基于网页索引搜索的搜索引擎是北大的天网. 好,先上图来简单看下搜索引擎的"三板斧":数据搜集->预处理[索引]->排名. 数据搜集 即数据的搜集阶段,将网页从浩如瀚海的9201.html">互联网世界搜集到自己的数

解析用户搜索习惯与百度分词之间必然存在的关联

摘要: 2012年的搜索营销较之以前发生了根本性的变化,我们在搜索领域提到最多的莫过于用户体验一词.什么是用户体验呢?这个词给人的印象比较含糊,百度百科的解释是:用户在使用产品 2012年的搜索营销较之以前发生了根本性的变化,我们在搜索领域提到最多的莫过于"用户体验"一词.什么是用户体验呢?这个词给人的印象比较含糊,百度百科的解释是:用户在使用产品过程中的主观感受,对于不同用户群体来说,是一种不同的共性.于是笔者想到了,用户体验与用户的搜索习惯分不开,而用户的搜索习惯又和关键词分不开,