B2C站内搜索初探(二) 写给不懂技术的你

  接上一篇文章:B2C站内搜索初探一,继续考虑以下问题:

  3、让用户搜什么内容?

  比较明显,一般b2c网站的内容就是商品、外加部分新闻公告和帮助文章。对于平台性的网站,如淘宝和京东,因为支持店中店,内容还包括店铺和品牌。内容虽然简单,一般是是会简单的对内容做“搜索分区”,分区的目的是不让用户在同一个搜索结果列表既看到商品展示、又看到文章和店铺的展示。

  淘宝商城有两个区域:商品和店铺

  

  1688有三个分区:产品、公司和求购信息

  

  豆瓣默认搜索是不分区域的

  

  说归说,目前主流的b2c网站搜索内容仅是商品,品牌或店铺等被归为商品的属性,搜索基本也不分区。

  

  仅让用户搜索商品,用户常会搜索商品的哪些组件?

  这里我把用户常用的几个搜索组件按重要程度分为3个等级:A、B、C;

序号

组件名称

权重

1

商品标题

A

2

品牌(或生产厂家)

B

3

分类

B

4

各类属性规格(如颜色尺码等)

B

5

款号(或者货号)

B

6

商品详情

C

7

Keywords

C

8

Description

C

9

价格

C

  1)商品标题是用户最常见的搜索组件,也是最容易记忆的组件,因此最重要。大部分没有采用全文检索技术的站点,是直接是通过SQL语句模糊查询商品标题关键词的。

  2)品牌、分类和各类属性规格、款号,这是用户常采用的第二种搜索类型,作为一个全文检索引擎,这几个组件必然要考虑。

  3)对于商品详情、keywords、description和价格等组件,如果进行索引,对于搜索引擎系统的要求将比较高。估计国内目前也仅有淘宝会考虑对商品详情进行索引。

  确定了要让用户搜索到的组件,搜索系统就要开始对这些组件进行索引,索引后保存在专门的索引数据库,提高查询效率。而采用索引机制,索引的新增速度和删除速度要考虑好。索引内容和数据库内容不一致会让用户很失望:产品上新了一整天还不能搜索到? 已下架每库存的商品是否一直在前端展示着,让用户可搜索到?这些都需要好好考虑。

  4、接着下一步

  搜索系统已经建立了索引,用户可以开始搜索了。用户点击搜索后,检索系统根据关键词对索引进行检索、分析和匹配,中间的过程太复杂。这里略过,简单说说“查全率”和“查准率”两个概念,以及如何在B2C站内搜索中平衡两者。

  关于查全率和查准率的解释,可以看看百度百科的简单说明。二者是互逆的关系,提高了查全率,相对的,查准率在下降。而提高了查准率,相对的,查全率却在下降。对于B2C,我有如下建议:

  1) 对于SKU少的站点,提高查全率;相反的,SKU众多的站点,偏重提高查准率。

  2) 为了提高查全率,尽量多的对商品内容组件进行索引;

  3) 为了提高查准率,对部分商品的内容组件不支持模糊检索,如京东仅支持商品编号的精准检索,而不支持模糊检索。

  未完待续……

原文链接:http://aboutb2c.com/316

时间: 2024-10-24 22:51:12

B2C站内搜索初探(二) 写给不懂技术的你的相关文章

网站分析:B2C站内搜索初探 排序和内容呈现

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 接着上一篇文章<站内搜索初探二>,继续说结构和框架层面的内容. 5. 接着考虑查询结果的排列方式 之前我们的站内搜索完成了关键词的"分析-匹配"过程,现在要对匹配好的结果进行排序.而能进行精准的相关性排序,是全文检索站内搜索的标志.大部分用SQL 语句like查询的站内搜索是按上架时间.按销量.按价格等方式进行

B2C站内搜索初探–排序和内容呈现

接着上一篇文章<站内搜索初探二>,继续说结构和框架层面的内容. 5. 接着考虑查询结果的排列方式 之前我们的站内搜索完成了关键词的"分析-匹配"过程,现在要对匹配好的结果进行排序.而能进行精准的相关性排序,是全文检索站内搜索的标志.大部分用SQL 语句like查询的站内搜索是按上架时间.按销量.按价格等方式进行简单的排序. 按相关性排序是指通过分析查询关键词和文本之间的相关度决定排序,b2c站内搜索结果的排序规则,要考虑以下因素(简单介绍,远远比这个复杂): 1)&

B2C站内搜索初探—写给不懂技术的你

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 这之前: 1.想写这篇文章很久,但一直纠结在搜索引擎具体的技术原理细节中,看得愈多,不懂的地方也愈多,迟迟不敢动手,这是非程序猿出生的痛苦. 2.所有人都知道搜索是个复杂的玩意,本文试着主要从非技术角度思考并搭建一个适用于b2c网站的站内搜索系统,不涉及到太多的技术细节.至于具体的实现代价这里未做考虑(是通过简单的sql+缓存搞定.用luce

站内搜索脚本(二)

站内搜索脚本(二) 请输入查询关键词: 输入查询关键字"javascript"看看查询结果.

图片-php中站内搜索,这个该如何修改

问题描述 php中站内搜索,这个该如何修改 解决方案 PHP站内搜索PHP 站内搜索PHP站内搜索 解决方案二: PHP也有分词一说.

关于C#站内搜索匹配的问题,请各位大侠给些指导意见,谢谢

问题描述 tb1词库表:IDtitle10666私家花园10667住宅景观10668屋顶花园10691溪流湖泊10692休憩平台10693活动广场10696儿童游乐10697树阵广场10698生态草地10699植物群落11400岗亭11401现代岗亭11402欧式岗亭11403中式岗亭11405法式岗亭11406英式岗亭11414景观亭11415现代景观亭11420法式景观亭11421英式景观亭11422意大利风格景观亭11423东南亚风格景观亭11424西班牙风格景观亭11425地中海风格景观

ssh 站内搜索 分页显示问题

问题描述 初学者,做的一个网站要求实现简单的站内搜索,我用like,要求是按标题搜索,搜索数据库中的两张表,别的好说,怎么搜索两张表,并把搜索的结果分页显示在一个页面?项目用的是ssh框架,hibernate分页只能是一次查找一张表,分两次查的话,第一次的能查出来,但是一点下一页就没显示了.帮忙看看,谢谢了.仅有的分. 问题补充:andy_javahome 写道 解决方案 我的回答却是与你的需求不符,本来以为你的两张表有关系呢.这个你可以尝试写个试图,将数据查到一张虚拟表里看行不.否则即使取出来

关于站内搜索的那些事儿

前言 模块化 登录模块 博客扫描模块 博客详情模块 搜索模块 演示 案例一 案例二 总结 前言 之前学过一点点关于全文检索相关的技术,当时使用的是Java语言,Lucene和compass框架.有兴趣的话可以参考下面的专栏链接 http://blog.csdn.net/column/details/lucene-compass.html 然后现在用的是Python了,所以需要迭代一下.网上搜索了下,相关的还真不少,还有pylucene,但是相比较而言,whoosh更为出色.那今天就用它吧. 安装

一个ASP站内搜索的实例源代码

假如你拥有一个庞大的网站,比如(www.lodoeshop.com),内容又多,那么来访者往往很难找到自己所需要的东东,这时候你就需要一个站内搜索来帮助来访者更快的找到索要的资料了!现在你就可以用asp轻易的实现这种功能,何况现在支持asp的站点这么多,利用这个搜索引擎可以搜索到你的主页里面任何一个文件或者软件资料,它可以精确到每个字! 说了这么多你是不是怦然心动了啊,那就按照下面的步骤来建立自己的搜索引擎吧: (一),首先利用access97建立一个名为list.mdb的数据库,在里面建立一个