接上一篇文章:B2C站内搜索初探一,继续考虑以下问题:
3、让用户搜什么内容?
比较明显,一般b2c网站的内容就是商品、外加部分新闻公告和帮助文章。对于平台性的网站,如淘宝和京东,因为支持店中店,内容还包括店铺和品牌。内容虽然简单,一般是是会简单的对内容做“搜索分区”,分区的目的是不让用户在同一个搜索结果列表既看到商品展示、又看到文章和店铺的展示。
淘宝商城有两个区域:商品和店铺
1688有三个分区:产品、公司和求购信息
豆瓣默认搜索是不分区域的
说归说,目前主流的b2c网站搜索内容仅是商品,品牌或店铺等被归为商品的属性,搜索基本也不分区。
仅让用户搜索商品,用户常会搜索商品的哪些组件?
这里我把用户常用的几个搜索组件按重要程度分为3个等级:A、B、C;
序号
组件名称
权重
1
商品标题
A
2
品牌(或生产厂家)
B
3
分类
B
4
各类属性规格(如颜色尺码等)
B
5
款号(或者货号)
B
6
商品详情
C
7
Keywords
C
8
Description
C
9
价格
C
1)商品标题是用户最常见的搜索组件,也是最容易记忆的组件,因此最重要。大部分没有采用全文检索技术的站点,是直接是通过SQL语句模糊查询商品标题关键词的。
2)品牌、分类和各类属性规格、款号,这是用户常采用的第二种搜索类型,作为一个全文检索引擎,这几个组件必然要考虑。
3)对于商品详情、keywords、description和价格等组件,如果进行索引,对于搜索引擎系统的要求将比较高。估计国内目前也仅有淘宝会考虑对商品详情进行索引。
确定了要让用户搜索到的组件,搜索系统就要开始对这些组件进行索引,索引后保存在专门的索引数据库,提高查询效率。而采用索引机制,索引的新增速度和删除速度要考虑好。索引内容和数据库内容不一致会让用户很失望:产品上新了一整天还不能搜索到? 已下架每库存的商品是否一直在前端展示着,让用户可搜索到?这些都需要好好考虑。
4、接着下一步
搜索系统已经建立了索引,用户可以开始搜索了。用户点击搜索后,检索系统根据关键词对索引进行检索、分析和匹配,中间的过程太复杂。这里略过,简单说说“查全率”和“查准率”两个概念,以及如何在B2C站内搜索中平衡两者。
关于查全率和查准率的解释,可以看看百度百科的简单说明。二者是互逆的关系,提高了查全率,相对的,查准率在下降。而提高了查准率,相对的,查全率却在下降。对于B2C,我有如下建议:
1) 对于SKU少的站点,提高查全率;相反的,SKU众多的站点,偏重提高查准率。
2) 为了提高查全率,尽量多的对商品内容组件进行索引;
3) 为了提高查准率,对部分商品的内容组件不支持模糊检索,如京东仅支持商品编号的精准检索,而不支持模糊检索。
未完待续……
原文链接:http://aboutb2c.com/316