B2C站内搜索初探—写给不懂技术的你

  这之前:

  1、想写这篇文章很久,但一直纠结在搜索引擎具体的技术原理细节中,看得愈多,不懂的地方也愈多,迟迟不敢动手,这是非程序猿出生的痛苦。

  2、所有人都知道搜索是个复杂的玩意,本文试着主要从非技术角度思考并搭建一个适用于b2c网站的站内搜索系统,不涉及到太多的技术细节。至于具体的实现代价这里未做考虑(是通过简单的sql+缓存搞定、用lucene或Sphinx等全文检索引擎做二次开发、甚至找google 百度买代码做二次开发,听你们程序猿的吧,你做不了主)。

  3、本文多次提到站内搜索,而非站内搜索引擎,这两者间有巨大差别(我不是很确定最终设计出来的是否会是一个真正意义上的站内搜索引擎)。

  4、本文参考了较多资料,例举如下,供参考学习

  《web信息架构-设计大型网站》这本经典书籍(不建议新手购买)

  美女西乔的几篇文章http://blog.xiqiao.info/2009/06/02/343

  yeeach.com 的几篇文章

  以及部分关于全文检索的论文

  在这之后,我们进入正文

  1、在开始考虑规划一个b2c站内搜索前,需要考虑清楚以下2个问题

  站内搜索要解决的问题和意义

  下面描述2类常见的搜索场景

  某用户小李,对网站A已较熟悉,要买电脑,此时知道网站A有电脑销售。直接输入关键词:Thinkpad X系列进行较精准的查询。

  某用户小白,听说了b2c网站A,第一次登陆,看见琳琅满目的商品。刚好之前浏览过相似网站,或对目前商品的类目有较全面的认识。想迅速定位脑海中已有的某几种商品。于是输入较宽泛的关键词进行模糊搜索:如输入羊毛外套、全棉T恤等较模糊的关键词。

  (1)站内搜索刚好满足这两类用户的需求。

  (2)通过分析用户关键词搜索频次,了解用户的潜在需求。(针对这点,我一直有个想法,若发现大量搜索关键词为A的某类商品,而恰巧网站没有。网站为降低风险,是否可以采用预定的方式,先上架与目标关键词A吻合的商品X?)

  (3)对于网站运营人员,通过分析用户的关键词搜索日志,能修正商品命名方式,编辑出更加符合用户认知的命名方式(这里顺便提下一个免费强大统计用户站内搜索的工具—google analytics)

  

  分析你的网站是否需要站内搜索

  实际上现在站内搜索在b2c网站基本是标配,但这里仍然唠叨一下网站是否需要站内搜索,或仅仅是搜索而不引擎?

  (1)考虑网站商品的属性:以标准品、常见商品为内容的站点搜索使用率会高;而较偏门的商品,如绣刺、礼品这类B2C网站,用户对要搜索的关键词认知不够,大部分用户建立不起较清晰的心智模型,搜索使用率会偏低。

  (2)考虑网站可能使用站内搜索用户的绝对数,10万级别UV/日的网站,站内搜索使用用户的数量已经比较可观了,需要考虑他们的需求。

  (3)考虑商品类目数量、品牌数、sku数量,根据一点小小的经验,单品牌sku小于500的服装类网站站内搜索使用率远小于5%。

  (4)考虑客户重购率、购买周期(其实本质是考虑新客老客的组成),新客为主的用户,基本是试探性搜索,搜索使用率也偏低。

  总结一下:商品偏门、流量不高、sku少、新客为主的站点,站内搜索基本是摆设,即使要上站内搜索,亦可简单应付。

  这里要提到一点:很多客服经常自己需要用商品款号搜索商品,认为非常需要站内搜索,这不是用户需求,只能说明后端系统没做好。

  通过这么几个标准去判断,你会发现某些网站参考淘宝把站内搜索醒目的摆放在网站最中央显眼处是多么愚蠢!

  2、考虑清楚这两个问题后,你决定要上站内搜索了,那么先简单了解搜索引擎的工作机制

  以下是搜索引擎的工作机制

  爬虫抓取内容——建立(包括新增和删减)索引—储存索引—查询(用户查询)—–查询分析—查询结果排序—呈现结果

  (1)要提到的是,电子商务的信息通过手工录入或其它方式已经导入到了系统,不需要用到爬虫程序。

  (2)所谓索引,是指搜索系统对信息进行加工,把信息转换成搜索系统能快速理解并方便查询的过程。要多哪些内容建立索引、对哪些内容的组件进行索引,是下文要探讨的方向。

  (2)查询分析,这是最有技术含量的部分、涉及到搜索引擎的核心算法,对于中文全文检索,这里又涉及到所谓的分词技术。

  比较复杂,下文亦会做简单解说。

  (3)查询结果排序,这也是较复杂的部分,排序方式多种多样。最常见并合理是“根据搜索关键词的相关性”进行排序,什么是最相关的搜索结果?对同一个关键词,每个人的理解可能不一样,而要通过程序去理解并判定,技术含量可见一斑。最著名的是Google 首创的page rank 排名运算法则。下文也将对b2c的排名算法做简单阐述。

  (4)搜索结果呈现,对不懂技术的人来说,这是最容易把握,并指点江山的部分。下文会做重点阐述。

  为了便于区分什么是站内搜索,什么是站内搜索引擎,这里贴一张分析表格(出处不详):

  

  本文先说到这里,下一篇文章将阐述以下问题

  想让用户搜什么?

  想让用户搜索产品的哪些组建?

  如何平衡查全率和查准率

  为了让用户迅速定位查询的关键词,要做哪些工作?

  要呈现哪些内容组件给用户?

  查询结果的排列方式?

  其它辅助性功能。

  界面设计

原文地址:http://aboutb2c.com/255

时间: 2024-09-17 04:27:56

B2C站内搜索初探—写给不懂技术的你的相关文章

B2C站内搜索初探(二) 写给不懂技术的你

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 接上一篇文章:B2C站内搜索初探一,继续考虑以下问题: 3.让用户搜什么内容? 比较明显,一般b2c网站的内容就是商品.外加部分新闻公告和帮助文章.对于平台性的网站,如淘宝和京东,因为支持店中店,内容还包括店铺和品牌.内容虽然简单,一般是是会简单的对内容做"搜索分区",分区的目的是不让用户在同一个搜索结果列表既看到商品展示

网站分析:B2C站内搜索初探 排序和内容呈现

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 接着上一篇文章<站内搜索初探二>,继续说结构和框架层面的内容. 5. 接着考虑查询结果的排列方式 之前我们的站内搜索完成了关键词的"分析-匹配"过程,现在要对匹配好的结果进行排序.而能进行精准的相关性排序,是全文检索站内搜索的标志.大部分用SQL 语句like查询的站内搜索是按上架时间.按销量.按价格等方式进行

B2C站内搜索初探–排序和内容呈现

接着上一篇文章<站内搜索初探二>,继续说结构和框架层面的内容. 5. 接着考虑查询结果的排列方式 之前我们的站内搜索完成了关键词的"分析-匹配"过程,现在要对匹配好的结果进行排序.而能进行精准的相关性排序,是全文检索站内搜索的标志.大部分用SQL 语句like查询的站内搜索是按上架时间.按销量.按价格等方式进行简单的排序. 按相关性排序是指通过分析查询关键词和文本之间的相关度决定排序,b2c站内搜索结果的排序规则,要考虑以下因素(简单介绍,远远比这个复杂): 1)&

Dreamweaver开发ASP实例视频教程(12)复杂站内搜索

dreamweaver|教程|视频教程 本视频教程由本站合作网站陶益数码工作室http://www.ty502.com推出,欢迎大家访问他们的网站. 使用Dreamweaver开发ASP具有不用手工写代码的优点,非常适合初学者建设自己的动态网站.本套教程由我们精心设计奉献给大家,内容包含了文章整站教程.音乐整站教程.图片整站教程.文件上传系统教程.投票系统教程.会员分级管理系统教程和网站后台管理教程等,通过本教程的学习,相信您一定能很快掌握动态网站制作的方法,从代码的枯燥乏味中解脱出来. 教程介

Dreamweaver开发ASP实例视频教程(11)简单站内搜索页

dreamweaver|教程|视频教程 本视频教程由本站合作网站陶益数码工作室http://www.ty502.com推出,欢迎大家访问他们的网站. 使用Dreamweaver开发ASP具有不用手工写代码的优点,非常适合初学者建设自己的动态网站.本套教程由我们精心设计奉献给大家,内容包含了文章整站教程.音乐整站教程.图片整站教程.文件上传系统教程.投票系统教程.会员分级管理系统教程和网站后台管理教程等,通过本教程的学习,相信您一定能很快掌握动态网站制作的方法,从代码的枯燥乏味中解脱出来. 教程介

再谈compass:集成站内搜索

前段时间已经写了一篇关于compass的文章,相信大家对compass也已经有了一定的了解 由于最近做的项目中涉及到了站内搜索,而且是基于JPA注解形式的,在网上找了好久,关于JPA集成compass的例子很少,有些也是基于 xml的,基于注解形式的甚是少,没有办法只有去compass的官网下载英文文档自己研究一下,花费了一下午时间调试出来,集成到项目中! 在这里给大家分享下,希望大家可以少走些弯路! 1.去官方网站下载compass的jar包,我用的的2.1版本 http://www.comp

使用过lucene.net的进来帮忙看一下,做过站内搜索的帮忙看一下

问题描述 新手,想改一下站内搜索,以前用的是sqlserver的全文索引,想改为lucene.net,建立完了索引,用的是lucene.net2.9.2,配合盘古分词器,能搜,但是结果不是很让人满意.想问下关于如何优化搜索结果的问题举例来说吧,假如我搜"程序员的自我修养",开头基本还算匹配,一共找出一万多条数据,但是后面的数据,都是匹配一个字的,例如"程序员的自我修养"把"大千的世界无奇不有"也给匹配出来了.也就是"的"字都给

关于C#站内搜索匹配的问题,请各位大侠给些指导意见,谢谢

问题描述 tb1词库表:IDtitle10666私家花园10667住宅景观10668屋顶花园10691溪流湖泊10692休憩平台10693活动广场10696儿童游乐10697树阵广场10698生态草地10699植物群落11400岗亭11401现代岗亭11402欧式岗亭11403中式岗亭11405法式岗亭11406英式岗亭11414景观亭11415现代景观亭11420法式景观亭11421英式景观亭11422意大利风格景观亭11423东南亚风格景观亭11424西班牙风格景观亭11425地中海风格景观

ssh 站内搜索 分页显示问题

问题描述 初学者,做的一个网站要求实现简单的站内搜索,我用like,要求是按标题搜索,搜索数据库中的两张表,别的好说,怎么搜索两张表,并把搜索的结果分页显示在一个页面?项目用的是ssh框架,hibernate分页只能是一次查找一张表,分两次查的话,第一次的能查出来,但是一点下一页就没显示了.帮忙看看,谢谢了.仅有的分. 问题补充:andy_javahome 写道 解决方案 我的回答却是与你的需求不符,本来以为你的两张表有关系呢.这个你可以尝试写个试图,将数据查到一张虚拟表里看行不.否则即使取出来