垂直搜索新问题

当大家都在关注搜索的速度的时候,往往伴随业务的快速发展,数据服务质量成为了实时搜索或者垂直搜索中的新问题。实时搜索和垂直搜索是不一样的问题,下面的问题就是垂直场景下得实时搜索问题。也可以理解垂直搜索都不实时,其他的实时先排队吧。问题比较抽象,只谈总体上的现象,对于具体如何解绝问题的细节,不做说明。有些不具有通用性,有些和场景相关,很难有最佳方式,不代表没有解决方法。首先是有问题意识,然后自然有解决方法。

问题:
(1)个性化排序
伴随业务发展需要,同时细分用户群体,为了最大程度优化服务质量、满足更大群体的具体业务场景,个性化的排序越来越引起高度重视。传统的文本相关性只是第一维的参考,针对业务多维度综合得分的二维排序最终影响排序。而一个平台上面临的服务群体、服务场景多种多样,有行业属性、地域属性、技术属性、运营属性等,很难完全统一,完全归一化到一个计算公式中去。相反,针对类目、行业等属性,局部优化,影响和改进进度和风险都大大都到控制。应用更希望有针对性的个个优化,而不寻求一个统一的模型,兼容各方面维度需求。

对于引擎来说,单维度排序实现是比较容易的,但是当出现10个、20甚至50多个维度的时候,索引结构变得臃肿,schema管理起来费劲。

另外,直接单维度原始值,非常容易引起作弊,从而影响公平性。这是个性化排序需要深入防范的,在突出重点因子的时候,是需要平衡其他因子的,否则钻孔子、作弊就会影响服务的客观性。

(2)一致性
由于垂直,使得业务领域或者边界相对来说比较清晰。业务的主体属性、主体行为,相关的结果某种程度是可控的。但是一个垂直平台上绝不是单一的一个服务,相反是高度聚合的相关联的、专业的、全面的服务产品。从入口到帮助到离开,与核心应用相关的各种辅助、促进、支持的信息一应俱全。而具体服务满足个性化、特殊阶段等需求,使得数据存在某些不一致性。而这种不一致性,伴随应用扩展,更加清晰。

例如
图片的分类和文本描述的不一致性,图片的文本属性和图片直观的感受不一致,具体商品的价格和排序的价格或者标榜的价格不直接吻合,可能只有店铺中得一件商品是哪个最低价,误导用户全部商品都是哪个最低价。频繁的来回修改属性、风格、模板等,为了争取排序机会,而实际有效变动很少,变动的贡献值的度量化变得复杂。个别用户的粉丝、关注呈异常增长趋势,这与业务总体趋势极为不一致,对突发和非常规的监控成为垂直场景中,最容易忽视的环境。因为这些不一致不影响功能,似乎被认作锦上添花之举。实际上,各个创业公司在细分市场上打拼,玩的就是细致、专注、一丝不苟。当一致性的存在被放大或者默许,高质量的信息就会被稀释,甚至完全淹没。为什么很多应用前景都是乐观的,而实际总是没有大的突破,我觉的和细节处理有很大关联,只追求上线的那刻,忽视了后续持续的质量提升,因为后面的工作好比鸡蛋里找骨头。

(3)数据挖掘
没有挖掘的搜索,最终就是一个弱化的存储。没有挖掘的垂直市场,应用迟早断送了用户群体。垂直化数据本身就非常具有一定局限性、自包含性、内容为主型。在平台上,不推新破旧,不时时对用户提供小惊喜,热度过后,口碑是否能持续和忠实粉丝不流失,不得不考虑。如果只是短期应付,不考虑更长期的发展,这个产品走不远。垂直的应用往往可以简单理解为一个工具,一个工具最重要的是轻巧、舒适、小创意。体验为王!

(4)归一化
信息来源的丰富,评论、分享、图片、商品、转发、关注、粉丝、交易、成交、更新、价格....
既有具体维度的需求,也有综合维度的需求。需要对多来源信息贡献值进行归一化。好处就是,提升默认排序的质量,减少交互或者导航的成本,通过首页的高质量信息,逐步在用户阅读、浏览过程中,自然的导航到准确或者扩展信息源。避免页面过多的选择、点击或者跳转。这个与目前垂直的"丰富性"“明确性”似乎背道而驰。在本身边界、业务场景相对单一的场景下,继续追求统一、简单,显得有点“强人所难”。如果说做到什么样的归一化最好呢,可以拿手机体验做参照,页面可以做到和手机一样的体验,归一化就差不多到位了。这是个人理解的,不一定合理。

另外,归一化后,垂直服务对为输出可能更容易维护。利于,有归一化度量的“用户质量”(关注、粉丝、分享、评论)或者“特征集”(分享兴趣、关注兴趣、转发兴趣等),这样其他垂直对用户排序可以参照用户质量,对用户关联推荐,可以直接引用特征集等。

归一化和挖掘输出紧密关联,归一化细分更多、更丰富丰富,挖掘就更加容易发现和输出新内容。

所有这些问题,最后离不开搜索的支持,离不开索引的设计、排序的优化。

时间: 2024-10-31 14:48:36

垂直搜索新问题的相关文章

中国搜索悄然上线:垂直搜索演变成导购网站

3月1日中国搜索突然上线,其前身据说就是即刻搜索和盘古搜素,也就是说这两个搜索引擎已经悄然合体了.与视频行业类似,搜索引擎也迎来了合并和收购,新的中国搜索被誉为"垂直搜索",在中国搜索上有很多垂直频道,目前开发的有地方.国际.体育.房产.汽车.购物等.比方说进入购物频道,然后就可以看到一个类似淘宝客的导购网站,选择产品后,付款的时候会跳转到1号店.京东商城等电商网站,但笔者唯独没有发现跳转到淘宝网的.估计是中国搜索没有和淘宝网合作,当然这是笔者猜测的. 笔者是个站长,整天与百度打交道,

垂直搜索的前途慢道

我最早接触到垂直搜索引擎是在05年,那时候我在教育中国网负责推广,和go2work有过技术和内容上的合作.淘职网是一个工作搜索的垂直搜索引擎,虽然那时候他们也是刚刚起家,但思路却很清晰,那种洞察力很令我佩服. 垂直搜索引擎相对于传统的搜索引擎新型搜索技术,它对网页信息进行了结构化信息抽取,将网页的非结构化数据抽取成特定的结构化信息数据,好比网页搜索是以网页为最小单位,而垂直搜索是以结构化数据为最小单位.然后将数据进行进一步的加工处理,去重.分类.分析处理等,最后分词.索引再以搜索的方式满足用户的

垂直搜索的诱惑,抄袭的故事

炒的如火如荼得数IT这个世界,分的再细一些那就是互联网这个虚拟东西,被多数人给忽悠了,前段时间突然来了抄袭事件,本来对这方面没多大关注,现在看来,抄袭已成为互联网企业生存的理念及法宝了. 首先是标题吸引了老娘"GOOGLE抄袭什么酷讯,--",震撼,不知道谁抄谁呀,什么酷讯,这个话题偶还有头一次听过,做这多久的搜索还是第一次,不是我的视界小,是他们做的东西不值得让老娘去关注,狗屁大就想炒作,一点羞耻感也没有,真为它感到悲哀! 垂直搜索做的最早的应该是百度,只是大伙一直蒙在鼓里,只知道百

职位垂直搜索的问题不是钱就能够解决

解决|问题 早上和艾瑞研究部一位朋友探讨了职位搜索市场的现状与未来,从职友集创立已开始我就负责其产品等相关工作,所以,我比较关注这个领域的一些东西.2006年,是网络招聘领域一个不平静的一年,打破了以前一谭静水的局面,很多新的产品.服务突然之间涌了出来,国外类似领域的融资案例不断出现,也导致了国内这个领域的不端升温.   回头看,单纯职位搜索市场看,从2006年初出现了职位搜索引擎这种新型的网络招聘产品服务模式类似职友集.搜职等都是这样的公司,在2006年中又有几家类似的网站出现,大家的模式以及

细分领域深度挖掘 十家值得关注的国内垂直搜索网站

中介交易 SEO诊断淘宝客 站长团购 云主机 技术大厅 [导读]垂直搜索相对于通用搜索的潜力,就在于它们希望在一个细分的领域实现深度资源的挖掘. 腾讯科技讯 Lois 11月29日报道 搜索一直被视为巨头游戏,国内仅百度一家就占据了半数以上的份额.但不可忽视的是,在巨头之外,特别是在垂直搜索领域,仍然有不少创业小公司非常活跃.今天就有消息称,刚上线数月的电影搜索和推荐引擎"今晚看啥"最近被百度收购. 虽然这些垂直领域的搜索产品往往面临被收购的命运,但对"垂直搜索"产

垂直搜索构架基础:什么是垂直搜索

垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户.   垂直搜索引擎和普通的网页搜索引擎的最大区别是对网页信息进行了结构化信息抽取,也就是将网页的非结构化数据抽取成特定的结构化信息数据,好比网页搜索是以网页为最小单位,基于视觉的网页块分析是以网页块为最小单位,而垂直搜索是以结构化数据为最小单位.然后将这些数据存储到数据库,进行进一步的加工处理,如:去重.分类等,最后分词.索引再以搜

让用户更方便的获取生活实用信息–垂直搜索发展之道

无线运用迅猛发展,可谓前景大好,基于无线的应用更是层出不穷,就拿生活实用信息查询来说,国内知名的口碑.58.普加.爱帮等生活信息垂直搜索早已推出了wap版的运用,个别站点还优先推出了各种平台的客户端,信息量也都很庞大,还有一些更垂直的公司推出了各种基于手机平台的客户端运用,查餐馆.查酒店.查公交-大部分还都能基于位置:但是真正用wap.客户端来搜索生活信息的用户却非常少,什么原因呢? 没有需求?订饭店.住宾馆.租房.找保姆.招工.求职.查号码.开锁.查公交-应该说需求无处不在,尽管很多需求都可以

垂直搜索的归宿

[英雄看互联网2008-1121] &http://www.aliyun.com/zixun/aggregation/37954.html">nbsp; 垂直搜索的归宿 早几年的互联网,大约是2005年的时候,垂直搜索引擎着实火了一把,那个时候百度爆发出了巨大的能量,业内都看到了搜索的威力,于是垂直搜索成为了投资界的宠儿.不只是酷讯的火车票搜索,房产类.汽车类.求职招聘类的.各行各业都大量涌现出来,可以说垂直搜索百花齐放. 而时间过去了3年,到现在2008年底,垂直搜索引擎并没有出

关于垂直搜索领域的问题

问题描述 关于垂直搜索领域的问题 新人求问,垂直搜索领域有哪些网站做的比较好?在整个搜索领域,会和其他领域一样,越来越重度垂直化么? 解决方案 google.百度的数据来自互联网.通过spider工具爬取得来.获取的网页通过去重,去除垃圾网站,最后通过适当的排序排序算法呈现在用户面前. 而垂直搜索的数据多数需要大量手工或者半自动化的处理,搜索的准确性.质量得到很多的提高.但是分析那些数据已经更新,如何得到新的数据,面临很多的困难. 可以简单的认为,web搜索引擎的数据来自一个开发的互联网系统,数