互联网中文搜索引擎之疡

1998年2月25日,“出门找地图,上网找搜狐的”这样的口号响彻那时还只是海归小资们玩弄的中国互联网。掐指一算,已过十年。那一年,张朝阳获得了“全球50位数字英雄”、“年度IT十大风云人物”、全球“明日领袖”等众多名誉。那个时段,众多海归人士回归,其中包括了今日中国搜索引擎市场份额霸主百度创始人李彦宏。

  网络世纪之战 中文搜索引擎的生死门

  提到中文搜索领域,不得不提台湾中正大学吴升教授所领导的GAIS实验室所做的Openfind搜索引擎及北大天网研发的天网搜索引擎。Openfind鼎盛时期同时为三大著名门户新浪、奇摩、雅虎提供中文搜索引擎,但2000年后市场逐渐被Baidu和Google瓜分。2002年6月,Openfind重新发布基于GAIS30 Project的Openfind搜索引擎Beta版,推出多元排序(PolyRankTM),宣布累计抓取网页35亿,开始进入英文搜索领域,自此和中文领域说再见。

  而北大天网是国家"九五"重点科技攻关项目"中文编码和分布式中英文信息发现"的研究成果,由北大计算机系网络与分布式系统研究室开发,于1997年10月29日正式在CERNET上提供服务。2000年初成立天网搜索引擎新课题组,由国家973重点基础研究发展规划项目基金资助开发,利用教育网优势,有强大的ftp搜索功能。主要针对教育领域,注定和商业无缘。

  回顾2000年-2005年这段时间,我们可以看到很多耳熟能详的名字:搜狐搜索、新浪搜索、网易搜索、3721、中搜、百度、雅虎、谷歌、北极星,search163分类目录,goyoyo搜索,chinaren智能搜索孙悟空等等。而其中最为突出的,莫过于3721和中搜。

  周鸿祎的业内流氓软件教父之称的就是起源于3721。周鸿祎对于中国互联网来讲,是个里程碑式的人物,笔者随性翻阅一份简历,毅然读出这样的词汇:中国流氓网络软件或插件的主要始作俑者之一,这个七十年代的中年人,谁也不会想到这个1995年还在到处卖方正电脑的年轻人会在1999年爆发出搜索引擎的潜力。让中国人上网更容易找到信息,开创了中文上网服务,并成功的推动此项服务形成完整的产业链。

  3721的爆发让周鸿祎喜忧参半,用一句成语形容在恰当
不过,“成也萧何败萧何”3721实名采用流氓手段进行自己搜索引擎的推广工作,利用浏览器劫持、恶意捆绑adware/spyware等等。强占了不少用户的搜索引擎选择。其提供的实名服务覆盖了90%以上的中国互联网用户,每天使用量超过8000万人次,拥有超过60万的企业客户。

  而同一时期的还有中搜,中搜自2002年正式进入中文搜索引擎市场以来,中搜(原慧聪搜索)取得了一系列令人瞩目的成绩。在一年多的时间里,发展成为全球领先的中文搜索引擎公司,先后为新浪、搜狐、网易、TOM等知名门户网站,以及中搜联盟上千家各地区、各行业的优秀中文网站提供搜索引擎技术。每天有数千万次的中文搜索请求是通过中搜实现的,中搜也被公认为第三代智能搜索引擎的代表。 当然,同为搜索,陈沛的名头比周鸿祎要小很多。也正因为太
注重技术,导致了中搜一直以来的不温不火。

  同时期,Google、Yahoo等国外知名搜索引擎公司推出中文版,入驻中国互联网市场。而三大门户由于3721和中搜等搜索公司的冲击,逐渐淡出了中文搜索引擎领域。那个时期的百度只是个为硅谷动力等科技类网站提供搜索引擎技术而谋求生存空间的5个人的小公司。

  中文搜索引擎领域的市场份额逆转出自2004年,04年1月,雅虎出资1.2亿美金购买了3721,雅虎在04年6月淡化3721而力推一搜,但因为战略方向错误,使得3721至此失去辛苦拼下来的市场份额。05年8月,雅虎采用资本换股权的方式黯然离开中国市场。留下了一个鸡肋给马云,马云疯狂烧了一亿
多人民币,从门户战略到雅虎就是搜索战略,放弃了又捡回来,捡回了又放弃,折腾之间,把好好的一个搜索市场拱手相让。

  同年,因意见不和,周鸿祎离开雅虎中国,创办奇虎网,摇身一变成为反流氓软件急先锋。周鸿祎在很多场合都在讲流氓教父这个词,他是这样诠释的:“那个时代的中国互联网,谁都在做这样的插件,百度在做、中搜在做、雅虎在做,只是,我做的好一点而已。”推出反流氓软件烧的第一把火就是炮轰原本是自己开创的流氓插件。本为同事的马云和周鸿祎自此成为老死不相往来的冤家。闹的最厉害的时候,周鸿祎甚至放出这样的话,除非马云聘杀手把我干掉,否则休想让我闭嘴。

  在这样的契机下,一直默默无名的百度暗暗发力,悄悄的爬上了中文搜索引擎第一的宝座,到现在就没下来过。

  成就中文搜索霸业的百度搜索

  依靠卖搜索技术残存的李彦宏可能自己也没想到会有如此好的机遇,最少,在04年之前百度没敢这样想。那时候的中国互联网搜索市场还属于3721。

  百度创立初,公司选择了与其他专业搜索引擎略有区别的商业模式:即和门户网站合作,百度按照搜索访问量分成,这种付费模式在当时颇受门户网站的欢迎,包括新浪、网易在内的各大门户网站都采用了百度提供的服务。

  但这种模式很快显示了局限性。门户网站数量的有限性决定了其需求的有限性。2001年初,李彦宏借用了Overtu r e 的“付费排名”搜索引擎商业模式,客户通过购买关键字并进行竞价,决定其在搜索结果中排名的先后,并通过上下文内容分析技术,将广告同时投放于其他顶尖级搜索引擎,与这些合作伙伴共同分享利益。2002至2003年,竞价排名迅速成为百度主要收入来源,2004年百度80%收入来自竞价排名。那一年,发生的很多事情让李彦宏毕生难忘。也正是新浪拒付搜索引擎技术费那时起,让李彦宏决定了孤注一掷。

  从120万美金起家,到1000亿市场价值,让曾经的穷小子变成了互联网大富。也让初期跟随百度的老员工成为了千万富翁。要知道,03年的百度一年就亏损了890万元。我们翻开08年度最新的Q3财报,报告显示,即使是在全球经济发展减速的影响下,百度仍然实现了营业利润的再度翻番,在线客户数量更是比去年同期增长了35.7%,达到了19.4万家。“百度第三季度营业利润的翻番和在线客户数的飙升都显示了,百度新媒体平台的推广优势已经越来越受到人们的认可,付费搜索在中国已经实现了稳定的增长”而这样的增长,超过80%的收益来自竞价排名。

  05年8月6日,这注定是百度人难眠的一个晚上。美国东部时间8月5日16:06(北京时间8月6日6日4:06),百度(Nasdaq:BIDU)上市首日在股市收盘时股价上涨了354%,这一数字为美国股市5年来新上市公司首日涨幅之最。 百度的发行价定在每股27美元,上市时开盘价为66美元,在首日的交易中股价最高曾达到151.21美元,总成交量为22,542,440手。即时是3年后的今天,彪绿了的百度也达到了178.890美元。这不得不说是中国互联网上难得的骄傲,虽然,百度的公司注册地是在英属的开曼群岛。

  面对如此高的市场期待,而盈利过于单一也成为了李彦宏为首的百度之疡,来量相当大的MP3业务就因为提供盗版而遭到七大唱片公司状告。而令百度人骄傲的超过80%盈利份额的百度竞价排名,也麻烦不断。欺诈、猫腻、假点击、不公正等等名词冠在百度头上。挥之不去。

  仅08年一年,国内最权威的媒体,中国国家电视台中央电视台(CCTV)就
曝光过数次百度竞价存欺诈、猫腻行为。引起最大争议还是出在百度赖以生存的竞价机制上。竞争对手甚至冠以不道德这样的词汇对百度进行打击。而网站收录方面,百度越来越重视清理垃圾站点,不断改变蜘蛛爬行算法。许多站点一夜之间被清理的一干二净,从此消失在百度网页搜索里。即使没有被清理的,也在不断的被降权或不在收录。

  “搜索引擎占整个网站流量来路的30%左右、而百度的流量来路则高达76%左右。面对百度,是敢怒不敢言。毕竟,谁也得罪不起这样的搜索引擎。”一名站长在接受Z周刊采访时表示。抱有这样观点的站长为数不少,很多站长因为被百度搜索拒绝收录,只能放弃辛辛苦苦做了半年多的站,重新开始。甚至有诙谐的站长总结出这样一句话,“得罪你的家人也不要得罪百度。”这也讲出了无数站长心里的苦痛。

  “百度永远离破产30天”这样的话语估计现在来看,不单单是警示那么简单。包括徐勇、梁冬、刘建国等,一批为百度立下汗马功劳的老员工相继离开百度。徐勇作为百度创始人之一,离开百度的很大原因就是反对竞价排名。在讨论竞价排名时,甚至为这事李彦宏摔着手机甩下狠话:“我他妈的不做了,大家也都别做了,把公司关闭了拉倒!”事后,很多IT记者都笑称百度80%的收益是李彦宏摔手机摔出来的。

  百度不断扩张的频道也让百度建制过于臃肿,3年时间,百度员工已近5000人,这其中,竞价和市场部门占多席。从单纯做搜索,到B2C、IM、财经、娱乐、新闻,百度无孔不入。已逐渐脱离了百度只是搜索的理念。

  还有不得不提的就是百度公关部门,一个飞扬跋扈但怎么也找不到脑子的公关部门,进入08年10月以后,百度公关部门忙碌异常,“百阿大战”、“三鹿门”、“保护门事件”、“造谣门”等等负面已把百度推向风口浪尖。这让一向负面言论较少的百度摸不着头脑。越来越多的麻烦和删不完的负面使得公关部门被高层频频指责不作为。由于平时疏忽与写手以及站长的沟通,鲜见有站长站出来为百度说话。甚至有写手表示,百度给
多少钱也不写。惹不起,躲的起。这是很多站长的心声。

  不作恶和不作为的Google

  谈到Google(谷歌),
首先想到的是Google的信条:不作恶。这个在美国的巨无霸搜索公司,来了中国以后,日子并不是那么好过。一直以来,被竞争对手打压着。事实上,2000年9月12日Google就推出了简体和繁体两种中文版本,开始为全球中文用户提供搜索服务。但只到2005年7月19日才正式在中国建立工程研究院。

  2006年4月12日,Google公司行政总裁埃里克 施密特在北京宣布该公司的全球中文名字为“谷歌”。同时,Google公司于2006年2月15日在台湾地区登记之分公司取名为“美商科高国际有限公司”。此前,在一份中国国际经济贸易仲裁委员会域名争议解决中心裁决书中,公司被称为“科高公司”。该公司亦拥有“谷歌.cn”、“谷歌.中国”、“咕果.com”(但不拥有“咕果.中国”及“咕果.公司”)等中文域名。尽管中文用户在除其英文名外更常称Google为“古狗”或“狗狗”,其中文域名“古狗.com”、“古狗.cn”、“古狗.中国”等均已被其他公司抢注。此外,Google在北京的分公司曾使用“咕果”作为合约签订以及网络招聘的中文译名。北京时间(UTC+8)2006年4月17日凌晨1时左右,Google简体中文网站正式出现“谷歌”字样。Google中国对“谷歌”的解释是“播种与期待之歌,亦是收获与欢愉之歌”,并称此名称是经Google中国的全体员工投票选出。谷歌”发布不久,即遭到很多用户的批评。随后,部分中文用户发起反对“谷歌”的网上签名活动。但Google中国坚持使用“谷歌”作为正式名称,但在实际中仍然存在“谷歌”、“Google中国”混用的现象。

  Google提供员工免费餐点,早中晚餐全包。若要往来于办公室之间,员工可骑乘 Segway电动滑板车,或者GreenMachine车。巧克力、懒人球(一种开会用的座椅,球状)以及巨型积木随处可见,使这里更像是托儿所。公司里面设有牙医与家庭医师,请育婴假的员工可照领75%的薪水,婴儿出生后两周内,公司每天补贴50美元当作员工的“坐月子”津贴。除此之外,公司还提供免费的班车和渡轮服务接载雇员上班,这些交通工具都有无线互联网服务,方便员工在上下班时也可以工作。不得不承认,Google的公司文化是极受国人推崇的。但除了这些企业文化,在中国的Google更多的,是让无数人的无奈。

  相比较百度的竞价排名,Google的AdWords关键字广告采用的是右侧显示。这也是Google一直标榜的绝不影响自然搜索的准则(非政治因素外)。AdWords也遭遇了被用户冠以不公正、欺诈的恶名,但相比较百度,显然Google可以好好偷笑一会。虽然,Google的搜索市场占有率不足三成。

  Google在华业务争议最大的,莫过于Google AdSense用户。这个让中国站长们又爱又恨的联盟产品,相对于国内联盟出现的扣量、拒付、消失等不和谐因素,AdSense的出现让站长们欣喜若狂,在Z周刊第24期专刊文章《Google AdSense的中国这三年》中,详细描述了中国站长们对AdSense爱恨交加的纠结情感。

  曾经,周鸿祎因为惧怕Google而放弃了搜索。曾几何时,李彦宏的百度公司的电脑里默认搜索是Google,甚至一段时间李彦宏宣传百度的时候,会使用这样的句子:我们也可以做的和Google一样优秀。但面对Google的中国三年,市场份额不升反降的窘境。Google只能用一句Google还不足够懂中文来诠释。尤其是不懂中国的媒体。甚至有业内专家对李开复进言,劝他离中国媒体远一些。

  中文搜索引擎之间的角逐

  2008年中国
搜索引擎营销市场规模将成长为52.6亿元,年同比增长74.4%。2007-2008年是中国搜索引擎营销理念开始被广为重视的一年,而在未来伴随着越来越多大品牌广告主在搜索引擎上的广告投放,营销理念和实施手段都会出现较快的新陈代谢,未来
五年将是中国搜索引擎营销迅猛发展的阶段。

  百度和Google这两个中国互联网搜索市场上的竞争对手,分别以别样的企业文化和盈利手段在互相较劲着,从CHINAZ发布的中小网站搜索引擎市场份额占有情况上看,百度的市场占有份额领先Google 3.5倍之多,但Google也可以偷笑百度不够专业。

  商业公司的核心竞争力就在于公司的盈利状况上,不管Google纳斯达克的股市如何牛,即使偷笑,李开复也不能
轻松笑对在华糟糕的业务份额。尤其是在次贷危及时期。Google的业务大部分来自中小对外出口企业。而次贷危及受损最大的正是出口企业。

  一种是直接的竞价模式,一种是右侧显示的关键字广告模式。Google在华授权代理商为二十六家,百度明显更多。面对垂直搜索的冲击,Google高管表示,为赢得亚洲市场占有率尤其是中国市场占有率将展开持久战,事实上,Goolge一直在打持久战。

  虽然,作为二线阵营的中国雅虎、网易有道、搜狐搜狗、中搜们一直以来并未被业界看好,但谁又能保证它不会在近两年内雄起?毕竟,互联网行业是个奇迹倍出的行业。

  面对不断攀升增长的搜索引擎市场规模,太过单一的盈利模式、网页收录爬取的算法变化,让各大搜索前进一小步都如履薄冰。如李彦宏说的,搜索引擎好不好,还得看page view。不管是不作恶也好,还是不作为也好,在商业公司看来;最重要的,依然是page view。谈到最后,亦然发现,原来,搜索引擎是商业行为。

  后记:中国互联网故事里注定离不开搜索引擎这个篇章,由于笔者水平有限,对于博大精深的互联网行业知之甚少,文笔难免显的幼稚。洋洋洒洒几千字综述出来的观点也仅仅是搜索引擎之疡罢了。这篇文章中提及的也仅仅是搜索引擎市场中的冰山一角,由于时间的限制,并不能全局、宏观的阐述整个中国互联网搜索引擎格局,更多的,还得留给更有才华的人来完成。

  百度是众多中小企业和站长捧出来的站点。当然,现在的百度和2004年前的百度不可同日而语,最近,百度又在调整算法,看到大面积倒下的站点,更多的,也只能是无奈和惋惜。希望百度能多点照顾下中小站长。

  谷歌来到中国以来,一直和中小站长密不可分,AdSense确实帮助了很多中小站长,就好像网易的SP业务,使得中国互联网繁荣起来,让一部分中小站长富裕了起来。实现了很多中小站长的梦。但近年的AdSense已不是两年前的AdSense,虽然瘦死的骆驼比马大,但也请谷歌在多点扶持下中小站长。

  广大的中小站长离不开搜索引擎,没有搜索引擎也就没有这片欣欣向荣的景色,缺少了中小站长的互联网也不可能会流光溢彩。对于搜索引擎,骂也好,怒也好,都是爱。不带功利性的爱。2009年的中国互联网注定了是中小站长的冬季,在这样的情况下,是该中文搜索引擎们挺身而出的时候了,不断攀升的网民数证明了中国网络市场前景巨大。问题是,没有了中小站长支持的网络市场,还能是市场吗?(文/令狐孤)

时间: 2024-09-20 20:21:20

互联网中文搜索引擎之疡的相关文章

中文搜索引擎的十大误区-搜索引擎技术

误区1.网站目录就是 搜索引擎 网站目录通常是经过人工分类的有系统的网站列表,通常附带有搜索功能.网站目录就是搜索引擎的名词始于雅虎,雅虎初创时就是只有一个网站目录.当然很快就通过外包的形式增加了网页级的搜索.中文网站提供目录搜索的远多于提供网页搜索的,加之媒体的各种炒作,许多网民误以为网站目录的搜索功能就是搜索引擎. 在美国,因特网搜索引擎通常指的是收集了因特网上几千万到几亿个网页并对网页中的每一个词进行索引的搜索服务系统,是基于网页的全文检索系统.误区2.搜索引擎就是门户站点 如果你要提供搜

中文搜索引擎大战 百度稳居首位雷打不动

中介交易 SEO诊断 淘宝客 云主机 技术大厅 站长网消息:搜狐首席执行官张朝阳表示,搜狐可能会将旗下的搜狗搜索业务分拆出去,并且决定不再出售更多股份,因为搜狗已经获得了阿里巴巴集团的投资.目前搜狗是中文第三大搜索引擎,仅排在百度.中国谷歌之后,百度至今稳居首位,雷打不动.目前网友常用的中文搜索引擎有百度.谷歌中国.搜狗.搜搜.雅虎中国.有道等. 一.百度 百度是全球最大的中文搜索引擎,2000年1月由李彦宏.徐勇两人创立于北京中关村,致力于向人们提供"简单,可依赖"的信息获取方式.&

百度搜索份额继续雄踞最大中文搜索引擎地位

日前,调研机构艾瑞咨询发布了最新的搜索引擎市场调查报告.数据显示,2009年第一季度,百度的网页搜索请求量市场份额高达74.1%,较上季度的72.0%上升了2.1%,继续雄踞最大中文搜索引擎地位. "在2009年第一季度,中国搜索引擎之间的竞争持续加剧,而在该领域占据绝对优势地位的百度,依然保持着高速的增长势头."艾瑞首席分析师曹军波指出,预计到今年第二季度百度推广(凤巢系统)正式推出后,百度在搜索领域的领先优势还将继续扩大. 领先源于持续积累 在众多业内专家看来,正是由于百度多年以来

分析:中文搜索引擎百度排名初步观察

百度|排名|搜索引擎|中文 这半个多月以来,我比较注意我的博客在百度的排名.原因当然是我准备优化中文网站,而百度目前为止是占有最大市场份额的中文搜索引擎. 以前因为都是做英文网站,所以没有太注意百度等中文搜索引擎.这半个多月的观察,有一些小小的心得和大家一起分享讨论. 第一,百度蜘蛛极为活跃.从服务器日志文件分析来看,百度蜘蛛抓取的频率和数量都非常大.百度蜘蛛每天都会访问我的博客,并且至少抓取几十个网页.我的博客只开通了不到一个月,网页数目有限,可见百度蜘蛛的活动已经相当可观了.看来海量抓取是百

案例分析:探讨国内中文搜索引擎的异同

网络推广分为很多层次,而网站优化排名是最常规的网站推广模式,它具有成本低.精准高的特点.下面我们需要来认识一下国内中文搜索引擎各自有哪些特色和 当前,国内目前有八个正常运营上线的搜索引擎,它们包括百度.搜狗.360.搜搜.即刻.有道.云云和盘古.由于盘古的首页更加门户化,而其由于中移动背景致使其更为注重移动互联搜索的方向,在这里就不加以对比了. 一.360搜索是2012年8月16日推出的,9月21日正式成立独立so.com域名.前期360搜索的算法和百度老算法具有一定的相似性(360拥有一搜的基

2013年母亲节 赏析中文搜索引擎庆祝涂鸦

母亲节是一个子女感恩母亲的节日,目前所知最早的母亲节起源于古希腊.在这一天,古希腊人向希腊众神之母赫拉致敬.其后17世纪中叶,节日流传到英国.在这一天里,出门在外的年青人会返家,送给母亲一些小礼物. 我们知道搜索引擎在特殊的节日中都会更换首页的涂鸦来庆祝,在2013年的母亲节也不例外,今日各中文搜索引擎也更换了首页的涂鸦来庆祝这一节日,下面我们就来赏析一些这些美丽且有纪念意义的庆祝涂鸦. 一:百度庆祝涂鸦 上图我们看到的是今年百度的庆祝涂鸦,涂鸦中我们可以看到有一位母亲正在织毛衣,一个孩子正在把

“互联网・中文・新时代”中文顶级域名腾飞计划

京华时报讯(记者王硕)昨天,由中国互联网络信息中心(CNNIC)主办的"互联网・中文・新时代"中文顶级域名腾飞计划全球路演启动仪式在北京举行.从本月起,中文新通用顶级域名".公司".".网络"正式开放注册,这是继2010年".中国"作为国家顶级域名.也是第一个中文顶级域名被正式纳入全球互联网根域名体系以来,中文顶级域名在全球战略部署取得的又一重大进展. CNNIC负责人李晓东表示,这一计划将普及中文域名各项应用,助推以&quo

中文搜索引擎的研究-搜索引擎技术

目前搜索引擎的应用越来越广,是网民的上网必备工具.   在中国使用广泛的搜索引擎主要有:baidu google 中搜 北大天网 一搜 搜狗 还有一些专业的搜索,比如海量做的音乐搜索 http://www.1234567.com 还有 西祠胡同 的创始人 做的 http://www.pagou.com ,这些都是做的挺不错.由此可见,搜索引擎的市场还是非常庞大的.尤其是baidu的成功上市,给业界很大的鼓舞.   目前的主要搜索引擎的模式都是,用户输入一些关键字或者句子,无论是那种,搜索引擎都会

怎样针对百度中文搜索引擎进行网站优化?

现在很多的站长,优化爱好者都在谈怎么给自己的站点做优化,什么叫优化?讲的白话一点,那就是利用自己站点的相关资源去换取搜索的好感而获得很好的反馈流量.现在网络上充斥着各种各样的教程和优化心得.都有可取之处,但往往和多新手朋友看了以后又觉得很茫然.无从下手.狐狸今天就从自己的站点的优化方式来谈谈搜索优化到底是个什么东西.本文所谈优化只针对中文搜索引擎百度,文章仅供讨论研究,无任何学术见解.欢迎更多朋友一起讨论. 第一篇:域名选择和目录分层 有看官问:选择一个域名还能对搜索有啥影响啊?反正域名能用就行