乔纳森-弗莱切:被遗忘的“搜索引擎之父”

  乔纳森·弗莱切(Jonathon Fletcher)

  导语:英国BBC网站周二刊登题为《乔纳森·弗莱切:被遗忘的搜索引擎之父》(Jonathon Fletcher: forgotten father of the search engine)的评论文章称,虽然乔纳森·弗莱切的大名并不为多数人所知,但全世界首个现代搜索引擎却出自他的手笔。尽管因为种种原因,令他的项目没有持续下去,但他开发的技术却为后来的所有网络搜索引擎奠定了基础。

  以下为文章全文:

  在谷歌迎来15岁生日之际,这家网络巨头已经成为了信息检索的代名词。

  然而,如果你在谷歌上搜索乔纳森·弗莱切(Jonathon Fletcher)的名字,却无法立刻了解他在万维网发展历程中所扮演的角色。当然,也几乎没有什么信息将他誉为“现代搜索引擎之父”。

  但在20年前,在苏格兰斯特灵大学的一间电脑实验室里,正是弗莱切发明了世界上首个采用网络爬虫技术的搜索引擎——无论是谷歌、必应还是雅虎,当今的所有大型搜索引擎工具都使用了这项技术。

  解决搜索问题

  1993年,网络世界刚刚萌芽。全世界首款广受欢迎的浏览器Mosaic发布不久,全球网页总数仅有几千个。但即使是在那时,如何检索网络信息仍是一个未解难题。

  Mosaic有一个名叫What's New的页面,可以在新网站创建后索引这些内容。但问题在于,如果要让Mosaic的开发者发现自己的网站,站长们就必须写信给该浏览器所在的美国伊利诺伊大学香槟分校国家超级计算机应用中心(NCSA)。

  彼时,乔纳森·弗莱切还是斯特灵大学的明星毕业生,刚刚得到了格拉斯哥大学的博士全额奖学金。但就在他启程前,格拉斯哥大学的奖学金却取消了,弗莱切似乎走进了死胡同。

  “我突然之间必须自谋生路,所以我回到斯特灵大学,在技术部找了一份工作。”他回忆说。

  就是在那个岗位上,他邂逅了万维网和Mosaic的What's New页面。

  更好的方式

  在为斯特灵大学建设网络服务器时,弗莱切发现What's New页面存在一个本质缺陷。由于网页是手工添加的,所以无法追踪内容变化。所以,链接很快就会过期,还可能被错误标记。

  “如果你想知道有什么变化,就必须回过头去亲自查看。”弗莱切提到Mosaic的链接时说,“我有计算机学位,而且我觉得应该可以有一种更好的方式,所以我决定写一个程序来帮助我查找内容。”

  于是,便有了世界上第一个网络爬虫。

  弗莱切将他的发明命名为JumpStation。他汇集了一个网页的索引,然后利用网络爬虫展开搜索。这本质上就是一套全自动的程序,可以汇集它所访问和索引的所有链接和所有网页。直到遍历了所有内容,这套程序才会停止。

  10天后,也就是1993年12月21日,JumpStation遍历了所有网页,索引了2.5万个页面。

  而今天,谷歌的页面索引量超过了1万亿。

  搜索的诞生

  弗莱切很快为这个索引开发了一款易于使用的搜索工具,然后将他的网站提交到Mosaic的What's New页面。于是,全世界第一个现代搜索引擎正是运营了。

  “我认为,他是真正的‘网络搜索引擎之父’。”曾经研究过信息检索历史的墨尔本皇家理工学院教授马克·桑德森(Mark Sanderson)说,“很早以前就有人用电脑搜索信息,网络诞生前肯定也有搜索引擎,但乔纳森的搜索引擎却第一个具备了所有现代搜索引擎的元素。”

  然而,当联合创始人谢尔盖·布林(Sergey Brin)和拉里·佩奇(Larry Page)成为家喻户晓的明星时,现居中国香港的弗莱切却并没有因为自己在互联网发展过程中所扮演的角色受到太大认可。

  这或许与他最终放弃了那个项目有很大关系。随着JumpStation的增长,投资需求也越来越大——而斯特灵大学却不愿提供这种支持。

  “它使用了共享服务器,磁盘空间不多,而当时的磁盘又小又贵。”弗莱切解释说。

  控制磁盘空间

  到了1994年6月,JumpStation索引了27.5万个网页。由于存储空间捉襟见肘,迫使弗莱切只能索引网页的标题和头文件,不能索引全部内容。然而,尽管做出了这种妥协,但JumpStation还是不堪重负。

  弗莱切也感到筋疲力尽。“这不是我份内的事情,”他说,“我的工作是让学生的实验室正常运行,干些系统管理和技术方面的零活儿。”

  这时,一份来自东京的工作邀请,提供了弗莱切无法拒绝的丰厚待遇。斯特灵大学几乎完全没有挽留他和JumpStation的意思。

  “我显然没能成功说服他们认可JumpStation的潜力。”弗莱切说,“我当时做了我认为正确的事情,但我20年来总会时不时地回首往事。”

  斯特灵大学计算机和数学系主任雷斯利·史密斯(Leslie Smith)至今仍然记得弗莱切,他承认,JumpStation“领先于那个时代”。他还对BBC说:“斯特灵大学的同事都很高兴他正在因为自己取得的成就获得应有的认可。”

  展望未来

  尽管弗莱切的遭遇令人失望,但他开辟的这项技术却成为后来所有搜索引擎的基础。

  “1993年的网络世界还很小,”桑德森教授说,“当时只要上过网的人,应该都知道JumpStation。”

  “到了1994年年中,人们才逐渐意识到搜索引擎的重要性。谷歌直到1998年才诞生,他们所做的也不过是乔纳森早在1993年就做过的事情。”

  几周前,弗莱切因为他的这项成就在都柏林的一次会议上获得了一些认可,他当时与来自微软、雅虎和谷歌的代表们共同出席了一个座谈会。但在演讲中,他的重点却放在了未来。

  “在我看来,网络不会永远存在下去。”他对听众说,“但寻找信息却会成为一个永恒的话题。”

  “搜索内容和寻找信息的愿望并不受制于任何媒介。”他说。

  当今的媒介为那些追随弗莱切步伐的人创造了巨额财富,但他并不感到遗憾。“我的父母为我骄傲,我的妻子以我为豪,我的孩子因我而荣,这对我来说都是无价之宝,所以我很幸福。”

时间: 2024-10-26 16:31:15

乔纳森-弗莱切:被遗忘的“搜索引擎之父”的相关文章

被遗忘的计算机之父

1941年1月15日,当地的<德孟内斯论坛报>刊登了一幅贝利手持控制器一部分的新闻照片,预告整个计算机内有300多电子管,将于该年年底完成.可是天不遂人愿,就在这时,太平洋战争打响了,日本成功地偷袭了珍珠港,他们的研制工作也因此告吹.阿塔纳索夫本人离开了衣阿华大学,穿上军装,到华盛顿美国海军机械实验室,转入为军队提供技术服务.ABC的整个研制工作中断.留下贝利继续改造两个计算机实物模型. 因此,阿塔纳索夫提出的将电子技术用于计算机的方案,限于当时的历史条件,并未真正造出来,但是ABC计算机模型

站长网播报:淘宝酝酿重大改版 互联网广告遭屏蔽软件颠覆

中介交易 SEO诊断淘宝客 站长团购 云主机 技术大厅 1.微软并购内幕:垂涎诺基亚地图资产 但遭断然拒绝 "新诺基亚"将形成两条腿走路,一条是移动通信设备,另外一条是网络地图服务(Here品牌).在微软收购诺基亚手机业务的交易曝光之后,不少分析人士认为,诺基亚地图并未在交易范围内,是因为诺基亚地图亏损.不值钱,被微软放弃.但是,最近<纽约时报>.AllThingsD等媒体披露的谈判细节显示,微软希望获得诺基亚地图,但是遭到诺基亚拒绝. 2.阿里布局,视频行业多角恋再起变数

Netflix押注大数据:梦想成为流媒体家庭影院

北京时间11月30日消息,<连线>杂志网络版近日刊载文章称,流媒体视频服务提供商Netflix正押注于大数据,梦想成为下一代的HBO电视网,同时又不必让其用户订阅有线电视服务.文章指出,Netflix正在利用数据挖掘和算法来为自己提供一种优势,原因是其拥有由2900万名订阅用户的收看习惯和偏好所组成的庞大数据集. 以下是这篇文章的全文: 里德·哈斯廷斯(Reed Hastings)有一个梦想.实际上,应该说是一种迷恋.这位Netflix首席执行官希望他麾下的流媒体视频服务能成为下一代的HBO电

Netflix被指市盈率超百倍 市场中难寻真正买家

中介交易 SEO诊断 淘宝客 云主机 技术大厅 腾讯科技讯(无忌)北京时间11月3日消息,国外媒体周五发表分析文章称,Netflix当前的动态市盈率达到102倍,在标准普尔500指数成份股当中位列第二位.外加上巨额的新用户增长速度的下滑和巨额的内容承付款项,让Netflix很难在市场中寻找到真正的买家.以下为文章内容摘要: 在对狮门娱乐.Mentor Graphics等公司的收购失败之后,激进投资人.亿万富豪卡尔·伊坎(Carl Icahn)如今必须说服追随者,网络视频租赁公司Netflix值得

KPCB遭合伙人鲍康如起诉:前高管涉嫌性骚扰

合伙人鲍康如 http://www.aliyun.com/zixun/aggregation/16722.html">KPCB前合伙人艾吉特·纳泽尔 北京时间5月23日早间消息,美国风险投资公司KPCB合伙人鲍康如(Ellen Pao)本月早些时候在加州高级法院对KPCB提起诉讼,称KPCB前合伙人艾吉特·纳泽尔(Ajit Nazre)曾对她有性骚扰行为. 鲍康如于2005年加入KPCB.她在诉讼中表示,当她拒绝纳泽尔后,纳泽尔威胁对她的职业不利.纳泽尔尚未就本案做出回应.鲍康如同时表示,

传苹果将推99美分电视节目租赁服务

北京时间8月25日早间消息,据国外媒体今日报道,消息人士透露,苹果正与新闻集团进行密切磋商,有望在iTunes上推出99美分的电视节目租赁服务.其他媒体公司也在与苹果进行类似协商. 消息人士称,用户有望从iTunes上租赁新闻集团旗下福克斯(Fox)电视台的节目,租赁时长为48小时.美国哥伦比亚广播公司(CBS Corp)和迪士尼(Walt Disney)也在与苹果就类似协议进行接触.苹果CEO史蒂夫·乔布斯(Steve Jobs)是迪士尼的最大股东兼董事会成员. 如果协议达成,苹果用户将可观看

KPCB遭合伙人鲍康如起诉:前高管涉嫌性骚扰(图)

KPCB合伙人鲍康如 KPCB前合伙人艾吉特·纳泽尔 北京时间5月23日早间消息,美国风险投资公司KPCB合伙人鲍康如(Ellen Pao)本月早些时候在加州高级法院对KPCB提起诉讼,称KPCB前合伙人艾吉特·纳泽尔(Ajit Nazre)曾对她有性骚扰行为. 鲍康如于2005年加入KPCB.她在诉讼中表示,当她拒绝纳泽尔后,纳泽尔威胁对她的职业不利.纳泽尔尚未就本案做出回应.鲍康如同时表示,KPCB系统性地歧视女性,例如相对于男性初级合伙人,女性初级合伙人只有较少的董事会席位和投资赞助.此外

大数据时代需要有“神器”

身处大数据时代,每天面对纷至沓来的http://www.aliyun.com/zixun/aggregation/17607.html">海量信息,人类的大脑要想迅速找到所需要的所有内容无异于大海捞针,就连所谓的"超级大脑"恐怕也很难做到这一点.不过,欧盟最近新开发出的一种人机交互系统,可以帮助你及时捕捉所需的信息. 大数据时代,每个人每时每刻都在制造数据,我们所处的环境也在产生数据:卫星云图.数字照片.交易记录等等,数不胜数.欧盟最近公布的一份研究报告指出,现在全球每

如何权衡深度与广度

直到近一两年,搜索市场的骚动加剧,不少具创新元素进入搜索市场.国内也有巨头试水搜索市场(比如360),搅动了死水一潭的搜索领域.但是在诸多创新元素当中,最具颠覆性的是这两个:实体搜索和开放搜索. 谷歌的知识图谱已经研制了两年多,2012年五月份才正式推出,目的是实现"直接给出答案"的实体搜索.开放式搜索由中国搜索引擎之父陈沛在2011年10月份提出,目的是把广大的民众智慧融入到搜索结果,实现更加丰富和个性化的搜索. 然而这两者虽然都是搜索界具有颠覆性的创新,也代表了未来的趋势,但是两者