李彦宏“赏花”,看视觉搜索未来!

  在百度第五届Hackathon(百度内部编程马拉松)上, 李彦宏一如既往地参与点评。据百度内部同学爆料,这次李彦宏尤其被一个美女博士领衔的学生团队“赏花宝典”应用所吸引。

  88年美女博士与“赏花宝典”

  据百度同学说本次Hackathon是首次对外开放,有6支校园高手组队参加Hackathon。其中一支名为TAGroup的校园代表队leader是88年美女博士古晓艳,目前在中科院计算所读大数据方向的博士。

  通过主动争取李彦宏的注意,这个团队的Demo(原型)吸引了李彦宏。这个Demo被命名为“赏花宝典”。基于手机拍照实现花卉识别,主动提示百度百科内容;同时还可智能推荐赏花地、导航信息,并引入百度贴吧,方便花友们交流。在百度最大的会议室“五福”,李彦宏详细了解他们的Demo,与四名学生相谈甚欢,主要探讨的是技术问题。这个学生团队最终也摘得“黑马奖”。

  记得在2013年极客公园大会上,李彦宏坦言自己爱好上网,他没说的是,自己还喜欢花草。据说李彦宏最喜欢逛的贴吧不是“李彦宏吧”,而是“白皮松吧”、“植物吧”等等。除了在自家花园种植外,李彦宏连去国外出差也不忘抽空网购植物。

  Robin酷爱花草,这在百度内部已经不是秘密。或许是因为这个,李彦宏被“赏花宝典”吸引。

  还有一个原因可能是,“赏花宝典”与百度正在攻坚的“视觉搜索”有紧密联系,这是一项面向未来但又复杂浩大的工程。

  随着百度魔图凭“PK大咖”功能迅速走红,百度在人脸识别技术的进展获得业界关注。与此相似,“识花应用”也是“视觉搜索”的一种,视觉搜索更直白地说是“以图搜图”。几个月前我曾进行过分析,认为“视觉搜索”是移动搜索的未来。

  百度Hackathon鼓励天马行空,更鼓励解决实际问题。因此,每次产生的上百个创意产品或者半成品,除了要本身创意足外,还要考虑、实用性强,以便参赛成果真正转换为产品,或为产品所用。比如这个识花应用,就可能在进一步突破之后,纳入百度APP的移动搜索当中。

  视觉搜索的难点

  见微知著,“赏花宝典”虽然是个技术demo,却也集中体现了未来视觉搜索技术发展需要解决的问题。

  1. 识别准确率

  视觉搜索在对平面或刚体(书籍、CD、建筑物、油画、明星照片等不易变形的物体)的搜索方面,召回率(反映搜索引擎查得全不全的技术指标)已超过90%;但对“非刚体”的柔性图像(比如动物、衣服、环境)的识别,就对机器算法有更高的要求。

  鲜花属于与动物类似的“非刚性”图像。如果再将范围扩大到植物,识别难度会更大。鲜花之间的区别除了形状,还有大小、色彩甚至细节。据了解,“赏花宝典”目前支持20多类花卉识别,种类不算多,召回率可以接受,但距离百度正式上线的视觉搜索项目还有不小差距,当然,作为24小时优化的成果,这已经是非常赞的成绩了。

  目前识别率较高的垂直领域,很多都已成为视觉搜索的切入口。例如条码、二维码、人脸、图书、CD封面,这些在iOS版的手机百度APP中都已经作为标配置入了。但这也是垂直品类的细分,生活中的物品千千万,类别是无法穷举的。水果、盆景、树木、昆虫等领域都得一个个分别来,百度的程序猿们也必须得根据使用率来排个优先级,否则从此就可以不用睡觉了。

  2.大数据与海量计算

  图像识别需要云端积累的海量数据。百度魔图的明星脸识别之所以能运转,最基础的是百度拥拥有海量的明星图片库。“赏花宝典”4人团队中,也有一个成员是专门负责获取花卉图片库。

  在视觉搜索的服务器端,数据被聚类提取特征。形成“长这样的是什么”的规律,搜索引擎在获得用户上传的图片并提取出特征后,通过比对来了解这个图片的意义。数据越多,规律越准确越细,识别准确率越高。

  从数据信息提取出规律并形成知识,这是“深度学习”技术在做的事情。也就是说,机器像人脑一样思考,自动从海量数据中找出规律来,整个过程中自我完善。有些需要人工纠正干预,有些干脆就是无监督学习。

  百度在深度学习方面布局很早,延揽人才之手早已伸向硅谷腹地,国家千人计划学者余凯、Facebook前资深科学家徐伟、新泽西州立大学统计学教授张潼,均被李彦宏招至麾下。深度学习也不是万能的,要有计算能力和大数据做基础,没有这两样,一切都是空谈。好在,百度这两样都有。

  3.理解用户意图

  视觉搜索当前的流程是上传一张图片,搜索引擎返回结果。这个信息输入往往是不够的。仅仅通过一张图片便知道用户的搜索意图,除了特别信息特别明确的图片,这几乎是机器现阶段难以完成的任务。

  视觉搜索目前的处理逻辑有三种:第一种是默认用户要搜索的是:这张图片是什么?例如宠物狗搜索;第二种是只返回相似图片,不提供具体信息,例如百度PC端的图片搜索;第三种是在特定领域提供个性化信息——图书、CD封面和条形码是比价,“PK大咔”是比对明星脸,赏花宝典则进一步提供社交、知道、百科信息。但这三种都还是“猜测搜索意图”。而不是理解用户搜索意图。

  如何通过识别图片,进而理解用户搜索意图是当前的难点。这与语音搜索遇到的困难类似,语音转换为文字已经相对成熟,但人机对话目前依然停留在很初级的阶段。这也需要深度学习来解决。只有期望深度学习继续带来惊喜了。

  视觉搜索的趋势

  1.与可穿戴设备结合:手机当然是目前使用起来最自然的,可也不能忘了Google Glass,它让拍摄-上传-搜索的流程更加顺畅,百度内部也在加强百度眼镜工程版的调试。不仅如此,后期一定还会出现比眼镜更隐形、便捷的设备。

  2.与语音搜索结合:与人交谈时,我们同时向对方传递视觉信息和声音信息。因此要解决视觉搜索的“一张图无法表明搜索意图”的问题,或许需要与语音搜索结合。例如拍摄菜市场的蔬菜上传时,可以语音问这是什么菜?这个菜适合与什么搭配?这个菜要怎么炒?一步一步逼近你要的结果,而这样的语音交互,甚至可以是多几轮很自然的对话交流。

  3.动态视觉搜索:解决“看一眼”的问题。在移动网络瓶颈消失后,所见即所搜,拍照、上传等带来的延时消失。用户需要的不是拍照,而是要让搜索引擎与之分享眼前所见。现在的AR实景,能算是这类应用的雏形。

  以上种种,都是让视觉搜索变得更自然,或者让“搜索”消失。就好像钢铁侠里面的“贾维斯”一样,这个隐形的管家无处不在,他比你还了解你自己,帮你安排生活,解答问题,与你分享和帮助你认识这个世界。现实残酷,未来依然很丰满。这需要搜索科学家们的持续努力,早日带来我们一种全新的搜索引擎。

时间: 2024-09-14 10:48:01

李彦宏“赏花”,看视觉搜索未来!的相关文章

李彦宏:很多企业的搜索营销靠从百度挖人

摘要: 第五届中美互联网论坛于美国当地时间12月7日上午在华盛顿开幕.图为李彦宏在发言.(童树) 在今天上午的第五届中美互联网论坛上,百度公司首席执行官李彦宏在主题发言中说,多年 第五届中美互联网论坛于美国当地时间12月7日上午在华盛顿开幕.图为李彦宏在发言.(童树) 在今天上午的第五届中美互联网论坛上,百度公司首席执行官李彦宏在主题发言中说,多年来,我遇到困难时,第一件事是去回顾历史,看看别人在遇到危机时的做法.中国互联网企业从美国互联网的创新经验中获得过启发,但中国本土化创新也不断涌现,给整

TouchChina创始人兼CEO沈卓立: 李彦宏的远见让我看到未来

中介交易 SEO诊断 淘宝客 云主机 技术大厅 2012年下半年,国内移动互联网的各种问题确实如李彦宏预言般逐一显现,直到这个时候,沈卓立才真正明白他的忠告所指. 随着移动互联网的发展,国内旅游业迎来了井喷式的发展.眼见酒店机票订购行业正打得不可开交,TouchChina创始人兼CEO 沈卓立在导游导览行业里却难觅对手--用他的话来说,"我们干的是行业里的脏活儿.累活儿,门槛比较高,因为地图上的每一个细节都是编辑们自己跑出来的." TouchChina成立于2010年,<故宫&g

李彦宏谈互联网的趋势与未来

近日,百度联盟峰会在张家界举行.百度创始人李彦宏出席峰会,并向与会联盟伙伴和业界嘉宾分享其关于移动和云的产业趋势展望,并建言互联网产业从业者积极拥抱产业变化,立足业务拓展出自身的竞争优势.对于互联网的发展和未来,行业大佬李彦宏提出了自己的看法. 如何看趋势:不及早考虑商业模式犹如豪车酒驾 就在联盟峰会召开的前一天,有"互联网女皇"之称的华尔街分析师.投行合伙人玛丽米克尔在D10数字大会上表达了对于移动互联网的看好,并认为假以时日,移动互联网的每用户贡献收入将很快超过桌面互联网. 在李彦

看IT大佬的用人之道:李彦宏称从不看毕业院校

又一毕业季!面对严峻的就业形势,毕业生们如何选择自己职业生涯中的第一份工作.找到工作后,初入职场的"新手"们如何能尽快胜任岗位,如何更快的融入企业大家庭,如何知道企业或者自己的老板们需要什么样的人?下面小编为大家搜集了中国知名的企业大佬们的http://www.aliyun.com/zixun/aggregation/7025.html">用人之道,看看什么样的职场新人才能入了他们的"法眼". 柳传志:办公司就是办人 联想控股董事长.联想集团创始人/

360度解读李彦宏:后搜索时代的百度新拼图

中介交易 SEO诊断 淘宝客 云主机 技术大厅 近来百度受关注点颇多,酝酿推出C2C,聘用日本站总裁,以及调整财经频道.搜索已经进入一个相对成熟的阶段,李彦宏正在涉及新的兴奋点. 这种布局不是孤立的,是之前竞争格局的延伸.2000年之后,百度在搜索中寻觅到机会,随后在纷乱中脱颖而出--很难说是百度希望拥有更多的,还是竞争把它往这些方向推. 留学 李彦宏(Robin Li),1968年11月生于山西阳泉市,父母是工人. 他有三个姐姐和一个妹妹.有时候,姐姐们会在院子里支起一块小黑板,李彦宏则在前面

李彦宏:中国搜索市场小到跟国家地位不成比例

"中国的搜索引擎市场与GDP规模太不相称,仍处于非常初级的阶段.如果说这个市场有'极限'的话,20年后再讨论这个问题也不迟."这是百度CEO李彦宏昨天在东莞举行的中国新经济高峰论坛上提出的观点. 不久前发布的DDIC<中国互联网调查报告>显示,2006中国互联网网络广告市场营收中,搜索引擎占到了近1/3的份额.同时,搜索也成为网民使用率(到达率)最高的网络服务.而这次新经济论坛的主要参与者是中国制造业的近百家领先企业,李彦宏在演讲中指出了当今中国制造业产业升级中的"

李彦宏:百度不会一家独大未来搜索竞争激烈

2009年4月17日,百度董事长兼首席执行官李彦宏作客新华社高端访谈和 新华网博鳌论坛前方直播间新华网 邱小敏 摄 新华网深圳3月28日专电(记者 詹奕嘉)百度董事长.首席执行官李彦宏28日在深圳举办的"2010中国(深圳)IT领袖峰会"上表示,谷歌将搜索服务转移至香港之后,百度不会在搜索领域"一家独大",原因在于搜索产业仍在快速成长,互联网进入门槛又不高,所以未来搜索产业仍会竞争激烈. 李彦宏认为,谷歌转移搜索服务的举动不会带来百度"一家独大"

李彦宏:未来搜索产业仍会竞争激烈

新华网深圳3月28日电(记者詹奕嘉)百度董事长.首席执行官李彦宏28日在深圳举办的"2010中国(深圳)IT领袖峰会"上表示,谷歌将搜索服务转移至香港之后,百度不会在搜索领域"一家独大",原因在于搜索产业仍在快速成长,互联网进入门槛又不高,所以未来搜索产业仍会竞争激烈. 李彦宏认为,谷歌转移搜索服务的举动不会带来百度"一家独大"的结果,"有人担心如果百度变得一家独大,会不会以后没有竞争了,会不会以后百度技术进步变慢了,会不会百度用户体验

对话李彦宏,移动百度如何发展?

在日前举办的极客公园创新大会上,百度现任董事长李彦宏发表声明,自己极度重视移动互联端的百度发展,甚至直接参与管理移动部门,每周都开展一次例会.李彦宏希望占据移动端的第一入口,然后向平台化发展,从而建立一个移动互联的生态闭合圈. 开场时李彦宏表示,他并不是一个喜欢经常跟别人打交道的人,也没有想过让所有人都记住自己的名字,这些并不是他所追求的东西.相反的,他更乐意在产品上.技术上.电脑前面花时间,这是本性使然. 在谈及移动互联网对搜索引擎的影响时,李彦宏认为,人对信息的需求并没有发生变化,发生变化的