引子
某个细雨濛濛的午后,他独坐在这座城市的某个咖啡吧中,一声清脆的铃声,推门而入一位背着画板的MM,清丽不可方物,他觉得似曾相识却无法想起在哪儿见过,随即悄悄拿起手机拍了一张还算清晰的照片,导入某个APP,一秒钟后,这位MM的详细资料便显示出来,他这才发现,原来是十年不见的老同学韩梅梅,于是走过去……
“好久不见……”
“你是?”
“李雷。”
灯光,音乐,景深,YY
……
传统的图片搜索,实现方式是通过描述关键字(描述性文本)匹配图片关键字(与图片关联度较高的文本),也就是说,现有的图片搜索功能(如Google、百度的图片搜索)在本质上还是文本搜索。然而,上面剧情中李雷同学所用的利器却是通过“图片源”搜索信息(包括图片和文本),如此激动人心的技术,会有怎样的应用前景呢。
先看几个有意思的产品
1、Retrievr
Flickr的老用户肯定对Retrievr不陌生,这是业内较早提供图像搜索图像服务的网站之一。
Retrievr提供了两种搜索方式,一种是涂鸦搜索,用户可以通过一个小巧的涂鸦编辑器来绘制图像的大致轮廓(有点类似模糊搜索);另一种方式是图片上传(本地和URL两种模式)。简单来说,是将搜索目标与Flickr的主服务器上的图片数据库作比较,根据匹配规则找出近似图。其实,Retrievr的识别性并不高,而且只是针对于Flickr中的相片进行匹配过滤,并不实用,目前比较适合看做Flickr平台的休闲拓展工具。
2、Tineye
相比Retrievr并不实用的搜索功能,Tineye则靠谱的多。它是Idée公司(就是设计那款很NB的PixID的母公司)开发的图像搜索网站。它所提供的搜索方式和Retrievr一样,上传本地图片或是提供在线图片的URL。TinEye 还为 IE、Chrome、Firefox 等浏览器提供了插件和收藏夹脚本按钮,用户可以在浏览器中使用右键菜单搜索相似图片。
官方数据显示,截至2010年7月19日为止,Tineye的数据库图片已达约16.3亿张,用户甚至可以通过一张源图来搜索同类型的图(如杂志)。
反向图片搜索引擎
这种以图片作为搜索源的技术可称之为“反向图片搜索引擎”,最具代表性的是Google的“景物搜索”试验性产品 Goggles(它可以对用户上传的图片内容进行分析,可辨认书籍、音乐专辑封面、绘画、地标、场所和企业商标图案等)。
Google负责工程技术的副总裁维克·古德特拉曾表示:“我们最终的目标是可以对任何图片进行识别。这项技术是我们在‘计算机视觉’领域最初的研究成果(计算机视觉是指用摄像机和计算机代替人眼对目标进行识别、跟踪和测量等)。你可以对着景物拍照,然后用你拍到的照片进行网络搜索。
反向图片搜索引擎的使用场景非常复杂,这里先列举3个:
1、“以图找图”,这种情况最常见,例如我们在网上看到一张非常喜欢的图,可惜尺寸太小或者图片本身的质量不高,这时候就可以上传小图文件来搜索高清大图。
2、通过局部图片搜索全图,例如对考古比较感兴趣的朋友可以根据某张文物“残卷”来搜索整幅作品。
3、随着移动电子商务的发展,图片搜索服务的需求显得愈加迫切。试想一下,在逛街的时候忽然发现某个非常有意思的小东西,随手拍照,上传到淘宝,刹那间出现华丽的list……
市场动态
面对这么诱人的市场,IT大佬们当然不会闲着。
2009年,在Google发布Goggles的同时,Bing 投入了自己的图像搜索技术;之后,Google又先后收购了Plink和Like.com。
Plink:曾开发了移动版的图像搜索引擎 PlinkArt,这是一款基于Android移动平台的应用,它可以帮你搜索到你用手机摄像头拍下的艺术品的相关信息。
Like.com:以前是一家名为Riya的开发面部识别技术的公司。
国内方面,阿里巴巴集团投资的图片搜索网站“淘淘搜”日前已经上线,目前只是针对部分女装类目进行搜索;百度的新产品“识图搜索”(目前处于内测阶段:shitu.baidu.com),也即将上市。
技术局限
曾经和一位图片搜索领域的专家聊天,得到的反馈是以目前的技术,也只能有限地搜索刚性物体(如建筑,书本等),而材质、颜色、相对坐标什么的都不靠谱。另外,图片搜索≠图片检索,只有当可用数据达到百万级别时,才称之为“搜索”,所以,移动互联网应用领域的“图片搜索”(如手机拍照的图片搜索功能)的最大瓶颈,在于没有以“亿”为当量的可用图片数据。
换句话说,反向图片搜索的技术局限在于没有一个针对整个互联网云端图片数据库的统一的匹配标准,这就导致大多数图片搜索产品只能服务于自己的数据源,玩小众,拓展性不强。
图片搜索与移动电子商务
随着移动互联网的腾飞,基于移动平台的电子商务将在未来的几年内出现新的行业井喷。其实,人们对新型移动购物体验的探索从未停息过。
如基于音频识别技术的Shazam Encore,可通过录入现有的音乐,解析并搜索到音源文件,最后连接到音乐网站完成购买。——听觉引导型购买体验
再例如TinEye Music,只要用iphone拍摄CD封面,软件就会用这张照片在iTunes、allmusic.com、YouTube和Wikipedia内搜索这张cd的所有信息。你可以试听专辑,查看专辑评价,也可以从搜索结果出发直接购买这张CD。——视觉购买型购物体验
因此,只要对应的购物平台有能力撑起所有产品类目的图片归类,并且能形成一套比较完备的图片匹配规则,这一块的商业市场完全可以用“无限”来形容——这将是对传统购物体验的革命性颠覆。
零碎的思索(感谢小柒同学分享心得)
1、在尚未实现精确匹配之前,反向图片搜索引擎应该配合辅助筛选控件来运用,即上传图片的时候,还可以输入其他筛选信息,提高搜索结果的精确度。
2、除了复杂的筛选控件,还可以通过更完善的推荐系统和匹配规则来提高搜索结果的精确度。(关于推荐系统,将在后面的文章中详细探讨)
来源:http://mdchina.org/?p=184