反向图片搜索与移动电子商务

引子

某个细雨濛濛的午后,他独坐在这座城市的某个咖啡吧中,一声清脆的铃声,推门而入一位背着画板的MM,清丽不可方物,他觉得似曾相识却无法想起在哪儿见过,随即悄悄拿起手机拍了一张还算清晰的照片,导入某个APP,一秒钟后,这位MM的详细资料便显示出来,他这才发现,原来是十年不见的老同学韩梅梅,于是走过去……

“好久不见……”
“你是?”
“李雷。”
灯光,音乐,景深,YY
……

传统的图片搜索,实现方式是通过描述关键字(描述性文本)匹配图片关键字(与图片关联度较高的文本),也就是说,现有的图片搜索功能(如Google、百度的图片搜索)在本质上还是文本搜索。然而,上面剧情中李雷同学所用的利器却是通过“图片源”搜索信息(包括图片和文本),如此激动人心的技术,会有怎样的应用前景呢。

先看几个有意思的产品

1、Retrievr

Flickr的老用户肯定对Retrievr不陌生,这是业内较早提供图像搜索图像服务的网站之一。

Retrievr提供了两种搜索方式,一种是涂鸦搜索,用户可以通过一个小巧的涂鸦编辑器来绘制图像的大致轮廓(有点类似模糊搜索);另一种方式是图片上传(本地和URL两种模式)。简单来说,是将搜索目标与Flickr的主服务器上的图片数据库作比较,根据匹配规则找出近似图。其实,Retrievr的识别性并不高,而且只是针对于Flickr中的相片进行匹配过滤,并不实用,目前比较适合看做Flickr平台的休闲拓展工具。

2、Tineye

相比Retrievr并不实用的搜索功能,Tineye则靠谱的多。它是Idée公司(就是设计那款很NB的PixID的母公司)开发的图像搜索网站。它所提供的搜索方式和Retrievr一样,上传本地图片或是提供在线图片的URL。TinEye 还为 IE、Chrome、Firefox 等浏览器提供了插件和收藏夹脚本按钮,用户可以在浏览器中使用右键菜单搜索相似图片。

官方数据显示,截至2010年7月19日为止,Tineye的数据库图片已达约16.3亿张,用户甚至可以通过一张源图来搜索同类型的图(如杂志)。

反向图片搜索引擎

这种以图片作为搜索源的技术可称之为“反向图片搜索引擎”,最具代表性的是Google的“景物搜索”试验性产品 Goggles(它可以对用户上传的图片内容进行分析,可辨认书籍、音乐专辑封面、绘画、地标、场所和企业商标图案等)。

Google负责工程技术的副总裁维克·古德特拉曾表示:“我们最终的目标是可以对任何图片进行识别。这项技术是我们在‘计算机视觉’领域最初的研究成果(计算机视觉是指用摄像机和计算机代替人眼对目标进行识别、跟踪和测量等)。你可以对着景物拍照,然后用你拍到的照片进行网络搜索。

反向图片搜索引擎的使用场景非常复杂,这里先列举3个:

1、“以图找图”,这种情况最常见,例如我们在网上看到一张非常喜欢的图,可惜尺寸太小或者图片本身的质量不高,这时候就可以上传小图文件来搜索高清大图。

2、通过局部图片搜索全图,例如对考古比较感兴趣的朋友可以根据某张文物“残卷”来搜索整幅作品。

3、随着移动电子商务的发展,图片搜索服务的需求显得愈加迫切。试想一下,在逛街的时候忽然发现某个非常有意思的小东西,随手拍照,上传到淘宝,刹那间出现华丽的list……

市场动态

面对这么诱人的市场,IT大佬们当然不会闲着。

2009年,在Google发布Goggles的同时,Bing 投入了自己的图像搜索技术;之后,Google又先后收购了Plink和Like.com。

Plink:曾开发了移动版的图像搜索引擎 PlinkArt,这是一款基于Android移动平台的应用,它可以帮你搜索到你用手机摄像头拍下的艺术品的相关信息。

Like.com:以前是一家名为Riya的开发面部识别技术的公司。

国内方面,阿里巴巴集团投资的图片搜索网站“淘淘搜”日前已经上线,目前只是针对部分女装类目进行搜索;百度的新产品“识图搜索”(目前处于内测阶段:shitu.baidu.com),也即将上市。

技术局限

曾经和一位图片搜索领域的专家聊天,得到的反馈是以目前的技术,也只能有限地搜索刚性物体(如建筑,书本等),而材质、颜色、相对坐标什么的都不靠谱。另外,图片搜索≠图片检索,只有当可用数据达到百万级别时,才称之为“搜索”,所以,移动互联网应用领域的“图片搜索”(如手机拍照的图片搜索功能)的最大瓶颈,在于没有以“亿”为当量的可用图片数据。

换句话说,反向图片搜索的技术局限在于没有一个针对整个互联网云端图片数据库的统一的匹配标准,这就导致大多数图片搜索产品只能服务于自己的数据源,玩小众,拓展性不强。

图片搜索与移动电子商务

随着移动互联网的腾飞,基于移动平台的电子商务将在未来的几年内出现新的行业井喷。其实,人们对新型移动购物体验的探索从未停息过。

如基于音频识别技术的Shazam Encore,可通过录入现有的音乐,解析并搜索到音源文件,最后连接到音乐网站完成购买。——听觉引导型购买体验

再例如TinEye Music,只要用iphone拍摄CD封面,软件就会用这张照片在iTunes、allmusic.com、YouTube和Wikipedia内搜索这张cd的所有信息。你可以试听专辑,查看专辑评价,也可以从搜索结果出发直接购买这张CD。——视觉购买型购物体验

因此,只要对应的购物平台有能力撑起所有产品类目的图片归类,并且能形成一套比较完备的图片匹配规则,这一块的商业市场完全可以用“无限”来形容——这将是对传统购物体验的革命性颠覆。

零碎的思索(感谢小柒同学分享心得)

1、在尚未实现精确匹配之前,反向图片搜索引擎应该配合辅助筛选控件来运用,即上传图片的时候,还可以输入其他筛选信息,提高搜索结果的精确度。

2、除了复杂的筛选控件,还可以通过更完善的推荐系统和匹配规则来提高搜索结果的精确度。(关于推荐系统,将在后面的文章中详细探讨)

来源:http://mdchina.org/?p=184

时间: 2024-10-15 18:13:49

反向图片搜索与移动电子商务的相关文章

视觉图片搜索成电子商务新助力

中介交易 SEO诊断 淘宝客 云主机 技术大厅 2010年国内搜索引擎使用率首次超过网络音乐,成为网民第一大应用.回顾2010的搜索市场,"谷歌退出中国""搜狗与阿里巴巴联姻""人民搜索上线"等事件不可忽略,而"视觉图片搜索"同样不得不提.去年,有关视觉图片搜索相关的产品上线.融资.收购报道不下10起,其中,阿里巴巴战略投资的淘淘搜.百度识图的上线,Google斥资1亿美金收购视觉购物搜索站Like.com等消息使视觉图片搜索

正则表达式中的反向预搜索(上)_正则表达式

在以前的应用,大多是应用正向预搜索情况.也就是说,在查找内容的右面有特定的内容限定,例如下面的例子: 复制代码 代码如下: var str3 = 'CPU: Intel Core2 5200; Memory: 2G;OS: Ubuntu 9.04'; var reg3 = /Memory\:\s+(.*(?=\;OS\:))/gim; str3.match(reg3); alert(RegExp.$1); //结果是2G (.*(?=\;OS\:) 就是典型的正向预搜索,只有右面内容是";OS:

个性化推荐?图片搜索?导购机器人?看人工智能将如何颠覆传统购物体验

为服务好今天的顾客,仅仅强调在线渠道的简单方便已经远远不能满足.良好的客户体验对每次成功的购物来说已经必不可少.根据IBM的研究,70%的客户会不再购买那些给他们带来很差购物体验的品牌.他们中的许多人甚至会因为没有买到他们感兴趣的产品而非常失落. 鉴于上面这些问题,满足客户需求的速度是至关重要的,因为人们很容易产生即时的满足感和冲动的购买欲.因此电子商务需要一个快速个性化引擎来提高客户体验.每个给予客户的建议都应该是动态的和个性化.机器学习已经被电子商务巨头如亚马逊用来提供定制化产品推荐和畅销排

Pinterest将推图片搜索应用 方便用户在线购物

 7月7日消息,美国图片社交网站Pinterest虽然创建时间只有6年,但该公司一直在努力推陈出新.为了减少用户不断向身边人提出"你在哪儿购买这些商品"等类似的麻烦问题,该公司将即将于近期推出一款图片搜索应用,为用户网络购物提供极大的便利. Pinterest宣称,该公司即将在未来几个月内推出的图片搜索应用将充分利用移动摄影技术崛起的优势,为用户提供便捷的服务.通过这款应用,用户只需将智能手机摄像头对准某个物品,此应用就可以即刻在存储750多亿张图片的巨大网络空间内进行搜索,从而为用户

正则表达式中的反向预搜索(上)

在以前的应用,大多是应用正向预搜索情况.也就是说,在查找内容的右面有特定的内容限定,例如下面的例子: 复制代码 代码如下: var str3 = 'CPU: Intel Core2 5200; Memory: 2G;OS: Ubuntu 9.04'; var reg3 = /Memory\:\s+(.*(?=\;OS\:))/gim; str3.match(reg3); alert(RegExp.$1); //结果是2G (.*(?=\;OS\:) 就是典型的正向预搜索,只有右面内容是";OS:

正则表达式中的反向预搜索实现

在以前的应用,大多是应用正向预搜索情况.也就是说,在查找内容的右面有特定的内容限定,例如下面的例子: var str3 = 'CPU: Intel Core2 5200; Memory: 2G;OS: Ubuntu 9.04'; var reg3 = /Memory\:\s+(.*(?=\;OS\:))/gim; str3.match(reg3); alert(RegExp.$1); //结果是2G [Ctrl+A 全选 注:如需引入外部Js需刷新才能执行] (.*(?=\;OS\:) 就是典型

正则表达式中的反向预搜索

      这几天在用正则表达式做一个小程序,需要替换内容中的某些特殊字符串.这些字符串的出现是有规律的,那就是在它左面总会特定的内容出现,右面却没有.于是自然就想到了反向预搜索.       在以前的应用,大多是应用正向预搜索情况.也就是说,在查找内容的右面有特定的内容限定,例如下面的例子: var str3 = 'CPU: Intel Core2 5200; Memory: 2G;OS: Ubuntu 9.04'; var reg3 = /Memory/:/s+(.*(?=/;OS/:))/

正则表达式中的反向预搜索(续)

 在前面<正则表达式中的反向预搜索> 中,在JavaScript中利用RegExp对象实现了正则表达式反向预搜索的字符串替换功能,代码为: //程序目的,去掉图片路径中的域名 var str = '<img src="http://news.163.com/sports/yao.jpg">'; var reg1 = /(/<img)(.*(?=(http|https)/:////))((http|https)/:////[^//]*)/gim; str.m

相似图片搜索的原理(二)

二年前,我写了<相似图片搜索的原理>,介绍了一种最简单的实现方法. 昨天,我在isnowfy的网站看到,还有其他两种方法也很简单,这里做一些笔记. 一.颜色分布法 每张图片都可以生成颜色分布的直方图(color histogram).如果两张图片的直方图很接近,就可以认为它们很相似. 任何一种颜色都是由红绿蓝三原色(RGB)构成的,所以上图共有4张直方图(三原色直方图 + 最后合成的直方图). 如果每种原色都可以取256个值,那么整个颜色空间共有1600万种颜色(256的三次方).针对这160