如何让搜索随心所欲?一起来聊聊“以图搜图”

一张好图可以胜过千言

电商行业里面最重要的是什么呢?毫无疑问,是搜索带来的流量。图片可以通过冲击视觉让人们产生想要购买的欲望。我们怎样去挖掘图片这个金矿?博云视觉CEO陈杰在2016云栖大会•北京峰会上分享了博云视觉在过去几个月的时间里和阿里云的合作,以及博云视觉在电商图片搜索上的实践。

图像搜索应用成趋势

在数据量方面,视觉在人类获取信息途径上占到了80%以上的比重。随着现在手机拍照功能的强大和应用的普及,人类拥有的图像也构成了一个非常大的图像数据库。根据统计,截止到目前为止,人类通过拍照的方式产生的图片大约接近三万亿幅。在这样一个海量的数据中,怎样去挖掘图像本身的价值,进而在大数据中去搜索相关的信息是一个新的挑战。

从最新的CNNIC发布的关于中国网民的搜索行为的调查报告(截止到2015年12月份)来看,人们通过手机端搜索的方式主要有文字、二维码、条形码以及图像和语音的技术。传统的文字搜索已经被大家使用了很多年,占到了搜索的96%,而图像作为信息的入口级渠道,以图搜图这种交互模式已经逐渐被接受。文字、语音都是人们已经定义好的一种描述信息,而图像除了已定义的可描述信息,还蕴含多种描述困难的信息。

这也是各大互联网公司开始抢滩图像市场的重要原因,我们看到各大互联网公司已经陆续推出图像搜索的应用或者功能,例如:百度识图、拍立淘、微信扫一扫、拍照购等,视觉搜索带来的流量也逐步开始扩张市场份额。

电商图搜应用场景

随着移动互联网技术的发展,通常在移动购物场景中会面临到几种情况:

一,我们在看直播节目或者电视节目时,我们可能对网红的某些产品感兴趣,想了解是否有同款,这个时候就很难描述这个产品是什么,这时候我们就需要图片;

二,我们在实时场景中看到前面一个人背的包,感兴趣但是无法描述;

三,社交平台上分享信息的时候,微商分享某种商品需要去淘宝等其他平台上该商品的价格;

四,最近比较火的跨境电商业务,海外的商品语言描述看不懂,这个时候就有一些不对称的信息。

所见所得的新交互模式

这些场景下,无论我们用语言还是文字都很难直接对场景进行一个直观的描述。然而,最简单的方式是直接拍照,把内容信息上传到图像搜索引擎,通过数据库搜索,精准的匹配到想要获得的信息。这就是“所见即所得”的新型的交互方式。

这种交互方式由三个部分包括:智能前端,包括一些手机以及未来的可穿戴设备如智能眼镜等;中间是一个移动网络,包括3G、4G、WiFi;云端连接着大型的云计算平台——阿里云,提供各项的数据服务。在传统的电商数据库里面,最核心的应用数据是文本数据,包括商品的价格、信息、介绍等,我们称之为结构化的数据。使用文本搜索时,会面临描述障碍、信息不对称等各种问题。再看另外一个维度,在云端的数据库上,除了文本数据还有更大量的电商图像数据,我们称之为非结构化的数据。其实,我们也可以把这些非结构化数据索引起来提供同样的“以图搜图”的方式,有了这样的索引数据库之后,在移动购物场景中,只要掏出手机对着感兴趣的商品进行拍摄,把图像内容发送到服务器端,在大规模的图像数据库中进行图像的比对搜索,那么最终就可以通过以图搜图的方式找到目标商品的相关信息。这种图搜技术有最核心的两个特征:

紧凑视觉特征表示。移动终端直接提取低比特、低复杂度、高准确率的紧凑视觉特征,并发送到服务端进行搜索。

高性能图像搜索。基于紧凑视觉特征,单幅图像索引所需数据仅需约4K;高效的海量特征索引算法,解决超大规模图像非结构化数据搜索难题。

那么,怎样从图像中提取紧凑视觉特征来让计算机能看懂这样一个图像?

紧凑视觉特征表示

给定一张图像,首先要做的是在这个图像中做一个兴趣点的检测。兴趣点是指根据人类的视觉机理去发现能够刺激视觉的一些底层视觉特征。紧接着把兴趣点描述成一个特征,这样就形成了一个最原始的底层视觉特征。之后,利用博云视觉自主研发技术把原始抽出来的特征压缩到很小,在经过一个熵编码的环节最终产生一个非常紧凑的描述一个图像的特征码流。

博云图搜基于图像特征的表达技术以及特征的索引技术,开放成标准化API服务。用户可以直接调用API服务来在各自的应用中实现以图搜图。

面向电商行业,博云图搜推出了电商的专项搜索解决方案。用户可以把自有的图像数据通过SDK上传到阿里云平台,然后结合弹性计算、CDN网络、OSS存储的基础上调用图像搜索SDK实现对图像数据本身的管理、搜索、增删改等应用。结合上层可以做边看边买、拍照购物等与图像搜索相关的电商应用。

同时针对移动终端,博云图搜推出了能够直接提取紧凑视觉特征、减少实际应用中大规模并发查找的带宽占用、流量占用的应用。

下面通过两个具体案例讲解图像搜索在电商搜索中是如何应用的。

蕾丝企业案例

该行业的痛点是:采购商无法准确描述所要的蕾丝款式;数以万计的蕾丝花型,销售人员多无法记住;蕾丝工厂大量库存无法与客户需求精确匹配。针对上述痛点,博云视觉的企业客户之一,推出了一个蕾丝采购平台,“蕾丝小姐“APP,用户可以直接拍照上传,发送到云端,在众多后端产品库中查找相同或相似的目标蕾丝花型。这个平台建立了百万级蕾丝花型数据库,搜索平均准确率在80%以上。打开APP之后,直接可以通过打开拍照的方式对感兴趣的布料进行拍照,通过快速比对的图像搜索技术就可以查到与布料相同款或者相似款的供应商信息,并且可以点击相应的供应商进行后续的沟通。

红酒搜索的案例

用户可以拍摄葡萄酒瓶上的酒标,通过“以图搜图”直接获取相关信息。葡萄酒标图像识别准确率95%以上 。“酒靠谱”APP集成了百万量级葡萄酒数据,这些数据都在数据库端,我们可以直接拍照,然后发送紧凑视觉特征到云端进行搜索,这样我们就可以快速匹配出酒的款型、相应的酒标信息、评论信息、价格信息。具体的实际操作过程与上一个案例类似,这里不再赘述。

 

本文根据博云视觉CEO陈杰在2016云栖大会•北京峰会上的演讲整理而成。

时间: 2024-10-03 14:12:18

如何让搜索随心所欲?一起来聊聊“以图搜图”的相关文章

百度内测图片搜索新功能“识图” 可以图搜图

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断 淘宝客 云主机 技术大厅 百度近日开始内测一项图片搜索新功能--"识图"(shitu.baidu.com),目前外部还无法访问.据透露,"识图"是百度图片基于相似图片的识别技术,是即将推出的一个以图搜图的新产品.能够实现通过本地上传图片或输入图片的URL地址对相应图片进行图像特征分析进行搜索,到互联网上与这张图片相同的其他图片资

拍立淘-以图搜图中的图像搜索算法

摘要:移动端的以图搜图是一代又一代的图像人,搜索人的梦想.从90年代开始,学术界,工业界做了很多的努力和尝 试.拍立淘-以图搜图,从14年正式立项开始,通过算法/工程/产品的不断打磨,以及兄弟部门的紧密合作,在业务指标的增长的同时,沉淀下来了业界领先的图搜算法. 一.为什么要做,为什么现在做 1.1 为什么做:   以图搜图功能,特别是移动端的以图搜图,成为日益增长的流量入口和用户需求.有机构表明:未来5年,用户使用语音和图像进行意图表达的比例将超过50%.手机淘宝每个月的用户反馈中,有相当的比

Chrome实用扩展推荐 以图搜图+网页截图

现在是读图时代,网页上各种各样的图片均可以为我们所用,今天为大家推荐两款与图片相关的Chrome浏览器扩展,包括谷歌官方出品的"以图搜图",以及是非常好用的网页截图工具. 一.Search by Image (by Google) Google自家出品的以图搜图扩展程序,不仅可以找相似的图片,还可以搜索出该图片的出处.内容等一系列信息.套图再也不求人,搜搜更健康. Search by Image (by Google)(点击下载) 二.网页截图:注释&批注 小编知道大家都喜欢使

辅助PPT设计的神器-谷歌以图搜图功能

有很多朋友问我,一般要找制作PPT的 图片去那些网站,除了我平常所说的一些图片资源站外,今天给大家带来一个新鲜的玩意,就是以图搜图.搜索巨头 Google 在酝酿了N久之后,终于也在"谷歌图片"上推出了这种图片反向搜索(按图搜索)功能!现在,你可以直接上传本地图片或者通过网络图片网址来搜索不同尺寸的 相似图片或者内容相关的网页.得益于 Google 先进的技术与极其海量的网站收录数据,谷歌图片搜索的质量和数量明显比其他网站要好,对要寻找一些偏门的PPT制作图片非常的实用-- 以前的谷歌

谷歌chrome浏览器以图搜图的详细图文步骤

谷歌浏览器chrome以其高速度和稳定性赢得了广大用户的亲睐,谷歌最强大就就是它的搜索功能了,现在,小编知道一招可以让你的谷歌浏览器集成以图搜图的功能,跟着我做吧. 谷歌浏览器以图搜图插件:https://chrome.google.com/webstore/detail/search-by-image-by-google/dajedkncpodkggklbegccjpmnglmnflm 打开页面后就是以图搜图的插件了,点击右上角的安装到chrome即可 安装完成后,对着要搜索的图片点击右键即可

谷歌chrome浏览器以图搜图的方法

  谷歌chrome浏览器以图搜图的方法 谷歌浏览器chrome以其高速度和稳定性赢得了广大用户的亲睐,谷歌最强大就就是它的搜索功能了,现在,小编知道一招可以让你的谷歌浏览器集成以图搜图的功能,跟着我做吧. 谷歌浏览器以图搜图插件:https://chrome.google.com/webstore/detail/search-by-image-by-google/dajedkncpodkggklbegccjpmnglmnflm 打开页面后就是以图搜图的插件了,点击右上角的安装到chrome即可

微软修复了存在20年的漏洞,揭秘“以图搜图” | 宅客周刊

    1.腾讯科恩实验室,站在0和1之间的人  你可以认为计算机是数学的分支.因为编程常用的正则表达式和数学中的"Kleene 代数"是完全等价的.而现在所有的计算机都是图灵机,它在本质上和"Lamda 演算"是完全等价的. 吴石在与宅客讲这段话的时候,他的眼神淡定而祥和,和那些看穿世界本质的先知别无二致. 对于一个拥有数百万行代码的程序来说,没有人可以用穷举的方法来判断它究竟是否存在漏洞.但是使用数学工具把它抽象出来,而且通过经验筛选,只模拟你关心的那一部分.这

iOS开发- 以图搜图功能实现 (源码+解析)

以图搜图这个功能相当实用, 之前在实现这个功能的时候, 有一些笔记, 今天就整合成博文, 分享给大家. 这个demo主要实现的功能包括: 自定义拍照界面 图像识别 以图搜图 信息获取(通过识别出的图像, 获取对应信息) 下面是一个简单的演示,  如下:       那么如何实现这样的功能呢? 如果自己去完成图像识别, 显然不现实. 最早我研究的是谷歌API, 不过谷歌在天朝, 大家都懂得... 然后是百度了,尝试了下,  效果还不错. 另外, 百度也有自己"以图搜图"对应的App.不过

“以图搜图”的奇葩用途 | 深度

    你在什么时候会用图搜图? 当你感到语言苍白无力的时候. 你在扫街的时候,突然发现某撩妹达人穿了一身炫酷的T恤. 你收到朋友送来的生猛红酒,好奇这到底是百年窖藏还是山寨葡萄糖. 你在编辑文案的时候,一张非常适合的图片却挂着水印,你需要一个清晰的版本(请支持正版...) 以图搜图就像一个"痒痒挠",能够到文字搜索难以企及的痒点.这让我们对这种搜索方式的结果抱有很高的期待.它让很多人能透过互联网的森林,感受到若隐若现的人工智能灵魂.这可能正是人们对这种技术好奇的原因. [图像识别的应