做榜单却拒绝收费,他们的「人工智能大数据服务」是如何落地的?

在雷锋网拜访络策网络科技之前,对方给发了一份关于公司和产品的简介资料,内容非常简洁,都是一些落地到实处的技术用法,如果没人讲解,你很难认为这是一家人工智能公司。这种逻辑简单明了的“技术宅”风格倒是与其创始人Jeff
Lin的气质十分契合,Jeff
Lin是美籍华人,说话短、平、快,直来直去,不绕弯子,在介绍其产品时没有像很多创业者一样,一直在说自己的技术有多么多么牛,而是不断地在介绍自己技术的应用场景和用途。

Jeff说,过去20年他一直都在做科技公司,地图、图片分享等领域都有涉猎,最近的一次创业是一个比较有名的图片分享软件“图钉”。大概从2014、2015年左右开始,Jeff就接触到了人工智能这一块,并且认识了络策公司现任首席科学家的Carl

Kovamees。Carl当时就在做神经网络相关的项目,是其前公司的联合创始人之一,后来其公司被收购,恰逢人工智能风潮袭来,Jeff就和Karl一拍即合,成立了络策。

一、老百姓也能用的大数据产品

刚开始看络策产品资料的时候,雷锋网的第一个直观感受,就是他们做了一个排行榜类的公众号——Insight排行榜,在内容创业如此泛滥的今天,这不免让人感觉有些缺乏新意。当跟Jeff聊了之后才知道,这只是他们把人工智能落为实际用途的一个产品而已。

“老百姓可能都听说过大数据,一提起大数据,就觉得很高科技,很厉害,但是多数人都不明白大数据具体是干嘛的,我们这个Insight排行榜就是用神经网络收集了大数据,然后用最直观的表现方式给老百姓使用”。

Jeff介绍,Insight排行榜是一个消费品品牌排行榜,在这个公号内不定期的会发布不同领域品牌的排名,但是与很多网络上排行榜不一样的是,这份榜单并非人工撰写,而是依赖大数据分析自动生成排名,再由人工放到公号上去。

简单来说,公司的大数据系统接入了很多电商评论系统、社交网络工具(微博、Facebook、Twitter等等)以及论坛等等,爬取上面关于商品的评论文字,通过NLP分析处理,得到这些产品在网络上的“使用反馈”,而这些“使用反馈”则成为这个榜单最主要的排名依据。

“这份榜单是我们认为最公正、客观的,因为我们是拒绝与品牌商合作的”。

上面Jeff所说的拒绝与品牌商合作的意思是不给予他们竞价排名的机会,从而保证榜单的公正性。而在客观方面,由于排名受网络评论影响,难免会遇到一些“水军”或者恶意刷评,所以在这方面,Insight排行榜在进行数据分析的时候,做了一个排重机制,把一些重复的评论抵消掉,让其尽量拿到真实使用者的反馈。

络策在用大数据处理榜单方面尝试了三个月,在完全没有推广的情况下,做到了微博4W+粉丝,微信公众号由于需要长期积累,目前还没开始发力。

二、Insight大数据分析平台

做2C产品对于做技术的人来说,通常都很难,因为消费者和企业在技术方面的需求不一样,技术公司想在2C方面找到好的商业模式还是有些困难的。

上面说的Insight排行榜只是络策在人工智能落地方面的一个实际性的尝试,虽然其面向消费者完全免费,又不和品牌商合作,看似完全公益化,但是其中却有个商业逻辑在里面。

虽说Insight排行榜为了公正不与品牌商搞竞价排名,但并不是完全拒绝品牌商方面的合作从而产生收入。如此说来看似矛盾,但是这个商业逻辑却很讨巧。

当Insight排行榜一个品类的榜单出炉之后,他们也会找这些上榜的或一些没有上榜的品牌商进行商谈,商谈的内容并不是关乎排名本身,而是关乎企业为何处在排名中的位置。

举个例子,在榜单中做一个奶粉排名,榜单出炉之后,可能第一名、第二名对自身认知很明确,觉得排名没有异议,就不会予以理会。但是对于排名在中间或后几名的厂商,会想知道自己为什么会处于现在的位置,为什么排名不会更靠前,这个时候,络策的商业逻辑就显现出来了。

络策方面会向这些品牌商提供榜单排名时的数据,以及经过分析处理的网络评论与反馈信息,让厂商意识到自己的问题在哪,比如,有很多用户反馈“奶粉太甜了”之类,这样能够让厂商针对这个问题进行整改。而提供这些数据与反馈,品牌商是需要向络策付费的。

以上所说,就是络策的大数据分析服务其中之一。在其目前主营业务之中,
Insight大数据分析平台是其产品重要布局之一。
 Insight大数据分析平台是一个SAAS服务平台,用Jeff的话来说,几乎不需要培训成本,让非技术人员只登陆网址就能进行专业的数据分析,而络策方面则对用户的分析结果进行收费。

据介绍,这个分析平台可以帮助品牌商抓取24小时内的社交网络内容,让品牌商及时了解该品牌在过去24小时的网络评论,除了能够收集各种关于品牌的相关数据,更能帮助品牌监测舆情,如果系统的语言处理机制发现大规模的负面评论,品牌商就能够立即悉知该消息,并且通过平台直接连接社交网络(微博)对用户进行相关解释。

三、图片和视频分析

图片

利用自然语言处理做大数据分析的技术提供商还是有很多的,但是这些厂商在向品牌商提供网络数据的时候,对于图片内容是很难搞定的。

“图片数据也十分重要,有的时候一张图片里面有字,很多数据系统能够抓取,但更多的时候只是一张图,你要分析里面有什么就必须需要神经网络的支持。”

Jeff告诉雷锋网(公众号:雷锋网),为了搞图片分析,络策做了七个独立的神经网络,包括半督导的训练集群和由GPU服务器组成的生产集群环境,支持不同品牌的logo识别、成人内容识别、1,000+通用物件识别(日常用品、汽车等等)、360+环境背景识别、人脸识别(性别、年龄段以及表情的识别)等等。

关于先做7个神经网络,Jeff表示,这是基于他们首席科学家以往的经验,先搭了7个神经网络的框架,而这些框架有内在逻辑在里面,并不是随意搭的。举个简单的例子,比如一个品牌商在收集数据的时候,肯定想要知道“我们产品出现的同时有没有其他品牌出现“(logo识别)、”用户在用我产品的时候跟环境背景有什么关联”(通用物体、背景识别)、“什么年龄段的人在用我们的产品”(人脸识别)等等。

目前,络策针对这些神经网络在进行调试,不停地给他们进行训练,准确度已经达到了人们能接受的容错范围。

Jeff直言,在图片识别这一块,识别率不会达到百分之百,就算人眼因为折光等问题都可能产生误差,所以神经网络只能在不停的训练之下让其准确度更高,达到商业数据分析用途的标准就可以。

视频

在视频分析服务方面,Jeff给雷锋网演示了一个系统对可口可乐的广告视频分析的Demo,视频播放过后,系统直接就能给出数据:

可口可乐短视频总长16秒

监测出可口可乐的logo出现了3次,时长11秒,分别为2秒-6秒,9秒-11秒

14秒-16秒之间 •  同时监测出logo出现时的背景场景,通用物件和人物信息

这个视频分析功能将被用在品牌商对视频品牌露出的检测等方面,比如品牌商在电影中投放广告,想知道自己的植入到底出现了多少,这个时候,该系统就能发挥作用了。然而这种视频可视化的搜索系统目前却少有人在做。

“视频分析现在很少有人做,主要原因是框架搭不好。”

Jeff说,视频分析主要核心点在于框架,直接影响视频的拆帧。比如,一个20帧的视频,一秒钟能够拆成20张图片,如果系统框架做不好,速度不够快,在一秒钟内不能分析完这20张,接下来的时间就会有新的图片进入,系统就会堵塞
。而他们的视频分析框架经过优化之后,能够达到非常流畅的分析效果,甚至用在直播的画面上也是可以的。

四、做有用之用

目前人工智能概念炒得火热,多数产品都处于概念之中,对于人工智能如何落地等商业模式方面的探索显得有些匮乏。

“作为一个创始人,应该明确的知道要做什么”。

有着20年科技行业从业经验的Jeff,对市场的观察还是十分敏锐的,无论是大数据榜单、大数据服务亦或后来的图片视频分析,这些产品都能够很好的落地到实际用途中,把目前火热的“神经网络”、“NLP”、“人工智能”等等热词融入到了产品中,想清楚了商业模式并加以实施。

去年12月份,络策网络科技拿到了由飞拓无限、德同资本的投资,飞拓无限是国内一家提供移动互联网整合营销服务的移动互联网公司,去年年底刚在新三板挂牌上市,也就是说,此次融资除了让络策有更多的资金投入技术研发之外,还在资源整合上增益了不少,加快了一些其“人工智能”技术在跨社交媒体的大数据服务的落地。

总之,把技术快速用在实际用途中,是络策目前的风格,也是目前所有创业者最应该优先考虑的事情。

本文作者:赵青晖

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-10-11 16:34:31

做榜单却拒绝收费,他们的「人工智能大数据服务」是如何落地的?的相关文章

你不知道的数据工程师:80% 时间都在做「大数据苦工」

以为数据工程师每天做的就是像 http://hackertyper.net/ 这样,然后创造了一个又一个伟大的产品吗?错了!纽约时报记者采访了多位大数据工程师,他们表示自己 80% 的时间都在当「大数据苦工」,干的都是非人类可以想象的枯燥繁琐的工作--从海量的原始数据中提取有用数据,整理,转换格式,调整为算法可以理解的同样格式的规整数据-- 因此,这些数据工程师称呼自己为「数据清洁工」.「数据搬运工」,「数据整形师」等等--知名健康追踪手环公司 Jawbone 的数据科学副总裁 Monica R

【榜单】你需要了解的国内外十大生鲜电商top10

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp;  [编者按]关于生鲜电商话题引起国内外媒体广泛关注,讨论十分火热.据国内外媒体报道,在经历了连续数年的悄然发展之后,亚马逊正筹划大力扩展生鲜电商服务AmazonFresh,将在其他20座城市推出AmazonFresh服务,其中将包括部分海外国家的城市.笔者认为这是电商中的蓝海,生鲜电商这个行业将彻底引爆,本次整理了国内外十家独具特色的生鲜电商,以供参考. 一.国内五

依托大数据研究 紫金传媒智库推出上市公司创新能力500强榜单

7月10日,由紫金传媒智库和大众证券报联合举办的"2016中国A股上市公司创新指数发布会暨首届中国上市公司创新领袖论坛"在南京举行.会议发布了中国A股上市公司创新能力500强榜单,这是国内首个依托大数据研究的上市公司创新能力报告. 据了解,紫金传媒智库此次历经八个月,对2760家A股上市公司的创新能力进行评估排名.根据上市公司创新强度指数.创新效益指数.创新绩效指数.创新资源指数.可持续性指数等5个二级指标及其他21个三级指标,挖掘和分析了2011年至2015年历时5年的A股上市公司的

搭载“大数据榜单” 企业决策可有的放矢

随着大数据产业园在中国各大省市遍地开花,如何尽快融入和运用大数据,无论是商业巨头还是中小创业企业都十分关注. 因为关注,就出现了一种名叫"大数据榜单"的工具,这种工具能帮助政府.企业等市场主体以最快速度了解相关市场,从而更好地与大数据企业合作. 数据价值在合作中 一份高含金量的榜单,对新兴产业尤为重要. 大数据本身也是新兴产业之一,所以在众多政府和商业单位那里,只听到"大数据"概念很热,却不知工具怎么用.有些企业在寻找"懂行的人",有的则在咨询专

09作家富豪榜发布石康称这榜单完全是在露穷

昨日(11月30日),2009中国作家富豪榜名单揭榜,名单依旧延续前三届的方式,公布了前25位作家名单及版税.有意思的是前三名作者的读者群都是青少年,显示出青少年似乎比成年人更爱读书.与去年不同,曾两次获得第一名的80后作家郭敬明,今年未能卫冕,以版税收入1700万屈居榜单第二名,而"童话大王"郑渊洁以2000万版税收入成为新首富.儿童文学作家杨红樱以1200万位列第三.以<明朝那些事儿>一战成名的当年明月以1000万位居第四. 记者在今年的榜单上看到,榜单上的作家富豪们可

新浪微博影响力榜单多久时间刷新一次?

  影响力榜单目前分为日榜单.周榜单和月榜单三种: 1.日榜单:即按照每天刷新后的影响力数据进行排名的榜单,可以及时反馈影响力的排名变化,大家进入风云榜后看到的默认榜单就是最新的日榜单. 2.周榜单:即按照一个自然周里影响力平均值进行排名的榜单,可以反馈大家一周的排名变化.由于统计周期是按照自然周,因此在当前时间看到的周榜单为上周影响力的平均值排名,这个排名每周刷新一次.如果想查看不同行业在过去几周的榜单,可以点击页面右上方的"更多"按钮来进行选择. 3.月榜单:即按照一个自然月里影响

2017 OWASP十大安全趋势榜单变化解析

OWASP十大安全趋势榜单会根据当权安全形式不时对内容进行调整,旨在更好地反映现实情况的具体变化. 而作为内容调整的核心议题,可以看到越来越多从业者意识到应用程序安全性必须立足于软件开发流程. 应用程序与API的安全威胁格局正在不断变化,促成这种演变的关键性因素则包括新型技术的快速普及(包括云计算.容器与API).软件开发流程(如敏捷开发与DevOps)的加速与自动化.第三方库及框架的爆炸式增长外加攻击者自身的技术水平提升.这些因素的出现往往会增加分析应用程序与API的难度,同时亦给安全格局造成

纯干货!如何做一个成功的大数据项目

1.失败大数据项目的特征 根据在美国做了15年的大数据项目.产品研发和管理,以及其它一些相关的数据分析的工作经验,了解到的其它的做的比较成功的和失败的项目,跟大家做一个经验分享.基本上大数据项目失败的特征主要是五个: 一是大数据项目与企业战略脱节,完全是领导或者是不知道那个部门的决策人突然脑子一热,就说别人在用,我们也做一个,根本没有把该做的项目和企业的商业战略.科技战略等各个方面结合起来.在项目无法与战略协调,无法在战略的指导下做一款产品或者是服务项目的时候,失败的可能性会非常大. 二是大数据

90%的医疗大数据产品是伪需求?刚需在哪里?谁来买单?

雷锋网消息,近日,中电数据服务有限公司主办的"数据风口  生态联盟"健康医疗大数据国家试点工程(福州)生态峰会在福州举行,中电数据召集红杉资本中国基金.IBM.药明康德.戴尔等20家数字医疗市场的大玩家出席,共同成立健康医疗大数据国家试点工程(福州)生态联盟. 前不久,一篇<90%的大数据产品是伪需求,所以没人买单>的文章让不少业内人自我怀疑起来,为此,会议当天,主持人向与会嘉宾抛出这个话题,而他们一致认同的是:医疗大数据产品一定有刚需,医院.政府.药厂.个人等都可以成为需