苹果刚刚收购了暗数据分析公司LATTICE DATA,葫芦里卖的什么药?

雷锋网(公众号:雷锋网)AI科技评论按,苹果近日收购了一家数据挖掘和机器学习公司LATTICE DATA,雷锋网已经日前已经对相关情况进行报道,详情请看这篇文章

不过暗数据有哪些价值、LATTICE的技术有何特别之处、苹果此举又是出于怎样打算,很多小伙伴应该还不是很清楚,请看下文分析。

暗数据是什么?

LATTICE公司的技术要处理的对象是“暗数据”。业内把它称作“暗数据”(dark data),是因为这些数据很难直接使用。它们可能是杂乱的、多种格式共存的、进行了记录但是没有派上用场的、进行分析整合总结之前的、或者根本没有明确目的性。

总体情况而言,目前各家企业和组织收集的所有数据中,能够直接进行结构化分析或者大数据分析的数据比例其实很小。根据IDC的调查数据,90%的非结构化数据都从未被分析过。多数情况下企业觉得许多类型的数据都有直接价值或者潜在价值,所以花费资金人力进行了长期收集,比如收集用户使用自家产品的信息、统计内部软件开发进度、统计网站访问信息等等;典型的暗数据还比如,公司中存储的客户资料、服务器的日志文件、离职员工的信息、问卷调查的原始数据、按周期的财务状况表、历史邮件资料、公开的账户信息、工作产生的记事本备忘录PPT、工作报表文档的早期版本等等。

除了直觉上觉得“收集了数据就肯定有价值”之外,我们对暗数据的价值是否有理性的系统化认识呢?现在对它价值的认识主要有两种观点,一种观点基于正面价值,认为不对这些数据进行分析,就没法发现其中有些重要但尚未被人注意过的机会;另一种观点基于负面价值,如果这些未经分析的数据处理不当,可能会有法律和安全方面的许多问题。

正面价值的角度,企业有很大的机会可以通过暗数据获得发展业务的机会,比如:服务器的日志文件中可以读出网站访问者的行为;客户通话录音可以揭示客户的态度和感情;移动设备带来的位置数据可以提供访问模式。如果一家企业不对这些暗数据进行分析,那简直就是把机会白白丢掉了。不过同样地,企业也需要有更好的流程、协调和技术才能够正确地运用暗数据。

负面价值的角度,企业很可能记录了法律不允许记录的数据,一旦揭露出来会有很大麻烦;收集的企业内部信息可能泄露商业机密;如果丢失了用户数据,将会降低公司信誉;如果手握类似的用户数据,A公司没有进行分析,但是竞争对手B进行了分析,那么B就很有可能在接下来的竞争中取得优势。

处理暗数据为什么难

确定了暗数据的价值以后,就可以考虑规划行动了。但已经行动的企业很少。这是为什么呢?

主要原因有这三个:

1,收集数据时候优先级太单一。比如一个信用卡的市场团队只关心客户的信息和信誉度,那么它会记录客户在网上申请页面上填写的信息,但是不关心客户是如何来到这个申请页面的、客户对页面易用性的感受又如何。那么当客户整个申请流程的数据都记录下来后,能够有人愿意分析利用的只是其中很小的一部分。

2,技术和工具的限制。如果同一家企业和组织的数据收集是用不同的技术和工具进行的,那就有可能出现由于技术限制导致这些技术和工具之间没法互动的情况。这样一来数据就没办法全部联系在一起,展现出完整的状况。这件事情尤其容易发生在那些有多个IT系统和数据格式的公司身上。比如,想把呼叫中心的语音录音和网站上的浏览点击数据整合在一起就很难。数据分析项目还处在比较早期阶段的公司就会有这样的问题。

3,数据难以结构化。不同设备的访问历史、社交网络上的文章和下面的评论、历史邮件资料等资料,虽然整理到便于查询的格式需要花一点功夫,但好歹还是普通文本;有不少情况下数据是在DOC、XLS、PPT、PDF文档和各种图片里面的,那这样的数据要如何提取、如何结构化呢,别忘了表格里的数据要保持着表格的结构才能产生意义,而图片信息的提取单独拿出来都是一件大事。

LATTICE公司技术如何

LATTICE公司的前身DeepDive是斯坦福大学的一项研究项目,计算机科学教授克里斯·雷(Chris Re)和密歇根大学计算机科学教授迈克尔·卡法雷拉(Michael Cafarella)共同带领团队进行研发,不仅成果客观,还获得过许多企业和机构的支持。

他们和核心竞争力是数据分析处理技术,采用深度学习的方案并大大提高了可用性,可以进行训练、推理和预测,最大的亮点是能够从非结构化的数据(如一般的工作文档和图片)整理出结构化数据(如SQL数据库),并且可以把这些数据合并到现有数据库以拓展整个分析结果的深度广度。他们的技术有很多吸引人的特点:

  • 入门成本低,使用者只需要考虑数据特征而不考虑算法
  • 科学领域内,信息提取准确度比人类更高
  • 可以适应数据的噪音和不准确性
  • 可以从多种数据格式提取信息,包括网页、PDF、图像、表格等等
  • 使用者可以非常简单地给与反馈和设定规则以提到特定领域内预测的准确度
  • 早期模型无需训练就可以开始工作
  • 高性能可拓展

LATTICE公司能帮到苹果吗

苹果的多条硬件产品线、多种软件生态服务、7亿用户群,都能够源源不断地产生用户行为数据。设备、服务、app的购买使用记录可以用来做用户画像,系统应用的使用统计数据可以分析用户习惯,每个地区市场的消费统计还可以用来分析消费趋势、出营销方案等等,而这还仅仅是基础的、很容易想到的用途。如果大家还记得之前爆出过iOS设备存储用户几个月内的GPS定位记录,其实已经表明,除了我们容易想到的使用记录和购买记录之外,还有不少数据也被记录了,这些数据不仅更隐私,泄露以后对用户还会有很大的威胁。

根据苹果有能力收集的数据和LATTICE所能提供的技术,雷锋网AI科技评论推测苹果可能有如下打算:

一,苹果记录的用户数据已经非常之多,首先需要考量数据存储的安全性和可靠性,避免丢失和泄露,最好还能同时提升可用性;

二,通过深入分析用户使用习惯数据,建立用户模型,了解和预测用户需求,继续优化用户体验,作为后乔布斯时代“满足用户需求,创造新的增长点”策略的行动之一;

三,现在的人工智能研究严重依赖数据,可以把用户产生的海量数据用于训练自己的人工智能

四,苹果对全球员工和全球供应商的信息管理也可以借此机会进行升级,继续提高信息管理水平

不过鉴于苹果的保密文化,外人可能最终也无从得知他们到底做了什么。不过这起码也给其它科技企业提了醒:别让自己花了人力财力收集的数据躺在服务器里睡大觉了。

AI科技评论招业界记者啦!

在这里,你可以密切关注海外会议的大牛演讲;可以采访国内巨头实验室的技术专家;对人工智能的动态了如指掌;更能深入剖析AI前沿的技术与未来!

如果你:

*对人工智能有一定的兴趣或了解

 * 求知欲强,具备强大的学习能力

 * 有AI业界报道或者媒体经验优先

简历投递:

lizongren@leiphone.com

相关文章:

苹果花2亿美元收购了一家人工智能企业,要把数据变废为宝

本文作者:杨晓凡

本文转自雷锋网禁止二次转载,原文链接

时间: 2024-09-17 17:42:45

苹果刚刚收购了暗数据分析公司LATTICE DATA,葫芦里卖的什么药?的相关文章

为提升创新能力 苹果应该收购这十家公司

[导读]苹果拿着现金储备回购公司股票,还不如收购优秀公司扩充技术实力. 腾讯科技 无忌2月17日编译1 40亿美元是什么概念?对一些国家而言它已超过了该国全年的国内生产总值(GDP)总和.但是对苹果来说,这只是两周时间内为了安抚一位亿万富豪和其他股东不满情绪的支出,因为他们认为苹果3个月时间卖出5000万部iPhone手机不尽如人意.<连线>日前撰文指出,苹果不应当拿着现金储备回购公司股票,而是应该通过收购创新公司来保持其技术创新竞争力.苹果上月发布的第一财季财报再次令华尔街感到失望,不过这家

微软收购了大数据分析公司Metanautix

Metanautix公司发言人宣布将携下一代产品加入微软.公司将借助微软的SQL Server技术优势,结合云平台Azure为商业客户提供更好的数据服务和云服务.Metanautix的CEO对全体员工的讲话是这样的,"这是非常激动人心的一步,在进入更加辉煌的篇章之前我们得先感谢公司优秀的团队成就现在的成绩". 微软方面发布消息称,收购Metanautix公司有助于加强他们的大数据分析能力.微软Redmond总部计划将打造一个包括Cortana分析组件和SQL Server服务的数据平台

Twitter收购电视社交数据分析公司Trendrr

       北京时间8月29日早间消息,Twitter周三宣布收购电视节目社交数据分析公司Trendrr,并将其整合到自己的分析产品中. 电视节目社交数据分析领域曾有三家主要的独立公司,分别是Trendrr.Bluefin Labs和Social Guide.除Trendrr外,Twitter还在今年年初收购了Bluefin Labs:同时,Social Guide也已经被数据分析机构尼尔森(Nielsen)收购.至此,该领域内三足鼎立的局面暂告一段落. Twitter收购Trendrr主要有

雅虎宣布收购APP数据分析公司Flurry

雅虎宣布收购APP数据分析公司Flurry7月21日,雅虎宣布,已经收购移动应用数据分析公司Flurry.这也是雅虎掌门人梅耶尔主导的,在移动互联网领域的又一次并购行为.双方并未宣布收购交易的金额.美联社分析,金额未透露,表明规模并不大,不足以影响雅虎业绩.Re/code引消息人士的话称,这起交易的价格可能为数百万美元或 上千万美元.不过,另据一些媒体的消息,雅虎收购Flurry的价格至少为3亿美元,或者是在3亿美元到 10亿美元之间. 腾讯科技在雅虎的官方新闻通稿中看到,被收购之后,Flurr

苹果收购社交媒体分析公司Topsy 改善App Store

凤凰科技讯 北京时间12月3日,据科技网站BusinessInsider报道,苹果方面确认以2亿美元的价格,收购社交媒体数据分析公司Topsy.据悉,此前Topsy公司向Twitter付费购买数据,通过分析用户推文,追踪用户感情,破译Twitter用户的行文方式,挖掘有影响力的人物或特定主题,或监测某些突发事件.这项收购对苹果来说有些奇怪,因为硬件.软件.应用才是苹果的主要兴趣所在.苹果究竟意欲何为,目前尚不得而知.但有分析称,苹果将利用Topsy,改善流媒体广播服务iTunes Radio的广

苹果收购社交媒体分析公司Topsy

网易科技讯 12月3日消息,据华尔街日报报道,知情人士透露,苹果已以逾2亿美元的价格收购社交媒体分析公司Topsy.该交易也已得到苹果方面的证实.Topsy致力于分析来自Twitter的数据,提供工具分析推文和其它信息来帮助追踪消费者情绪.它的工具能够解析出特定词语在推文中被提到的频率,发现特定话题上富有影响力的人,以及测量某一事件或者营销活动的 曝光率.该公司是Twitter少数的合作伙伴之一,拥有访问Twitter"firehose"全部推文信息流的权限.Topsy在分析与转售数据

强化大数据技术,苹果再次收购机器学习公司

9月23日消息,据美国媒体报道,苹果在大肆收购机器学习公司.继去年底收购Perceptio和数月前收购Turi后,现在苹果又收购了印度机器学习公司Tuplejump.苹果代表未证实也未否认此消息,这是该公司事实上收购了的标准做法. Tuplejump与多数机器学习公司一样,并非家喻户晓,但在收购后该公司网站关闭了.该公司自称是大数据技术早期使用者,帮助财富500强公司采用这些技术.他们开始简化数据管理技术,并使数据使用起来变得非常简单.协议的条款未披露. 据悉苹果对Tuplejump开发的开源项

Twitter宣布收购大数据分析公司Lucky Sort 收购条款不详

凤凰科技访北京时间5朿4日消息,据Computerworld网站报道,Twitter已经收购了大数据分析公司Lucky Sort.这个收购交易将使Twitter更深入地了解其用户微博内容和如何最好地在其网站上放置广告.Twitter没有披露这个收购交易的条款〿/p> Lucky Sort首席执行官诺亚·佩波尔(Noah Pepper)周一在该公司网站上发表的文章中称,该公司的技术旨在通过建立一些极好的和用户友好的文本分析工具来更轻松地分析.概括和可视化庞大的文件集〿/p> Twitter没有说

Apple已悄悄于最近完成对音乐数据分析公司 Semetric 的收购

摘要: 根据英国音乐新闻网站 Music Ally 今天的报道,Apple 已悄悄于最近完成对音乐数据分析公司 Semetric 的收购.关于收购的细节,苹果发言人还是老样子,对任何未经 Apple 官方宣布的资本动 根据英国音乐新闻网站 Music Ally 今天的报道,Apple 已悄悄于最近完成对音乐数据分析公司 Semetric 的收购.关于收购的细节,苹果发言人还是老样子,对任何未经 Apple 官方宣布的资本动作"传闻"都表示无可奉告.而 Semetric 也拒绝对消息发表