AI时代下 存储方案如何制定才万无一失?

机器学习与人工智能(AI)时代的到来已成必然,多数专家认为,这些技术将彻底颠覆数据存储世界。那么在此趋势下,制定存储方案时应注意些什么?

以下是笔者给大家的一些提示:

1、关于制定战略

组织考虑在人工智能和机器学习方面进行投资时,首先应该思考的是底层存储基础设施的战略性。这一观点来自于Pure Storage的产品副总裁Matt Kixmoeller。

他的逻辑很容易理解。AI和机器学习都是数据密集型的,而且组织都希望从这些数据中获得直接可见的价值。这就意味着企业需要一个可伸缩的和具有成本效益的解决方案,但同时它也应该能够高速处理庞大的数据集。也就是一个on-prem和云存储的混合解决方案。on-prem事关性能和成本的可预测性,从另一方面讲,该云能够迅速在开发/测试环境下进行扩展和缩减。

“需求的存在是大量而多样化的,并不存在能够一体适用的工作或应用,” Kixmoeller说,“成功的组织,尤其在尖端技术和科学领域,需要确保基础设施是创新战略中的一个核心组成部分。”

2、理解不同类型的数据管理需求

如果所有数据需求都是相同的,就会非常方便。在理想世界中,对象、文件和区块之间的差别将消失不见,任何事务都可以进行一体化的管理。但这毕竟只是理想,不是存储的真实现状。对于AI和机器学习来说,也是一样。

“用户需要了解业务数据、人类产生的数据和机器数据之间不同的数据管理需求,在存储技术方面的投入,取决于你需要去管理的数据的类型。” 日立数据公司物联网产品和技术高级副总裁Rich Rogers说。

他指出,机器数据的需求完全不同于其他类型的数据。例如,机器数据需要即时处理和一个可伸缩的核心共享仓库。所以被部署在一个特定组织中的传统存储类型,可能不适合一个机器学习环境。

3、考虑I/O和CPU需求

StorageIO集团分析师Greg Schulz认为充分理解被使用的数据或AI和机器学习工具所需要的数据是非常重要的。他更进一步进行了说明,他说,IT经理还必须复审最终数据存储库和数据库以及关键值的需求,同样还有I/O和CPU计算需求。

4、考虑开销

关于使用AI进行自动化数据和存储管理,Schulz表示组织应该考虑数据处理、分析和巨大的数据传输量所带来的开销。在某些情况下,这可能纯粹只是一个影响到一两个系统的问题,但是在其他情况下,这些费用可能涉及许多系统和多个站点。

5、不对冲

在谈到机器学习时,没有对冲可言。有点儿像上世纪九十年代末和二十一世纪初,企业会听到这样的标语:“进入互联网吧,年轻人。”但大多数充其量只是局限于口头应付和没有任何电子商务功能的单向网站。几年后,像eBay和亚马逊这样的领头羊才开辟了新的行业道路。

同样的,关于机器学习,也没有折中的办法。竞争对手都在争相实施,你也必须做好准备。

“AI和机器学习技术将成为主流,我们应该关注的问题不是是否实施,而是何时实施。” Cloudian的CEO Michael Tso说。

互联网和零售搜索引擎都已经具备了分析需求,然后进行个性化搜索结果展示的能力。他们知道你的搜索历史数据和最终购买数据,并以此分析你的喜好。Tso预测,五到十年内,没有部署AI的企业将会被淘汰。组织获取消费者的关键业务信息和如何与消费者联系,将成为新的常态,他补充道。

6、部署对象存储

虽然一些人鼓励企业采用软件定义存储来为机器学习做好更深入的准备,但Tso有不同的看法,他认为对象存储才是更好的选择。

“对于那些希望在AI和机器学习领域进行投资的组织,不要太过在意对象存储的便宜和深入,更应该将其看作是未来差异的中心。”他说,“今天的学习将成为明天AI的动力,IT世界正在改变,胜者将会以AI友好的格式保持数据。”

7、随时准备好进行扩展

显然,机器学习和人工智能已经极大地增加了存储的需求,而且存储需求预计将会持续飙升。所以基础设施的可伸缩性是一个考虑基础设施升级或刷新时的重要因素。但应该是什么样的可伸缩性呢?

“项目越大,对于能够扩展到大容量、高密度的构建区块以减少设备数量的存储系统的需求也会增加,同时数据中心的开销也会随着项目的增长而提升。”DataDirect网络产品营销高级主管Laura Shepard说。

她的建议是仔细搜索可伸缩的、高性能的,拥有智能内置部件去管理闪存和活跃档案的存储。在一个系统中寻找一些可以处理你的中、高等潜力输出结果的东西,可以提高性能和容量而无需并排筒仓。

8、保持冷静,按计划行事

IT领域中一波未平一波又起的趋势,很容易让人陷入疯狂,然后做出一个不明智的决定。当然,忽视这种发展趋势也是行不通的。但与此同时,太过匆忙往往会导致失误,而这些失误所带来的损失可能会非常高昂。

所以即使高管层召开紧急会议,下定命令要制定一个AI或机器学习策略并给出了严格的最后期限,你也仍需保持冷静,制定一个好的计划。

“对你所寻找的用来完成和处理事务的AI工具有一个很好的理解,” Schulz说,“如果你不能很好地表达自己的问题,你就无法正确地部署存储或机器学习技术。”

总之,因为AI和机器学习都是新兴领域,所以对于希望从这些技术中获利的组织来说,问题永远比答案要多。此外,准确预测存储的结果是不可能的,无论有意还是无意。

时间: 2024-10-27 14:46:45

AI时代下 存储方案如何制定才万无一失?的相关文章

分析:大数据时代下的存储平台选择

文章讲的是分析:大数据时代下的存储平台选择,大数据是时下最热门的企业IT话题,那么大数据对存储有什么要求呢? 为了解决这个问题,我们首先来分析一下大数据的特点. Gartner对大数据下了一个简洁的定义:"大数据是需要新处理模式才能具有更强的决策力.洞察力和流程优化能力的海量.高增长率和多样化的信息资产." 所以,大数据既包含结构化数据也包括非结构化数据,而且是以数量巨大.变化率高的形式存在. 大数据如此热门的主要原因是因为它能提供可行性的见解.企业通常使用分析应用来提取大数据里的本来

存储行业蛋糕够大 但AI时代运算挑战艰巨

   2016年存储行业的涨价潮一直延续,并且涨价的幅度逐渐增大,大幅超过许多人的心理预期价位时.2017年,无论是闪存大户固态硬盘,还是内存闪存卡等产品线,依旧在涨价的路上越走越远. 半导体供应链存储器缺货绝对是横贯2017年的主调,但除了量变,大数据中心.AI深度学习运算带来对CPU与AI处理器的运算速度.存储容量高门槛要求,也正在改变整个存储器乃至于运算基础核心架构. 在近日一场GSA存储器高峰论坛上,半导体与数据平台.服务器领域与会人士对上述议题展开热议.西数(WesternDigita

大数据时代下的三种存储架构解析

数据的价值日益凸显,数据已经成为不可或缺的资产.作为数据载体和驱动力量,存储系统成为大数据基础架构中最为关键的核心. 大数据时代,移动互联.社交网络.数据分析.云服务等应用的迅速普及,对数据中心提出革命性的需求,存储基础架构已经成为IT核心之一.政府.军队军工.科研院所.航空航天.大型商业连锁.医疗.金融.新媒体.广电等各个领域新兴应用层出不穷.数据的价值日益凸显,数据已经成为不可或缺的资产.作为数据载体和驱动力量,存储系统成为大数据基础架构中最为关键的核心. 传统的数据中心无论是在性能.效率,

在云计算时代下这才是真正的云计算!

在云计算时代下,很多人都在谈论云计算,而究竟什么是真正的云计算呢?请看下文.云计算,是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需提供给计算机和其他设备.典型的云计算提供商往往提供通用的网络业务应用,可以通过浏览器等软件或者其他Web服务来访问,而软件和数据都存储在服务器上. 云计算服务通常提供通用的通过浏览器访问的在线商业应用,软件和数据可存储在数据中心.云计算具备以几个重要特征. 支持异构基础资源 云计算可以构建在不同的基础平台之上,即可以有效兼容各种不同种类的硬件

AI时代的产品经理,应该注意什么?

本文整理自文因互联CEO鲍捷博士于2017年5月13日参加职人社与爱因互动联合举办的活动--『AI时代的产品经理』所做的演讲. 我有一个好想法,就差一个 AI 了 今天我特别想跟大家分享一下,人工智能产品在「演进」上的一些体会. 人工智能产品一个核心特点就是「演进」.也就是说「你很难一下子达到那个地方」,这可能是与传统的互联网产品很不一样的地方. 互联网已经存在很多年了,在产品经理的人才积累上大概已经过 10 万的数量级了吧.对比国内人工智能的导师储备也不过数百人,国内人工智能相关专业出来的研究

浅议大数据时代下消防工作、生活和思维的变革

最近在微信圈流行的段子:一个客户拨打了披萨店的电话,还没说要什么披萨,仅仅告知了他的会员卡号,店员从系统中就知道了他所有个人信息.包括地址.电话.身高体重.医疗记录.过敏史.家里几口人.家里人的健康状态.房贷.个人信用,最后还包括他现在骑着摩托车拨打电话的GPS定位.并针对他目前这些信息定向推销店内减肥的.低糖的.够他家庭6人份的披萨,还指出他最好用现金支付,因为他信用卡已经超支. 以上这些信息我们都知道,是我们在工作.生活中一个一个产生的,但是是存储在餐饮.医疗.电信.交通.金融等各种领域服务

看浪潮M5如何应对“万物AI时代”

继年初人工智能首次写入政府工作报告后,国务院近日印发我国第一个人工智能(AI)规划--<新一代人工智能发展规划>,人工智能从一个技术热点上升为一项国家战略.而作为智慧计算领导者的浪潮,近期发布了M5新一代服务器,推出通用.融合架构.应用优化和关键业务4大系列35款产品,面向云计算.大数据.深度学习三大应用场景提供业界最丰富的产品阵列,为国家人工智能战略的发展提供了极致丰富的计算平台. 浪潮AI产品家族 人工智能是浪潮智慧计算的重心 新一代M5反映出浪潮比较重要的变化是,服务器设计从均衡开始走向

李开复@GMIC:AI时代科学家该不该创业 | 全文+PPT

GMIC 2017 北京大会于4月27日在国家会议中心拉开帷幕.大会以"天·工·开·悟"为主题,领袖论坛上,创新工场李开复为现场观众做了题为<人工智能时代的科学家创业>的演讲,他对人工智能领域的创业充满信心,同时提出了一些需要注意的问题,包括如何平衡人工智能科学家的研究与创业?如何引导人工智能的发展朝更有利于人类福祉的方向前进等内容. 人工智能发展中必须考虑的问题 李开复:霍金教授做了非常精彩的演讲,我认为人类有像霍金教授这样有远见的科学家,帮助我们的顶尖天才和世界最重要的

2016中国国际大数据大会:大数据时代下的机遇和挑战

ZD至顶网CIO与应用频道 10月09日 北京消息:十一假期前,一年一届的中国国际大数据大会在京闭幕.本届由人民邮电出版社主办,<大数据>杂志.数创汇承办的大会,以"数聚新动能.数创大未来"为题,共同探讨了大数据的发展态势,以及技术如何与行业紧密融合. 以下为嘉宾精彩观点整理: 国家信息化专家咨询委员会常务副主任周宏仁:中国GDP不能靠房产,数据资产是条路子 因为大数据产业的绿色.高效.门槛相对也比较低,所以是最具有潜力的新兴产业之一.但要想发展一个数据企业的话,实际上有三