电力企业的非结构化数据检索研究

电力企业的非结构化数据检索研究

罗学礼 徐树振 王森 杨莉 段嘉杰

电网公司多年来建设了很多业务系统,各业务系统相互孤立应用.随着企业信息化建设的深入,业务系统中数据特别是非结构化数据的数据量急剧增长,人员查找数据信息极为不便.建设面向整个电网公司的分布式非结构化数据检索平台,该平台在Linux计算机集群上部署Hadoop开发框架以及Solr分布式全文检索系统,将各业务系统中的非结构化数据进行集中式的存储、管理,并且提供统一的搜索服务,使得企业相关人员能够高效、便捷地检索出所需的数据.实现知识服务无处不在,为员工工作提供帮助,为企业提供决策支持.

电力企业的非结构化数据检索研究

时间: 2024-08-19 06:14:03

电力企业的非结构化数据检索研究的相关文章

美国数据科学家:重视非结构化数据分析 走出两大“经典”误区

虽然基本上国内大部分公司,言必提"大数据",但是对于大部分CIO.CTO们来说,对数据的分析仍然停留在过去的阶段:对于非结构化数据分析的成熟度还远远落后于结构化数据. 但是现在移动端所带来的爆发式增长给大数据从业者带来了非常大的挑战,这些数据有很多是非结构化数据,充斥了人们交流的空间,相应的,对非结构化数据的分析也变得越来越重要--对非结构化数据进行分析.提取出有价值的东西,成为CIO.CTO们最关注的问题. 但是目前,很多人仍有非结构化数据分析等同于舆情分析的粗暴认知. 非结构化数据

IBM突围非结构化数据管理新趋势

近日,IBM在沈阳举行了IBM企业内容管理用户大会巡展.会上,IBM详细阐述了企业内容管理(Enterprise Content Management,ECM)未来发展战略.针对非结构化数据管理新趋势带来的挑战,IBM企业内容管理打破传统业务模式,首创性的推出重点行业应用模板新型业务,与IBM企业内容管理旗舰性传统解决方案--企业报告管理解决方案Content Manager OnDemand(CMOD)和信息捕获解决方案Datacap,共同为企业内容管理描绘全面解决方案蓝图,加速企业业务价值实

解决非结构化数据安全风险,从何处入手?

身份和访问管理(IAM)是很棘手的领域,是因为IAM技术和标准的复杂性.最大的挑战是弄清楚如何通过IAM战略处理企业内非结构化内容. 考虑到数据位置的多样性以及数据移动的n多种方式,解决缩写挑战以及了解不同产品提供的功能是极为重要的事情.目前很多供应商提供服务来应对这一挑战,随着新供应商以及老牌供应商扩大其IAM产品范畴,这个相对较新的领域正处在快速发展中. 企业需要全面审核其可能合作的供应商,以确保其非结构化内容能得到处理.另外更复杂的是,安全专业人员都面临着这样的问题:不确定数据在哪里,不确

分析非结构化数据的10个步骤

如今,数据分析正在成为企业发展的重要组成部分.企业必须对结构化和非结构化数据有所了解,才能更好地为业务发展做出正确决策.以下是帮助企业分析非结构化数据的10个步骤: 1.确定一个数据源 了解有利于小型企业的数据来源非常重要.企业可以使用一个或多个数据源来收集与其业务相关的信息.而从随机数据源收集数据并不是一个好办法,因为这可能会破坏数据,甚至丢失一些数据.因此,建议企业在开始收集数据之前调查相关数据源.企业可以采用一些在线大数据开发工具收集数据. 2.管理非结构化数据搜索工具 收集到的结构化或非

企业如何保护非结构化大数据

目前企业已经进入全新的大数据时代.在高带宽.移动的.网络环境中工作和生活的我们,会产生 大量的数据,这些都成为大数据的来源,而这些信息很少存在于同一个地方.在几微秒中,信息就能够发布给世界 各地的很 多人.企业的高管门(包括CEO.CIO.CSO等)都必须面对因为大数据带来的风险和安全挑战,并规划好如何去应对他们.本文将讨论如何 看待非结构化数据相对于传统的结构化数据带来的安全风险和挑战以及多层面防护方法.识别非结构化数据与结构化数据安全保护的差异信息通常被归类为结构化形式的或非结构化形式的.不

通过企业内容管理(ECM)利用大量非结构化数据

如今的企业无一不受信息泛滥的困扰,这已经不是什么秘密.我们被大量不断增长的数据包围.许多机构内的非结构化内容(从打印文档到社交媒体文章)在无节制的增长.对于许多机构而言,非结构化内容已经占到总体企业信息的 80% 或更高比例.在对纸张密集型流程挥之不去的依赖以及个人和共同使用的数字内容的混乱扩散的驱动下,此类内容不断增长. 好消息是,企业内的人员.设备和系统生成的每一则信息均可用作竞争优势.前瞻性企业已经意识到,用户与内容之间的成功互动在提高业务成果方面发挥着重要的作用.例如,在许多企业中,客户

揭秘隐藏在非结构化数据背后的真相

本文讲的是揭秘隐藏在非结构化数据背后的真相,随着互联网技术的发展,大量非结构化数据逐渐走入人们的视野,数据科学家也开始将研究重点转移至非结构化数据.据Gartner预计,全球信息量每年的最低增长率为59%,其中有15%是结构化数据,其余的85%则由各种非结构化数据组成.在IDC的一项调查报告中也指出:企业中80%的数据都是非结构化数据,这些数据每年都按指数增长60%. 非结构化数据是指那些不方便用数据库二维逻辑表来表现的数据,包括所有格式的办公文档.文本.图片.XML.HTML.各类报表.图像和

从非结构化数据中发现问题 富国银行的风险分析之道

9月初,美国消费者金融保护局称美国富国银行(Wells Fargo)员工在未告知客户的情况下,自2011年起私自建立近两百万个虚假银行账户,富国银行被要求支付1.9亿美金高额的罚款. 9月中旬我也在大洋彼岸见到了美国富国银行企业模型风险部副总裁刘维政(Richard Liu),第二次见面没有客气,一上来我就提出了"幽灵账户"和风险管控的问题.虽然刘维政最近正热衷于研究和学习太极,但他却并没有和我"打太极". "这一现象其实在很多银行都可能发生,可能只是没有

简述云存储在非结构化存储管理下的12大优势

非结构化数据,显而易见就是把信息存储在文件系统中,而不是数据库中的一种数据.据IDC的研究人员表示,如今现在有80%的企业数据是非结构化数据,而且每年都以60%的年增长率在增加.研究人员称,经常性使用的数据比例平均只有1%到5% .而未被使用数据,数量是如此的庞大并在不断的在增加,占据了企业内部第一层存储的大部分空间,是的存储资源浪费不少. 如今,使用云存储,只需支付云存储服务水平协议费用,越来越多的IT部门采用云存储模式.在不影响日常工作的情况下,如何更好地存储全球范围,那些尚具有潜在价值的不