4.17 智能信息服务中的粒计算
所谓智能信息服务,是针对用户的信息需求,智能地对信息进行生产、收集、处理、加工、存储、传输、检索和利用,并以信息产品的方式为用户提供服务。信息即数据,智能信息服务和数据的分析与挖掘是紧密相关的,甚至可以说,数据分析与挖掘是当今智能信息服务的关键所在。随着信息通信技术的迅猛发展,特别是以博客、社交网络、基于位置的服务为代表的新型信息发布方式的不断涌现,数据正以前所未有的速度呈爆炸式增长。来势汹涌的数据浪潮,将人类带进了大数据时代。
然而,大数据自身存在的诸多问题,给我们处理和利用大数据带来不便。下面就以电力大数据为例加以说明。① 数据混杂,质量低下。除电力数据采集与监测系统(SCADA)收集到的数据之外,气象与环境监测数据因与故障预警相关也应在收集之列。这样所产生的数据更加随机、无序,甚至有误,加剧了电力大数据所固有的数据质量低下问题,同时数据规模也更加巨大。② 多源异构。上述数据来源多样[1] 、种类繁多(数值、文本、图像、视频)、结构各异(结构化、半结构化、非结构化)、密度不同,多源异构特点极为突出。③ 实时处理要求。电力大数据和气象与环境监测数据都是流数据,速度快,需实时处理。④ 内在不确定性。大数据的内在不确定性增加了决策的难度[2-3] ;传统的数据分析方法没有充分利用多源数据的信息,导致决策的局限性。
然而解决以上问题仅仅依靠传统的数据挖掘方法很难奏效。粒计算理论与方法为大数据的分析和处理提供了新的思路,尤其适合于解决大数据中广泛存在的不确定性问题。
时间: 2024-09-24 15:06:52