电力负荷预测是电力系统调度、用电、计划、规划等管理部门的重要工作之一。提高负荷预测水平,有利于计划用电管理,有利于合理安排电网运行方式和机组检修计划,有利于节煤、节油和降低发电成本,有利于制定合理的电网建设规划,有利于提高电力系统的经济效益和社会效益。因此,负荷预测已成为实现电力系统管理和现代化的重要内容之一。
IBM SPSS Modeler 简介
IBM SPSS Modeler 是一组数据挖掘工具,通过这些工具可以采用计算机技术快速建立预测性模型,并将其应用于商业活动,从而改进决策过程。
IBM SPSS Modeler 提供了各种借助机器学习、人工智能和统计学的建模方法。通过建模选项板中的方法,您可以根据数据生成新的信息以及开发预测模型。每种方法各有所长,同时适用于解决特定类型的问题。
CRISP-DM 过程模型
IBM SPSS Modeler 参照行业标准 CRISP-DM 模型设计而成,可支持从数据到更优商业成果的整个数据挖掘过程。
通用的 CRISP-DM 过程模型包括六个用来解决数据挖掘主要问题的阶段。这六个阶段拟合在一个为将数据挖掘应用于较大业务实践而设计的循环过程中。
商业理解:确定业务对象、评估情况、确定数据挖掘目标以及制订工程计划。
数据理解:收集初始数据、描述数据、探索数据和验证数据质量。
数据准备:选择、清理、构建、集成数据以及格式化数据。
建模:选择建模技术、生成测试设计,以及构建和评估模型。
评估:评估结果、查看数据挖掘过程,以及确定后续步骤。
部署:计划部署、监视和维护、生成最终报告,以及复查该工程。图 1. CRISP-DM 模型
IBM SPSS Modeler 丰富的模型为电力负荷预测提供支持
IBM SPSS Modeler 数据挖掘工具,提供了多种数据挖掘算法,支持数据挖掘的完整过程,将其用于电力负荷预测,可以有效地提高负荷预测的准确性和时效性。
时间序列模型
时间序列是以规律的时间间隔采集的测量值的有序集合,例如,每日的股票价格或每周的销售数据。时间序列建模方法假定历史总会自我重演——即使不是完全一样也会非常接近,足以通过研究过去对将来作出更好的决策。
时间序列模型可以分为指数平滑模型和综合自回归移动平均 (ARIMA) 。
指数平滑模型:是一种使用以前的序列观察的加权值来预测未来值的预测方法。因此,指数平滑不是以对数据的理论理解为基础的。
ARIMA 模型:比起指数平滑模型在对趋势和季节组件建模方面可提供更成熟的方法,特别是,增加了可在模型中包括自变量(预测变量)的优势。这包括明确指定自回归阶数和移动平均阶数以及差分次数。可以包含预测变量并为任意或所有预测变量定义变换函数以及指定对离群值的自动检测或精确设置。