引言
Compute Grid 是 IBM WebSphere Extended Deployment V6.1 中推出的一项功能,提供了最完整的企业 Java 批处理编程解决方案。通过 Compute Grid,您可以得到:
简洁但同时也非常强大的基于传统 Java 对象(plain old Java object,POJO)的编程模型。
简单打包。
简单的部署模型。
全功能作业控制语言(Job Control Language,JCL)。
成熟的作业调度程序。
可靠的执行环境。
全面的工作负载管理和管理工具。
虽然 Compute Grid 设计为与其他 WebSphere Extended Deployment 功能进行协作,但也可以独立对其进行购买和部署。在生产环境中,Compute Grid 使用 IBM WebSphere Application Server Network Deployment(此环境采用分布式多计算机配置)进行操作,但 Compute Grid 也提供了单元测试环境,可以在其中运行独立的 WebSphere Application Server。Compute Grid 还提供了基于 Eclipse 的开发体验,而且支持将 IBM Rational Application Developer 作为全功能开发环境使用。
本文将说明如何使用 Compute Grid 进行 Java 批处理编程。不过,您首先务必充分了解批处理作业及 Compute Grid 所提供的用于构建批处理应用程序的编程模型。讨论了这两个主题后,本文将指导您使用 Compute Grid 和批处理模拟器测试实用工具开发简单的批处理应用程序。
批处理作业剖析
从较为抽象的角度而言,批处理作业是声明性构造,可指示执行一个或多个批处理应用程序组成的序列并指定其输入和输出。批处理作业按顺序执行这组任务,以完成特定业务功能。批处理应用程序是设计为在后台以非迭代方式执行的程序。输入和输出通常作为逻辑构造供批处理应用程序访问,而且由批处理作业定义映射到具体的数据资源。
批处理作业通常要处理大量输入/输出数据(通常是面向记录的),这些数据通常是关键业务数据,如客户账户、销售数据等等。批处理作业执行的业务处理任务的范围很广,包括发票生成、账户优化、商机分析等。批处理任务已经在 System z(大型机)环境中使用了几十年,直到今天还继续在很多大中型企业中作为中枢系统使用。
批处理作业的基本内容包括图 1 所示的组成部分。
图 1. 批处理作业剖析
作业定义描述了要执行的批处理步骤及其运行顺序。每个步骤都定义了要调用的特定批处理应用程序及其输入与输出数据。数据的常见源和目的地包括文件、数据库、事务系统、消息队列等。