使用DataStage Java Integration Stage和Java Pack从Excel源文件中提取数据

简介

IBM InfoSphere Information 服务器由一套可帮助企业从遍布多个数据源系统的信息中获取 业务价值的数据集成产品组成。它有助于以某种具有成本效益的方式从多个异构数据源中分析、清理和集成信 息。有了 IBM InfoSphere Information Server,企业能够以较低的成本和风险提高其运营效率。

IBM Information Server DataStage 是一个 ETL 产品,可帮助组织提取、转换和加载来自异构数据源的数据。 DataStage 可使用其高性能并行框架通过集成各种数据源来解决复杂的业务问题。

DataStage Java Integration Stage 和 DataStage JavaPack plug-ins

Java Integration Stage 是一个 DataStage Connector,可以使用它从 InfoSphere Data Stage 和 Quality Stage 并行任务中调用一个自定义 Java 应 用程序。Java Integration Stage 在 IBM InfoSphere Information Server 9.1 或更高版本中提供。Java Integration Stage 可用于以下拓扑结构中:作为一个源、作为一个目标、作为一个转换器、作为一个查找阶 段。

DataStage Java Pack 是两个插件阶段(Java Transformer 和 Java Client)的集合,可以通过 它来调用 DataStage 中的 Java 应用程序。Java Pack 在 DataStage 7.5.x 或更高版本中提供。

Java Transformer 阶段是一个主动阶段,用于调用一个 Java 应用程序,该应用程序可读取输入数据 并对其进行转换,然后将其写入 DataStage 作业中定义的输出链接。Java Client 阶段是一个被动阶段,可 作为一个源、一个目标以及一个查找阶段使用。作为目标阶段使用时,Java Client Stage 将使用数据。作为 一个查找阶段时,Java Client Stage 将执行查找功能。

您可以使用 Java Integration Stage (Unstructured Data Stage)或者任何 Java Pack Stages 来提取 Excel 数据。具体情况取决于部署的 Information Server 版本。如果您使用的是 Information Server 9.1,那么可以使用 Unstructured Data Stage 或 Java Integration Stage 来提取 Excel 数据。如果您使用的是 9.1 之前的版本(比如,8.7.x、 8.5.x、8.1.x、8.0.1 和 7.5.x),则必须使用 Java Pack Stages(Java Transformer Stage 或 Java Client Stage)从 Excel 文件中提取数据。本文将介绍如何使用 Java Integration Stage 和 Java Pack Client Stage 来提取 Excel 数据。

DataStage Java Integration Stage 和 Java Client Stage GUI 属性

Java Integration Stage GUI

Java Integration Stage 和 Java Client Stage 在 DataStage Designer Palette 的 Real Time 阶段提供。要使用 Java Integration Stage 和 Java Pack Stages,需要启动 DataStage Designer,创建一个新作业,扩展 Palette 中的 Real Time Stages 类别,然 后拖拽该阶段。

图 1. Palette 中的 Java Integration Stage 和 JavaPack Stages

Java Integration 阶段根据不同的使用环境(源、目标和查找)支持不同的属性。必须配置阶段属性来定义 Java 虚拟机配置以及从 Java Integration 阶段调用的 Java 类。输入链接和输出链接属性必须根据作业设计进行 配置。

图 2. 阶段属性

时间: 2025-01-20 20:05:08

使用DataStage Java Integration Stage和Java Pack从Excel源文件中提取数据的相关文章

试图用java从excel文件中读取数据时出现的问题

问题描述 试图用java从excel文件中读取数据时出现的问题 org.apache.poi.POIXMLException: org.apache.poi.openxml4j.exceptions.InvalidFormatException: OPC Compliance error [M4.1]: there is more than one core properties relationship in the package ! at org.apache.poi.util.Packa

java程序中导入数据

问题描述 一个java程序,需要用到另一个文件中的数据,应该怎样导入?另一个文件应该是什么格式的呢?最好给出命令示范 解决方案 解决方案二:在程序裡讀檔案.解决方案三:InputStreamin=getClass().getResourceAsStream(file)解决方案四:同上/....解决方案五:引用楼主zhangyouxinboy的回复: 一个java程序,需要用到另一个文件中的数据,应该怎样导入?另一个文件应该是什么格式的呢?最好给出命令示范 你另一个文件是什么文件?计算机里的文件不

java 使用 Apache POI批量导入导出excel教程及实例

一.定义 Apache POI是Apache软件基金会的开放源码函式库,POI提供API给Java程序对Microsoft Office格式档案读和写的功能. 二.所需jar包:   三.简单的一个读取excel的demo 1.读取文件方法      /**      * 读取出filePath中的所有数据信息      * @param filePath excel文件的绝对路径      *       */          public static void getDataFromEx

IBM BPM配置生成Java Integration Service集成到Java组件

本文还讨论了一个简单的操作场景,通过传递简单的.基于数组的数据来调用本地方法. IBM Business Process Manager V7.5 是一个全面的.可使用的业务流程管理平台,提供业务流程的管理和可视性.它将来自 WebSphere® Process Server.WebSphere Lombardi Edition 和 IBM Integration Designer 的关键功能集成到一个统一的用户环境(包括统一的库.创建工具和运行时环境)中,以便设计.执行.监视和优化业务流程.I

Java枚举(用Java普通类模拟枚举的实现原理及JDK枚举API使用示例)

枚举的特点: ◆类型安全(Type Safety)  ◆紧凑有效的枚举数值定义(Compact, Efficient Declaration of Enumerated Values)  ◆无缝的和程序其它部分的交互操作(Seamless integration with other language features)  ◆运行的高效率(Runtime efficiency) 详情请看:http://www.51cto.com/specbook/11/32877.htm 1.使用Java普通类

Spring Boot 项目构建 之 使用 Gradle 构建 Java 项目(Building Java Projects with Gradle)

Table of contents What you'll build What you'll need How to complete this guide Set up the project Install Gradle Find out what Gradle can do Build Java code Declare dependencies Build your project with Gradle Wrapper Summary Tags gradle Concepts and

[JAVA]十四种Java开发工具点评_JSP编程

  在计算机开发语言的历史中,从来没有哪种语言象Java那样受到如此众多厂商的支持,有如此多的开发工具,Java菜鸟们如初入大观园的刘姥姥,看花了眼,不知该何种选择.的确,这些工具各有所长,都没有绝对完美的,就算是老鸟也很难做出选择.在本文中我简要介绍了常见的十四种Java开发工具的特点,管中窥"器",希望能对大家有所帮助. 1.JDK (Java Development Kit) 2.Java Workshop 3.NetBeans 与Sun Java Studio 5 4.Borl

Java压缩类库的使用-4.Apache commons compress中的打包、压缩类库

inkfish原创,请勿商业性质转载,转载请注明来源(http://blog.csdn.net/inkfish ). Apache commons compress BZIP2压缩:(来源:http://blog.csdn.net/inkfish) package study.inkfish.compress; import java.io.BufferedInputStream; import java.io.BufferedOutputStream; import java.io.File;

java类的问题-java编写从10000到99999种数字中,找到AABCC类型的所有数字

问题描述 java编写从10000到99999种数字中,找到AABCC类型的所有数字 java编写从10000到99999种数字中,找到AABCC类型的所有数字的程序.求指点 解决方案 我不认为本题有必要去"找到"这些类型的数字,我们用程序去生成的效率更高更方便. for(int i=1;i<10;i++){ for(int j=1;j<10;i++){ for(int k=1;k<10;k++){ //如果要求A,B,C不相同,加上 //if(i==j||i==k|