KETTLE
使用自己总结?/p>
Kettle
使用方法和成果说?/p>
简?/p>
Kettle
是一款国外开源的
ETL
工具,纯
java
编写,可以在
Window
?/p>
Linux
?/p>
Unix
上运行,绿色无需安装,数据抽取高效稳定?/p>
Kettle
中文名称叫水壶,
该项目的主程序员
MATT
希望把各种数据放到一?/p>
壶里,然后以一种指定的格式流出?/p>
Kettle
这个
ETL
工具集,它允许你管理来自不同数据库的数据,通过提供一
个图形化的用户环境来描述你想做什么,而不是你想怎么做?/p>
Kettle
中有两种脚本文件?/p>
transformation
?/p>
job
?/p>
transformation
完成针对?/p>
据的基础转换?/p>
job
则完成整个工作流的控制?/p>
Kettle
可以?/p>
http://kettle.pentaho.org/
网站下载到?/p>
注:
ETL
,是英文
Extract-Transform-Load
的缩写,用来描述将数据从来源?/p>
经过萃取?/p>
extract
)、转置(
transform
)、加载(
load
)至目的端的过程?/p>
ETL
一词较常用在数据仓库,但其对象并不限于数据仓库?/p>
下载和安?/p>
首先,需要下载开源免费的
pdi-ce
软件压缩包,当前最新版本为
5.20.0
?/p>
下载网址?/p>
http://sourceforge.net/projects/pentaho/files/Data%20Integration/
然后,解压下载的软件压缩包:
pdi-ce-5.2.0.0-209.zip
,解压后会在当前目录
下上传一个目录,名为
data-integration
?/p>
由于
Kettle
是使?/p>
Java
开发的,所以系统环境需要安装并且配置好
JDK
?/p>
žKettle
可以?/p>
http://kettle.pentaho.org/
网站下载
ž
下载
kettle
压缩包,?/p>
kettle
为绿色软件,解压缩到任意本地路径即可?/p>
运行
Kettle
进入?/p>
Kettle
目录?/p>
如果
Kettle
部署?/p>
windows
环境下,
双击运行
spoon.bat
?/p>
Kettle.exe
文件?/p>
Linux
用户需要运?/p>
spoon.sh
文件?/p>
进入?/p>
Shell
提示行窗口,
进入到解压目录中执行下面的命令:
# chmod +x spoon.sh
# nohup ./spoon.sh &
后台运行脚本
这样就可以打开配置
Kettle
脚本?/p>
UI
界面?/p>