kettle最新版是一款专业的数据引流软件。kettle官方版集群容许转换及其转换中的流程在好几个网络服务器上高并发实行,能够用于完成数据信息的分析、清理、校检、抽取、转换和载入等各种普遍的ETL类工作中。kettle最新版数据处理功能也很强劲,特别适合于各种各样数据处理功能。
kettle是一款采用纯java编写的叫做“水壶”的软件,不仅可以在windows 平台上运行,还可以在Linux、Unix上运行,kettle包含了Spoon、Kitchen、Pan三个组件,如果你需要在电脑上使用kettle软件的话需要安装java才能正常使用哦(java环境下载)。
海外开源系统的ETL专用工具,纯java撰写;
翠绿色不用安裝,数据抽取高效率平稳;
能够在Window、Linux、Unix上运作,平稳顺畅;
集群容许转换及其转换中的流程在好几个网络服务器上高并发实行;
能够用于完成数据信息的分析、清理、校检、抽取、转换和载入等各种普遍的ETL类工作中;
数据处理功能也很强劲,特别适合于各种各样数据处理功能。
打开kettle
首先解压下载下来的压缩包如:pdi-ce-6.1.0.1-196.zip
然后打开Spoon.bat,如图所示:
打开后请耐心等待一会儿时间。
建立转换。
在文件-》新建装换。
新建转换后在左边的主对象树中建立DB连接用以连接数据库。如图所示:
建立数据库连接的过程与其他数据库管理软件连接数据库类似。
注意:在数据库链接的过程中,Kettle Spoon官方版可能会报某个数据库连接找不到的异常。那是因为你没有对应的数据库链接驱动,请下载对应驱动后,放入kettle的lib文件夹。
简单的数据表插入更新
(1)新建表插入
在左边的面板中选择“核心对象”,在核心对象里面选择“输入-》表输入”,用鼠标拖动到右边面板。如图所示:
双击拖过来的表,可以编辑表输入。
选择数据库连接和编辑sql语句,在这一步可以点击预览,查看自己是否连接正确。
(2)通过插入更新输出到表。
在左边面板中选择核心对象、选择“输出-》插入更新”如图所示:
编辑插入更新:
首先:表输入连接插入更新。
选中表输入,按住shift键,拖向插入更新。
然后:双击插入更新,编辑它。
到这里基本上,这个转换就要做完了,可以点击运行Kettle Spoon中文版查看效果,看是否有误,这个要先保存了才能运行,可以随意保存到任何一个地方。
使用作业控制上面装换执行。
使用作业可以定时或周期性的执行转换,新建一个作业。并从左边面板拖入start 和转换。
双击start可以编辑,可以设置执行时间等等。
点开装换,可以设置需要执行的转换任务,比如可以执行上面我们做的转换,XXX.ktr,
最后点击运行即可。
优化的性能和可扩展性
远程监控和执行转换
优化的报价算法
在步骤中分离架构/所有者和表名
数据库连接池支持
集群支持(MPP)
数据库分区支持(不与表划分混淆)
大量的内存和性能优化
网友评论