Kettle项目的一些新动向
发表于: 2006.12.14 20:39
分类: BI(商业智能)
出处: http://qinhui99.itpub.net/post/2570/240830
---------------------------------------------------------------
最近从Kettle的开发者邮件列表里,看到了一些有趣的东西,拿出来和大家分享一下。:)
首先,是Kettle支持集群了。主开发者Matt最新测试的纪录:
最近Kettle集群基于 Amazon Elastic Computing Cloud做了一次测试,单台服务器输出4000 rows/sec ,数据库为MySQL. 如果你发送数据通过sockets从一个master到5个slave servers, 你将获得 5x4000 row inserts/sec。集群的效果非常好.
这样Kettle处理大数据量ETL的时候,就没有问题了。
其次,主开发者Matt很顽固,拒绝使用GEF框架和Eclipse RCP来改造Kettle界面。呵呵,Matt确实是个很顽固的人,只要是他认为对的,他就会坚持。让我们看看他的理由:
> did someone ever thought about using the GEF framework within Kettle?
Obviously I did a few years ago when I built Kettle. The reason for not
using it was the same as for not using Eclipse RCP...
Both were (and are) hideously complex to use and now frankly I just don't care about it anymore.
That being said, there already is a separation of the GUI code and model.
If it scratches an itch, if it's that easy go right ahead.
大意是Matt觉得GEF 和RCP过于复杂,难以使用。而Kettle当前的界面和模型的代码已经很好的分离了,所以Matt认为应该把精力放到别的开发工作去。
尽管有很多开发者认为Kettle应该可以使用GEF 或RCP改造界面,但因为Matt的坚持,看来没戏了。呵呵,这是开源项目的一个特色,主开发者说了算。我个人同意Matt的意见,Kettle没有必要把精力放在图形界面上,还是应该去开发别的新功能吧。另外,有那么多时间的话,还不如好好重写用户手册。Kettle目前的文档真的太少了。
最后,要说一下,Kettle是一个开放的组织,欢迎有志之士加入,贡献自己的力量。请不要马上要求获得Kettle项目的读写权限,因为你需要获得Kettle开发者的认可。只要你做出了贡献,自然就得到相应的权利。订阅Kettle开发者邮件列表:kettle-developers@googlegroups


