随着公司的进一步发展,产生了大量的数据,而这些数据中包含了大量的垃圾信息,当然了还有一些有价值的数据,而我们的方法就是利用Kettle对这些数据进行抽取、分离、清洗等一系列转化。一般把kettle安装在win7系统下,这里我要讲解的是安装在Linux服务器中。