hadoop 集群间数据迁移

hadoop 集群间数据迁移

新搭建的集群 要帮旧数据迁移过来 ,查了一下资料 做个记录。

hadoop集群之间有时候需要将数据进行迁移,如将一些保存的过期文档放置在一个小集群中进行保存。

使用的是社区提供的功能,distcp。用法非常简单:

hadoop distcp hdfs://nn1:8020/foo/bar hdfs://nn2:8020/bar/foo

加上参数 -i 表示不用去管failure -m 设置map数