hadoop 多个文件
- 作者: 其实我不想把名字取得那么长那么长那么
- 来源: 51数据库
- 2020-12-09
1、这个是bai不可能的。
2、如果有这du个功能的操作,zhi也是通过多个daocopy,最后merge实现的。
3、这专也是为什么你用属hadoop做最基本的wordcount的时候,在你的生成的记数结果中,总会有part-00001.....part-00002等这样的文件结果集的原因了。哪怕生成的结果集很小,也会是这样的存放方式。当然这是建立在你有多个datanode的前提下的。
再想想看吧。
2、如果有这du个功能的操作,zhi也是通过多个daocopy,最后merge实现的。
3、这专也是为什么你用属hadoop做最基本的wordcount的时候,在你的生成的记数结果中,总会有part-00001.....part-00002等这样的文件结果集的原因了。哪怕生成的结果集很小,也会是这样的存放方式。当然这是建立在你有多个datanode的前提下的。
再想想看吧。
推荐阅读