在 Hadoop Streaming 中生成单独的输出文件
- 作者: 宝爷心太乱
- 来源: 51数据库
- 2023-01-12
问题描述
只使用一个映射器(一个 Python 脚本)而不使用 reducer,我怎样才能为每一行输出输出一个以键作为文件名的单独文件,而不是输出长文件?
Using only a mapper (a Python script) and no reducer, how can I output a separate file with the key as the filename, for each line of output, rather than having long files of output?
推荐答案
您可以使用 python 文件函数写入本地文件系统上的文本文件,或者如果您想使用 HDFS,请使用 Thrift API.
You can either write to a text file on the local filesystem using python file functions or if you want to use HDFS use the Thrift API.
推荐阅读
热点文章
Discord.py(重写)on_member_update 无法正常工作
0
Discord.py 在 vc 中获取用户分钟数
0
discord.py 重写 |为我的命令出错
0
Discord.py rewrite 如何 DM 命令?
0
播放音频时,最后一部分被切断.如何解决这个问题?(discord.py)
0
在消息删除消息 Discord.py
0
如何使 discord.py 机器人私人/直接消息不是作者的人?
0
(Discord.py) 如何获取整个嵌入内容?
0
Discord bot 尽管获得了许可,但不能提及所有人
0
Discord.py discord.NotFound 异常
0
