Hadoop Apache Pig Apache Kafka Apache Storm

Impala Zookeeper SAS TensorFlow 人工智能基础 Apache Kylin Openstack Flink MapReduce 大数据云计算

用户登录

还没有账号?立即注册

用户注册

点击换图

mapreduce算法排序

作者: meet-
来源: 51数据库
2020-10-04

但是该方法在处理大型文件时效率极低，因为一台机器必须处理所有输出文件，从而完全丧失了MapReduce所提供的并行架构的优势。

　　mapreduce其实不适合做机器学习，更适合进行大规模数据的处理
因为机器学习是计算密集型的任务，通常需要反复的迭代，而mapreduce中间数据存放在磁盘上，速度很慢。
机器学习算法建议使用mpi框架或者spark ml

推荐阅读

热点文章

mapreduce中的序列化

mapreduce实现分页

mapreduce 清洗日志

mapreduce字典

mapreduce 函数式编程

mapreduce 函数式编程

MapReduce是一个框架吗

MapReduce是一个框架吗

mapreduce 数据集

mapreduce编码

mapreduce设计模式培训

mapreduce设计模式培训

软件

前端设计

程序设计

Java相关