Hadoop Apache Pig Apache Kafka Apache Storm

Impala Zookeeper SAS TensorFlow 人工智能基础 Apache Kylin Openstack Flink MapReduce 大数据云计算

用户登录

还没有账号?立即注册

用户注册

点击换图

spark no hadoop

作者: 河北高学成
来源: 51数据库
2020-10-04

spark基于内存处理，速度快。hadoop基于磁盘读取，速度慢些，但spark对内存要求高。spark可以用hadoop底层的hdfs作为存储。两个结合效果更好

　　hadoop在外存处理数据，spark在内存处理数据。hadoop适合迭代处理，擅长批量处理;spark适合流处理，不擅长迭代处理。spark处理速度更快，但是太吃内存。

推荐阅读

热点文章

docker部署hadoop集群

docker部署hadoop集群

hadoop应用架构作者

hadoop产品族

hadoop 启动服务

hadoop小规模

hadoop 优化思路

hadoop可以开发什么

医院组建hadoop

软件

前端设计

程序设计

Java相关