hive和hadoop的关系
- 作者: 我不是你家隔壁的
- 来源: 51数据库
- 2020-09-28
hive是Hadoop的一个组件,作为数据厂库,hive的数据是存储在Hadoop的文件系统中的,hive为Hadoop提供SQL语句,是Hadoop可以通过SQL语句操作文件系统中的数据。hive是依赖Hadoop而存在的。
hive 就是个单机版的
hadoop包含以下组件:hdfs,mapreduce,yarn。
hive是数据仓库:用于管理结构化数据,数据存于hdfs上。
spark是一个分布式计算框架:区别于hadoop的另一种mapreduce的计算框架。基于rdd的分布式内存计算引擎。
hive 就是个单机版的
hadoop包含以下组件:hdfs,mapreduce,yarn。
hive是数据仓库:用于管理结构化数据,数据存于hdfs上。
spark是一个分布式计算框架:区别于hadoop的另一种mapreduce的计算框架。基于rdd的分布式内存计算引擎。
推荐阅读
