java实现mapreduce
- 作者: 长的帅免费日
- 来源: 51数据库
- 2020-09-27
Hadoop的创始人是Doug Cutting, 同时也是著名的基于Java的检索引擎库Apache Lucene的创始人。Hadoop本来是用于著名的开源搜索引擎Apache Nutch,而Nutch本身是基于Lucene的,而且也是Lucene的一个子项目。因此Hadoop基于Java就很理所当然了。
hadoop实现了一个分布式文件系统(hadoop distributed file system),简称hdfs。hdfs有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高传输率(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。hdfs放宽了(relax)posix的要求,可以以流的形式访问(streaming access)文件系统中的数据。
hadoop的框架最核心的设计就是:hdfs和mapreduce.hdfs为海量的数据提供了存储,则mapreduce为海量的数据提供了计算
hadoop实现了一个分布式文件系统(hadoop distributed file system),简称hdfs。hdfs有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高传输率(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。hdfs放宽了(relax)posix的要求,可以以流的形式访问(streaming access)文件系统中的数据。
hadoop的框架最核心的设计就是:hdfs和mapreduce.hdfs为海量的数据提供了存储,则mapreduce为海量的数据提供了计算
推荐阅读
