java实现mapreduce

作者: 长的帅免费日
来源: 51数据库
2020-09-27

Hadoop的创始人是Doug Cutting，同时也是著名的基于Java的检索引擎库Apache Lucene的创始人。Hadoop本来是用于著名的开源搜索引擎Apache Nutch，而Nutch本身是基于Lucene的，而且也是Lucene的一个子项目。因此Hadoop基于Java就很理所当然了。

　　hadoop实现了一个分布式文件系统（hadoop distributed file system），简称hdfs。hdfs有高容错性的特点，并且设计用来部署在低廉的（low-cost）硬件上；而且它提供高传输率（high throughput）来访问应用程序的数据，适合那些有着超大数据集（large data set）的应用程序。hdfs放宽了（relax）posix的要求，可以以流的形式访问（streaming access）文件系统中的数据。
hadoop的框架最核心的设计就是：hdfs和mapreduce.hdfs为海量的数据提供了存储，则mapreduce为海量的数据提供了计算

推荐阅读