用户登录
用户注册

分享至

java使用hadoop

  • 作者: 宫家啊
  • 来源: 51数据库
  • 2020-09-25
java项目一般是不会用到hadoop的,除非涉及到处理大数据方面的业务。hadoop是用java实现的。主要原因如下:
  1. java比较适合做大型复杂系统
  2. Doug Cutting本身从事java方面的研究,主要是lucence,开源检索架构说来也是这样的。
  3. java开源,活跃程度最高,这样搞出来放在apache上有利于交流、改进
  Hadoop是一个由Apache基金会所开发的分布式系统基础架构。
  用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。
  Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据。
  Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。



  hadoop 是分布式架构,专门用来解决大数据处理问题,你可以想像,100台电脑上的数据库,都存储自然灾害数据,该怎么查询呢(一台电脑存不下啊!!),传统技术查询,估计几百年也查不出来,使用分布式架构,则很快就查到了,立刻就可以定位灾害位置了。很有用吧!



  hadoop是分布式架构,专门用来解决大数据处理问题,可以想像,100台电脑上的数据库,都存储自然灾害数据,该怎么查询呢?传统技术查询,估计几百年也查不出来,使用分布式架构,则很快就查到了,立刻就可以定位灾害位置了。
软件
前端设计
程序设计
Java相关