用户登录
用户注册

分享至

hadoop入门基础

  • 作者: 猴子出身
  • 来源: 51数据库
  • 2020-09-25
如果是掌握hadoop的使用,java基础好就可以,看看hadoop权威指南。
想深入学习源码的话,就需要些网络编程的知识了。

具体步骤:
1.选择一个Hadoop的版本,然后阅读文档了解Hadoop:What's Hadoop, Why Hadoop exists;
2.安装Hadoop,三种方式都试下;
3.在Hadoop文档里面有Hadoop Command的资料,I.hdfs command,尽量试试这两方面的命令;
4.Hadoop Files,看看Hadoop文件的概念,关注它的分布式特点,然后看Reduce函数输出文件;
5.自己写WordCount与Advanced WordCount;
6.写Sort程序;
7.使用RandomTextWriter;
8.模仿SequenceFileInputFormat、SequenceFileOutputFormat、写自己的;
9.yahoo有一个Hadoop的教程,英文版的,里面的内容很好;
10.《hadoop权威指南》当参考书,自己就可以实战了!



  hadoop入门不需要太多知识,你需要首先明确你要用hadoop干嘛~
它的配置其实是非常简单的~
明确了干嘛之后,在上网搜资料就可以很快上手了:)



  



  对Linux要有认识,也要知道Java,Lucene
软件
前端设计
程序设计
Java相关