kubernetes 1.5 集群

作者: GAGAMAGA
来源: 51数据库
2020-09-24

Kubernetes是一个开源项目，它把谷歌的集群管理工具引入到虚拟机和裸机场景中。它可以完美运行在现代的操作系统环境（比如CoreOS
和Red Hat
Atomic），并提供可以被你管控的轻量级的计算节点。Kubernetes使用Golang开发，具有轻量化、模块化、便携以及可扩展的特点。我们
（Kubernetes开发团队）正在和一些不同的技术公司（包括维护着Mesos项目的MesoSphere）合作来把Kubernetes升级为一种
与计算集群交互的标准方式。Kubernetes重新实现了Google在构建集群应用时积累的经验。这些概念包括如下内容：

Pods：一种将容器组织在一起的方法；

Replication Controllers：一种控制容器生命周期的方法（译者注：Replication Controller确保任何时候Kubernetes集群中有指定数量的pod副本(replicas)在运行）；

Labels：一种可以找到和查询容器的方法；

Services：一个用于实现某一特定功能的容器组；

因此，只要使用Kubernetes你就能够简单并快速的启动、移植并扩展集群。在这种情况下，集群就像是类似虚拟机一样灵活的资源，它是一个逻辑运算单元。打开它，使用它，调整它的大小，然后关闭它，就是这么快，就是这么简单。

Mesos和Kubernetes的愿景差不多，但是它们在不同的生命周期中各有不同的优势。Mesos是分布式系统内核，它可以将不同的机器整
合在一个逻辑计算机上面。当你拥有很多的物理资源并想构建一个巨大的静态的计算集群的时候，Mesos就派上用场了。有很多的现代化可扩展性的数据处理应
用都可以在Mesos上运行，包括Hadoop、Kafka、Spark等，同时你可以通过容器技术将所有的数据处理应用都运行在一个基础的资源池中。在
某个方面来看，Mesos是一个比Kubernetes更加重量级的项目，但是得益于那些像Mesosphere一样的贡献者，Mesos正在变得更加简

　　先决条件
确保在你集群中的每个节点上都安装了所有必需软件。
获取hadoop软件包。
安装
安装hadoop集群通常要将安装软件解压到集群内的所有机器上。
通常，集群里的一台机器被指定为 namenode，另一台不同的机器被指定为jobtracker。这些机器是masters。余下的机器即作为datanode也作为tasktracker。这些机器是slaves。
我们用hadoop_home指代安装的根路径。通常，集群里的所有机器的hadoop_home路径相同。
配置
接下来的几节描述了如何配置hadoop集群。
配置文件
对hadoop的配置通过conf/目录下的两个重要配置文件完成：
hadoop-default.xml - 只读的默认配置。
hadoop-site.xml - 集群特有的配置。
要了解更多关于这些配置文件如何影响hadoop框架的细节，请看这里。
此外，通过设置conf/hadoop-env.sh中的变量为集群特有的值，你可以对bin/目录下的hadoop脚本进行控制。
集群配置
要配置hadoop集群，你需要设置hadoop守护进程的运行环境和hadoop守护进程的运行参数。
hadoop守护进程指namenode/datanode 和jobtracker/tasktracker。
配置hadoop守护进程的运行环境
管理员可在conf/hadoop-env.sh脚本内对hadoop守护进程的运行环境做特别指定。
至少，你得设定java_home使之在每一远端节点上都被正确设置。
管理员可以通过配置选项hadoop_*_opts来分别配置各个守护进程。下表是可以配置的选项。