用户登录
用户注册

分享至

impala 部署

  • 作者: 骑天大女巫
  • 来源: 51数据库
  • 2020-10-03
安装impala
  这里介绍使用rpm包安装的方式(需有root或sudo权限),基于源码包安装的方式待后续折腾。
  1.2.1 安装前需知
  impala能使用的内存无法超过系统的硬件可用内存(GA版,查询需要的内存如果超出硬件内存,则查询将失败),对内存要求高,典型的硬件内存为:32~48G
  impala(版本0.4)只支持redhat 5.7/centos 5.7或redhat 6.2/centos 6.2以上(好像还要求是64位的,所以建议安装在64位系统上),不支持ubuntu
  假设你已经安装了CDH4(即Hadoop 2.0)
  假设你已经安装了Hive,并配置一个外部数据库(如MySQL)供Hive存储元数据。可通过执行下面的命令来判断Hive是否安装正常
$ hive
hive> show tables;
OK
Time taken: 2.809 seconds
  这里请原谅我没有提到Hadoop和Hive的安装过程,还请尊驾自行搜索。
  Impala不支持的特性:
1. 查询流数据
2. 删除数据
3. 索引(至少当前版本不支持)
4. YARN集成(至少当前版本不支持)
5. 全文搜索
6. 不具有像Hive SerDe的可扩展机制
7. 不支持线上查询容错,如果查询出错,如机器宕机,Impala将会丢弃本次查询。
8. 不支持表和列级别的授权
9. impalad实例之间的传输没有加密
10. 不支持Hive UFS
11. beta版尚不支持JDBC,计划GA版支持

12. 如果我的回答没能帮助您,请继续追问。
13. 转载,仅供参考。



  

搜一下:如何在Apache hadoop2.2.0下面部署impala-CSDN论坛
软件
前端设计
程序设计
Java相关