Impala是Cloudera公司主导研发的高性能、低延迟的交互式SQL查询引擎,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据。Impala是CDH平台首选的PB级大数据实时交互式查询分析引擎
2015年11月,Cloudera将Impala捐赠给了Apache,2017年11月,Impala从Apache孵化器毕业。以前在文档中称为Cloudera Impala的地方,现在已经正式更名为Apache Impala
Impala是一个基于Hive、分布式、大规模并行处理(Massively Parallel Processing,MPP)的数据库引擎。除了使用相同的统一存储平台外,Impala还使用与Apache Hive相同的元数据、SQL语法(Hive SQL)、ODBC驱动程序和用户界面(Hue)
Impala直接针对存储在HDFS、HBase或S3中的Apache Hadoop数据提供快速的交互式SQL查询
Impala是一个可用于大数据查询的工具补充。Impala不会替代基于MapReduce构建的批处理框架Hive,Hive和基于Spark框架查询的Hive最适合长时间运行的批处理作业。例如,涉及提取、转换和加载(ETL)类型作业的批处理