搜文章
推荐 原创 视频 Java开发 iOS开发 前端开发 JavaScript开发 Android开发 PHP开发 数据库 开发工具 Python开发 Kotlin开发 Ruby开发 .NET开发 服务器运维 开放平台 架构师 大数据 云计算 人工智能 开发语言 其它开发
Lambda在线 > 加米谷学院 > 带你认识Impala

带你认识Impala

加米谷学院 2020-07-31

Impala 简介:

Impala 是一个高性能分析数据库,可针对存储在 Apache Hadoop 集群中的 PB 级数据进行闪电般快速的分布式 SQL 查询。Impala 还是一个现代化,大规模分布式,大规模并行的 C ++ 查询引擎,可以分析,转换和合并来自各种数据源的数据。Impala采用与Hive相同的元数据、SQL语法、ODBC 驱动程序和用户接口(Hue Beeswax),这样在使用CDH产品时,批处理和实时查询的平台是统一的。



目前支持的文件格式是文本文件和SequenceFiles(可以压缩为Snappy、GZIP和BZIP,前者性能最好)。其他格式如Avro, RCFile, LZO文本和Doug Cutting的Trevni将在正式版中支持。


Impala 提供:

● 在 Apache Hadoop 中查询大量数据(大数据)的能力;

● 集群环境中的分布式查询;

● 在不同组件之间共享数据文件的能力,无需复制或导出/导入步骤;

● 用于大数据处理和分析的单一系统。


Impala 特性:

● 最佳性能以及可扩展性。

● 支持存储在HDFS, Apache HBase和Amazon S3中的数据。

● 强大的SQL分析,包括窗口函数和子查询。

● 使用LLVM快速生成代码,生成针对每个单独查询专门定制的CPU高效代码。

● 支持最常用的Hadoop文件格式,包括 Apache Parquet项目。

● Apache许可,100%开源。


成都加米谷学院系成都加米谷大数据科技有限公司旗下教育品牌。是一家专注于大数据人才培养的机构。由来自阿里、华为、京东、星环等国内知名企业的多位技术大牛联合创办,技术底蕴丰厚,勤奋创新,精通主流前沿大数据及人工智能相关技术。面向社会提供大数据、人工智能等前沿技术的技能提升业务。



成都加米谷学院

个人技能提升 丨 企业内训提升

成都高新区吉泰一街国际科技节能大厦B座23

版权声明:本站内容全部来自于腾讯微信公众号,属第三方自助推荐收录。《带你认识Impala》的版权归原作者「加米谷学院」所有,文章言论观点不代表Lambda在线的观点, Lambda在线不承担任何法律责任。如需删除可联系QQ:516101458

文章来源: 阅读原文

相关阅读

关注加米谷学院微信公众号

加米谷学院微信公众号:dtinoneDA

加米谷学院

手机扫描上方二维码即可关注加米谷学院微信公众号

加米谷学院最新文章

精品公众号随机推荐