书籍名称:开源大数据分析引擎Impala实战

页数:329

作者:贾传青著

出版时间:2015

ISBN:9787302390022

出版社:北京:清华大学出版社

简介:Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据。Impala1.0版比原来基于MapReduce的HiveSQL查询速度提升3~90倍,因此,Impala有可能完全取代Hive。作者基于自己在本职工作中应用Impala的实践和心得编写了本书。本书共分10章,全面介绍开源大数据分析引擎Impala的技术背景、安装与配置、架构、操作方法、性能优化,以及最富技术含量的应用设计原则和应用案例。本书紧扣目前计算技术发展热点,适合所有大数据分析人员、大数据开发人员和大数据管理人员参考使用。


前部分目录

第1章 Impala概述、安装与配置——1
1.1 Impala概述——1
1.2 Cloudera Manager安装准备——2
1.3 CM及CDH安装——10
1.4 Hive安装——23
1.5 Impala安装——26
第2章 Impala入门示例——29
2.1 数据加载——29
2.2 数据查询——36
2.3 分区表——37
2.4 外部分区表——41
2.5 笛卡尔连接——44
2.6 更新元数据——45
第3章 Impala概念及架构——47
3.1 Impala服务器组件——47
3.1.1 Impala Daemon——47
······
······
······

声明:本站资源均来源于互联网,旨在给网友提供一个交流学习的平台,产生费用仅为网站运营赞助费。版权属于原作者,若有侵权,请联系微信客服告知,我们会立即处理。