Hive原理及查询优化

免费

主讲人:李虎翼

自2010年起开始研究Hive/Hadoop基础架构,在硅谷及国内专注于大数据产品基础架构的工作多年,对Hive及Hadoop源码及优化有深入的研究。

主题:Hive原理及查询优化

讲座概要:

Hive是Hadoop上事实的SQL标准,也是Hadoop使用是为广泛的数据仓库和数据分析工具,几乎是所有工业界公司的首选大数据工具。随着Hive 2.1的发布,Hive引入了大量的新特性,很好地解决了很多工业界的常用问题。本次讲座就是以从Hive的在工业界的界的实际使用讲起,深入浅出分析Hive 2.1新特性,如Tez, LLAP, HiveServer2, ACID以及各种查询优化。讲座会涉及概念、原理及典型的工业案例。

 

▣ :讲座提纲

 

1. Hive基本使用及Cli

2. Hive多种语法Join / Group By

3. 作业执行 Mapreduce / Tez

4. 算子 Operators

5. UDF/UDAF/UDTF

6. LLAP (Long Live And Process)

7. HiveServer 2

8. ACID及存储过程的原理

9. 各种查询优化器

授课教师

李虎翼    资深大数据开发工程师2010年起开始研究Hive/Hadoop源码,曾在国内一线互联网公司和硅谷知名公司从事大数据基础架构研发...