有一定Hadoop基础或对Hive感兴趣的人群。
本课时是Hive部分高级的特性,掌握好这些特性能大大提升Hive的执行效率;在优化过程中可以很好的借助于执行计划来进行分析;本课时还会介绍3个本人在生产中遇到的常见案例。
学习目标:
1.了解Hive元数据表结构及关联关系 ;
2.掌握Hive执行计划 ;
3.掌握Hive中各种join的对比 ;
4.了解Hive如何将SQL语句转换成MapReduce作业 ;
5.能够进行Hive的常见调优 ;
6.掌握Hive生产中常用操作 。
学习建议:
1.Hive性能优化是在生产中的最重要的环节,如何解决数据倾斜是关键;
2.梳理清楚Hive元数据各个表之间的关联关系也能提升对Hive的把握能力。
下载资料:有
评论读取中...