初识spark

免费

 

主讲人:耿嘉安

  360大数据专家

 

10余年IT行业相关经验。先后就职于阿里巴巴、艺龙、360,专注于开源和大数据领域。在大量的工作实践中,对J2EE、JVM、Tomcat、Spring、Hadoop、Spark、MySQL、Redis都有深入研究,尤其喜欢剖析开源项目的源码实现。早期从事J2EE企业级应用开发,对Java相关技术有独到见解。著有《深入理解Spark:核心思想与源码分析》和《Spark内核设计的艺术:架构设计与实现》。

 

 

▣ 主题:初识Spark

 

▣ 时间:6月30日 20:00

 

▣ 形式:视频直播

 

▣ 讲座概要:

Spark 是一种与 Hadoop 相似的开源集群计算环境,是专为大规模数据处理而设计的快速通用的计算引擎现在形成一个高速发展应用广泛的生态系统。

本次讲座通过 Hadoop MRv1的架构及局限、Hadoop MRv2的架构及改进、Spark的特点及优点、Spark的使用场景​几个方面进行讲解说明,达到更加熟悉并应用spark。

 

 

▣ 讲座提纲:

 

◆Hadoop MRv1的架构

◆Hadoop MRv1的组成

◆Hadoop MRv1的局限

◆Hadoop MRv2的架构

◆Hadoop MRv2的改进

◆Spark的特点、Spark的其他特点

◆Spark的使用场景

 

 

授课教师

10余年IT行业相关经验。先后就职于阿里巴巴、艺龙、360,专注于开源和大数据领域。著有《深入理解Spark:核心思想与源码分析》和《Spa...