《Spark——原理、内幕与案例实践》第一期

799

 

课程名称:

Spark——原理、内幕与案例实践》第一期

课程特色:

以目前主流的、最新的Spark稳定版1.6.x为基础,同时兼介绍2.0版本新增特性及使用;

深入浅出地介绍Spark生态系统原理及应用,内容包括Spark各组件(Spark Core/SQL/Streaming/MLlib基本原理、使用方法、实战经验以及在线演示;

本课程精心设计了若干实验案例,帮助大家在理解理论的基础上,亲手实践Spark

基础要求:

了解Linux基础知识,掌握JavaScala语言基础,了解HDFS

主讲老师:

董西成    小象学院签约讲师

hulu大数据架构组负责人;

Hadoop技术内幕:深入解析MapReduce架构设计与实现原理》和《Hadoop技术内幕:深入解析YARN架构设计与实现原理》作者;

资深Hadoop技术实践者和研究者,曾参与商用Hadoop原型研发,以及分布式日志系统、全网图片搜索引擎、Hadoop调度器等项目的设计。

开课时间:

20161011

学习方式:

在线直播,共9

每周2次(周二、周五晚上20:00-22:00

直播后提供录制回放视频,在线反复观看,有效期1

课程大纲

Spark 概述(共1课时)

1.1

Spark产生背景

 

包括mapreduce缺陷,多计算框架并存等

1.2

Spark 基本特点

1.3

Spark版本演化

1.4

Spark核心概念

 

包括RDD, transformation, action, cache

1.5

Spark生态系统

 

包括Spark生态系统构成,以及与Hadoop生态系统关系

1.6

Spark在互联网公司中的地位与应用

 

介绍当前互联网公司的Spark应用案例

1.7

本课程与Spark 2.0的关系

1.8

Spark集群搭建

 

包括测试集群搭建和生产环境中集群搭建方法,并亲手演示整个过程

   

授课教师

资深Hadoop技术实践者和研究者,对Hadoop技术有非常深刻的认识和理解,有着丰富的实践经验。 曾经参与了商用Hadoop原型的研发,以...