顶尖讲师团队
陈超
七牛云技术总监
专注于分布式计算与机器学习相关领域,是国内最早的Spark研究与使用者。目前专注于Spark平台的大数据处理,尤其精通Scala语言,Machine Learning ,实时计算和图计算,并将实践成果快速应用于大数据相关的业务和产品。
董西成
Hadoop资深专家
《Hadoop技术内幕:深入解析MapReduce架构设计与实现原理》和《Hadoop技术内幕:深入解析YARN架构设计与实现原理》作者。 资深Hadoop技术实践者和研究者,曾参与商用Hadoop原型研发,以及分布式日志系统、全网图片搜索引擎、Hadoop调度器等项目的设计与研发。
刘俊宏
美团高级工程师
从事HBase与自有分布式key-value存储相关的开发及管理工作。工作中分析HBase源码、参与各业务的HBase维护并根据搜索具体业务的特殊需求,对HBase的compact、SSD二级缓存、多用户并发快照扫库等方面进行了深度修改。
冼茂源
小象科技 联合创始人
多年从事分布式计算及存储相关的开发及管理工作。 针对互联网具体业务的特殊需求,对Hadoop调度机制、安全管理、存储优化、监控及管理系统等进行深度修改。在HBase与具体查询业务相结合,进行系统问题排查及调优方面有丰富经验。
胡光
算法工程师 资深ACMer
自高中时期接触程序设计,自此迷恋算法。在 ACM 亚洲区比赛中所获奖项经历过 铜、银、金 三个阶段,参加过两次 World Final。在百度工作期间,深度参与负责硬盘预警、硬件数据挖掘平台、智能数据中心、百度经纪人和知识图谱优化等项目的算法设计。
肖康
奇虎360技术经理
从事多年Hadoop分布式系统研发工作,熟悉Hadoop核心代码,经历了Hadoop集群从几十台到上万台规模的扩张和其中遇到的各种问题与解决方案。2012年开始研究分布式实时计算平台Storm,推动Storm的大规模应用与改进。热衷于开源技术,积极参与Hadoop、Storm等开源社区并贡献代码,多次应邀在中国大数据大会进行技术演讲。
合作企业
我们承诺组织企业见面会,帮助学员推荐一线企业实习或就业机会。
 

如何进行学习?

中国第一个云端大数据实验室,每人一套练习集群
企业项目模拟实战,统一提供代码管理和样例数据支持
远程在线教育,直播加录播,跨越时空限制
连续12周高强度学习,分学习小组,专人辅导

哪些人适合学习?

渴望挑战,热爱大数据技术
有一定计算机编程基础

有什么收获?

工作:
你将有能力胜任大数据相关职位,我们会为你推荐一线企业的大数据实习和就业机会
技能:
你将在业界顶尖大数据专家指导下,系统学习现代大数据工具和架构;毕业时,有能力设计、实现和交流典型的大数据项目
人脉:
我们为你提供大数据讲座和活动的参与机会,以及在日常学习和项目练习中与业界专家的交流机会,帮助你建立良好的人脉网络

什么是“中关村大数据人才”专项计划?

北京市海淀区政府和中关村软件协会为了扶持大数据人才建设,建立了专项扶持基金,并授权小象学院实施执行

什么是“优秀大学生奖学金计划”?

小象学院特别给予申请人参加小象训练营的学费减免计划,仅限30人。通过申请的学员可以享受5折学费的优惠,并保证推荐高薪就业机会。现请详细填写如下信息,等待我们的工作人员审核后联系您。请点击申请链接
教学大纲
开幕日
    训练营启动大会,全体学员与训练营讲师团队见面,充分了解课程体系、学习任务、学习方式。
第一周
《Linux实战》
《Java基础》
《Git的基本使用》
    通过本周的学习,学员将能巩固Linux的基本概念及常规操作、系统检查方法;加强对Java基本代码实现方法的理解,掌握常用的问题排查方式。通过几个简单的实践体验项目,了解通过Git如何进行基本的代码提交及项目协作。
第二周
《Hadoop大数据平台》
《Hadoop在线示例实践体验》
    本周将提供一个完整的Hadoop大数据平台介绍,让学员了解Hadoop大数据平台的完整生态体系,各组成模块及功能。通过实际案例的体验,初步了解Hadoop分布式计算框架的基本使用方法。
第三周
《项目陈述及初始需求分析》
《Hadoop API及问题排查方法》
    本周将引入大数据实训项目,剖析项目需求,为学员定义清晰的以项目为主线的学习计划。在基本技能方面,本周将加强MapReduce/HDFS基本API以及常用问题排查方法的学习,为实战项目全面展开打好基础。
第四、五周
《Flume概述及API》
《Kafka概述及API》
《Hive进阶》
《HBase原理介绍》
《HBase进阶》
    这两周将围绕实训项目的目标,学习项目中需要使用的Flume、Sqoop、Kafka、Hive、HBase等开源产品,学员需要完成平台的搭建,进行相关初始验证流程以确认系统搭建完好。
第六周
《数据分析实训项目描述、解题思路分解》
    本周将学习各数据处理系统相关的API使用方法,解构项目数据需求,开始进行数据分析系统的数据录入、清洗、计算环节的工程实现。学员将体验如何基于分布式平台梳理数据结构及处理流程,完成数据分析平台的业务逻辑。
第七周
《MySQL概述》
    本周将实践数据分析平台的结果处理、使用及展示等相关项目环节,掌握数据分析平台在结果表示层面使用的常用技能。
第八周
《Scala基础》
《Spark 1.X 大数据平台》
《Spark基础与编程模型》
    本周将学习Spark的基本原理和使用方法,同时,对于Spark的实现语言Scala,学员也将得到很好的学习机会。依据项目需求,掌握Spark的平台搭建技能。
第九周
《Spark各部署模式的原理及部署方法》
《Spark Streaming运行原理与实践》
《Spark内核剖析》
    本周将开始实践基于Spark的流式数据处理,完成流处理业务数据的定义和逻辑实现,同时,动手实践Spark Streaming与消息队列Kafka的集成方法。
第十周
《Kafka与Spark Streaming整合方法》
《Spark SQL & DataFrame》
    本周将学习Spark SQL及DataFrame的基本原理和使用方法,同时对Spark内核做更深入的学习。
第十一周
《Hadoop监控》
《Nagios》《Log4j》
    本周将展开集群监控、报警等系统的设计和搭建工作。通过本周学习,学员将能掌握分布式系统的监控及问题预警的技能。
第十二周
《数据结构与算法面试宝典》
项目验收
    本周将完成项目总结,梳理整个项目过程中所获得的知识及技能,同时,进行项目验收。
Package
《Storm实时流式计算》
     《Storm实时流式计算》全套录播课程及在线作业。大数据专家坐镇专 业问答社区服务。
学员去向
康**    美团
刘**    乐视
杨**    京东
李**    百度
付**    平安集团
岑**    滴滴出行
徐**    微博易
程*    易宝支付
刘*    明略数据
肖**    乐视
张**    恒大金服
陈**    美团
李*    神州泰岳
王**    中国农业银行(带户口)
何*    百分点
小象Club
小象Club是小象科技发起的大数据技术研讨和人才培养的交流圈子,我们会不定期邀请训练营学员参加小象Club组织的各种线上和线下活动,通过各种形式的沟通交流,帮助学员从企业方面视角了解大数据前沿技术、工业界现实需求、企业文化、实习和工作岗位等。
下面是部分小象Club的成员:
 
韩亦舜 清华大学数据科学研究院 执行副院长
于滨
中关村软件协会 会长
冯是聪
明略数据 CTO
刘鹏
奇虎360 首席架构师
傅强
当当网 技术副总裁
卢亿雷
AdMaster 技术副总裁
傅志华
奇虎360 大数据专家
连城
Databricks 工程师
王峰
阿里巴巴 大数据专家
罗李
阿里巴巴 大数据专家
傅杰
优酷 大数据架构师
何鸿凌
中国移动 大数据专家
苏海波
百分点 数据挖掘总监
李明宇
企事录 联合创始人
梁堰波
Yahoo! 大数据专家
中关村大数据人才"千人计划"
小象训练营第五期:2016年7月17日——2016年10月31日
报名截止日期:2016年7月15日