顶尖讲师团队
李文哲
普惠金融 首席数据科学家
美国南加州大学机器学习博士,荷兰阿姆斯特丹大学访问学者,先后发表数篇论文在 AAAI、KDD、AISTATS、CHI 等国际顶级会议和期刊上。 目前在普惠金融负责公司的人工智能、大数据技术以及创新产品的研发。在大数据、机器学习、深度学习、自然语言处理,图数据库等领域有丰富的研究和实践经验。在美期间,先后就职过亚马逊、高盛、Fiserv等多家公司。
刘鹏
著名计算广告专家
《计算广告》作者,资深互联网专家,谙熟变现产品及工程,包括搜索广告、展示广告变现体系等。 清华大学获得博士学位后,加入微软亚洲研究院,从事人工智能领域的研究。2009年1月,参与创建雅虎北京研究院,出任高级科学家,负责日本雅虎搜索广告收入优化及其他全球广告项目。 一直致力于大数据及其变现技术的普及。
顾立宏
美团网 资深算法工程师
现任美团推荐团队的主干成员,擅长推荐领域的数据挖掘、召回算法和排序调优,现负责美团推荐用户场景方向。 毕业于电子科技大学,在校期间从事研究最优化工作。曾任职百度NLP工程师、大数据创业公司。
孔东营
美团网 资深算法工程师
现任职于美团网,从事在线广告的点击率预测的工作,擅长大规模机器学习方面的算法研究。近期正在参与推荐算法研究的工作,对推荐召回和重排序有深入的理解和实践。早期曾参加数据挖掘比赛(KDDcup2012, WSDM2012,RTB算法大赛),取得骄人成绩。
冼茂源
小象科技 联合创始人
多年从事分布式计算及存储相关的开发及管理工作。 针对互联网具体业务的特殊需求,对Hadoop调度机制、安全管理、存储优化、监控及管理系统等进行深度修改。在HBase与具体查询业务相结合,进行系统问题排查及调优方面有丰富经验。
邹博
资深机器学习工程师
计算机科学博士,深谙机器学习算法原理,拥有深厚的数学功底,算法推导及代码实现能力,同时拥有成熟的授课经验,扎实的理论知识和出色的表达获得学员的广泛好评。
李涛
搜狗 Spark资深工程师
目前就职于搜狗网页搜索部,主要职责是从事Spark、Kafka相关的研究和开发工作,主导搜狗公司商用Spark原型的研发,以及使用Spark支撑搜索的实时日志分析,包括:几千个维度的查询、业务流量分析和集群的健康指标的监控等多个项目的设计与研发。
合作企业
我们承诺组织企业见面会,帮助学员推荐一线企业实习或就业机会。
 

如何进行学习?

中国第一个云端大数据实验室
企业项目模拟实战,统一提供代码管理和样例数据支持
远程在线教育,直播加录播,跨越时空限制
连续14周高强度学习,专人辅导

哪些人适合学习?

希望进入机器/深度学习领域工作和对机器/深度学习感兴趣的朋友。需要一定的数学、概率和统计基础知识
有一定计算机基础的数学专业或统计专业人员,可以使用Python编程语言

有什么收获?

工作:
你将有能力胜任大数据相关职位,我们会为你推荐一线企业的大数据实习和就业机会
技能:
你将在业界顶尖机器学习专家指导下,系统性地掌握机器学习模型算法和工程实践;毕业时,有能力在业界的从事机器学习系统实现和算法研究工作
人脉:
我们为你提供大数据讲座和活动的参与机会,以及在日常学习和项目练习中与业界专家的交流机会,帮助你建立良好的人脉网络

什么是“中关村大数据人才”专项计划?

北京市海淀区政府和中关村软件协会为了扶持大数据人才建设,建立了专项扶持基金,并授权小象学院实施执行

是否可以分期付款支付学费?

小象学院可以为你提供快捷的分期付款服务,欢迎你提交申请资料,请点击申请链接

有什么“奖学金计划”吗?

Best or Nothing:每一期有10%学员获得优秀学员证书,每人奖励1000元
教学大纲
开幕日
    训练营启动大会,全体学员与训练营讲师团队见面,充分了解课程体系、学习任务、学习方式。
第一周
《机器学习概论与数学基础》
    在此阶段将初探机器学习概论,及机器学习所涉及的数学基础。学习本模块会帮助您对机器学习领域建立宏观认识,并为后续深入打好数学基础。
第二、三周
《计算广告与CTR模型算法》
    在此阶段将学习互联网主要变现方式——在线广告的业务产品逻辑和关键技术;以点击率预测(CTR)作为机器学习的案例,由浅入深地学习CTR预测中涉及的评估指标和机器学习模型与算法。如Logistic Regression 模型,最大似然,梯度下降及逼近理论,多元回归,交叉验证及Kernel&Hashing等重要技术。
    实践项目:完成计算评估指标的代码。
第四周
《CTR工程实践》
    在理解CTR的模型算法之后,在此阶段将学习CTR的特征工程(特征提取,特征选择,特征构造),以及在线学习最优化算法FTRL与BPR。
    实践项目:用线性模型和非线性模型完成点击率预估;用FTRL和BPR完成点击率预估。
第五周
《Hadoop基础&Mapreduce编程》
    在此阶段将学习分布式存储及计算系统Hadoop,掌握分布式文件系统HDFS、计算框架Mapreduce、数据仓库分析工具Hive的使用方法介绍,重点学习MapReduce编程。
第六、七周
《基于Spark的机器学习》
    在此阶段将学习分布式内存计算框架Spark的原理和编程模型,重点掌握如何基于Spark ML pipeline实现分布式机器学习。
    实践项目:给定训练数据,使用Spark ML实现一个分布式算法。
第八、九周
《文本分析》
    在此阶段将从文本分析的实际案例,由浅入深地介绍文本处理涉及到的基本技术以及核心算法。包括:文本的表示,Distant Metrics,朴素贝叶斯,KNN, KD-tree, K-means, GMM, EM算法等。
    实践项目:1.完成垃圾邮箱分类器并比较各自的准确率;2.文本聚类并可视化。
第十、十一周
《推荐系统》
    在此阶段将学习推荐系统的实现方法与核心算法。主要包括: 推荐系统的系统流程,离线/在线评价指标,召回算法及排序算法等。
    实践项目:根据训练数据,完成一个推荐系统。
第十二、十三周
《深度学习——图像识别》
    在此阶段将开始学习深度学习原理,包括:神经网络详解包括BP算法, 深度神经网络模型:activation functions, weight initialization, gradient flow等; Convolutional Neural Network及ImageNet案例分析;dropout训练,Deep architecture与shallow model对比。
    实践项目:使用工具来实现深度卷积神经网络来识别图像。
第十四周
面试辅导
    在完成前面各个模块课程的作业及项目之后,本模块主要目标在于面试辅导,帮助学员在机器学习领域的求职面试中取得优异成绩。
小象Club
小象Club是小象科技发起的大数据技术研讨和人才培养的交流圈子,我们会不定期邀请训练营学员参加小象Club组织的各种线上和线下活动,通过各种形式的沟通交流,帮助学员从企业方面视角了解大数据前沿技术、工业界现实需求、企业文化、实习和工作岗位等。
下面是部分小象Club的成员:
 
韩亦舜 清华大学数据科学研究院 执行副院长
于滨
中关村软件协会 会长
冯是聪
明略数据 CTO
刘鹏
奇虎360 首席架构师
傅强
当当网 技术副总裁
卢亿雷
AdMaster 技术副总裁
傅志华
奇虎360 大数据专家
连城
Databricks 工程师
王峰
阿里巴巴 大数据专家
李文哲 普惠金融
首席数据科学家
孔东营
美团 资深算法工程师
顾立宏
美团 资深算法工程师
苏海波
百分点 数据挖掘总监
邹博
资深机器学习工程师
梁堰波
Yahoo! 大数据专家
中关村大数据人才"千人计划"
小象训练营第四期:2016年5月3日——2016年8月5日
报名截止日期:2016年4月30日