《Python数据分析升级版》第三期

899.00

课程名称:

 

《Python数据分析升级版》第三期 

 

主讲老师:

 

梁斌    资深算法工程师

查尔斯特大学(Charles Sturt University)计算机博士,从事机器学习、计算机视觉及模式识别等相关方向的研究,在计算机视觉等国际会议及期刊发表10余篇学术论文。现就职于澳大利亚某科学研究机构(博士后),负责算法改进及其产品化、数据分析处理、建模及可视化。

 

课程简介:
 

近两年来,数据分析师的岗位需求非常大,90%的岗位技能需要掌握Python作为数据分析工具,本课程以案例驱动的方式讲解如何利用Python完成数据处理、数据分析、可视化及建模等方面常用的数据分析方法与技巧。

 

升级版第三期的内容特色:

 

     1.  归纳总结实际项目中Python数据处理分析技巧

     2.  新增统计分析的知识,帮助学员回顾相关知识

     3.  强化数据可视化,提供数据展示的场景及案例

     4.  强化机器学习原理并新增更多算法的介绍及演示

     5.  新增文本分析中的主题模型(LDA)

     6.  新增社交网络分析

     7.  升级并调整全部随课项目

     8.  每个项目均提供两套代码

     (1) 包含项目详细步骤的Jupyter演示版代码

     (2) 学员可以接触到真实项目的程序代码

     9.  加大项目教学比例,让学员掌握关键项目步骤

     10. 将相关章节的项目系统整理成一个完整项目

 

面向人群:

 

      1.  想了解和学习数据分析流程和实践方法的学习者
      2.  想学习非结构化数据(文本、图像等)分析的学习者
      3.  想学习数据分析中常用建模知识的相关从业人员
      4.  尚不会使用Python处理数据分析的从业者
      5.  想转行从事数据分析师行业的学习者
      6.  想使用Python实现机器学习或深度学习的工程师 

 

学习收益:

 

通过本课程的学习,学员将会收获:
      1.  熟悉数据分析的流程,包括数据采集、处理、可视化、数据建模
      2.  掌握Python语言作为数据分析工具,从而有能力驾驭不同领域数据分析实践
      3.  掌握非结构化数据的处理与分析

      4.  快速积累多个业务领域数据分析项目经验,包括文本数据、图像数据及社交网络
      5.  掌握使用Python实现基于机器学习及深度学习的数据分析和预测
      6.  掌握数据分析中常用的建模知识

 

开课时间:

 

2017年10日11日

 

学习方式:
 

在线直播,共9次课,每次2-3小时

第一课上课时间:10月11日 (晚20:00-22:00)

每周2次(周六、日,下午15:00 - 17:00

直播后提供录制回放视频,可在线反复观看,有效期1年
 

课程大纲:
 

第一课 工作环境准备及数据分析基础 (2-3课时)

    1.  课程介绍

    2.  工作环境准备
    3.  数据分析中常用的Python技巧

    4.  科学计算库NumPy
    5.  使用Pandas进行简单的数据分析
    6.  实战案例1:世界幸福指数报告分析

 

第二课 Pandas进阶及统计分析 (2-3课时)

    1. Pandas进阶及技巧

    2. 数据合并、分组及比较

    3. 透视表

    4. 常用的统计分布

    5. 使用Python进行假设检验

    6.  实战案例2:麦当劳菜单营养成分分析

 

第三课 数据展示及可视化 (2-3课时)

    1. 数据可视化的概念及准则

    2. 基本图表的绘制及应用场景

         -- 散点图,柱状图,线图

    3. 数据分析常用图表的绘制

         -- 多图绘制,直方图,盒子图,热图

    4. 动画及交互式渲染

    5. Pandas及Seaborn制图

    6. 实战案例3:“神奇宝贝数据分析及展示

 

第四课 Python机器学习(1) (2-3课时)

    1. 机器学习基本概念与流程

    2. Python机器学习库scikit-learn

    3. 机器学习常用算法介绍及演示(1)

        -- KNN, 线型回归,逻辑回归,SVM,决策树

    4. 实战案例4-1:根据可穿戴设备识别用户行为

 

第五课 Python机器学习(2) (2-3课时)

    1. 模型评价指标及模型选择

    2. 交叉验证

    3. 机器学习常用算法介绍及演示(2)

        -- 朴素贝叶斯,随机森林,GBDT

    4. 实战案例4-2:根据可穿戴设备识别用户行为

 

第六课 图像数据处理及分析 (2-3课时)

    1. 图像数据操作

    2. 常用的图像特征描述

    3. K-Means聚类及图像压缩

    4.  实战案例5-1:根据海报预测电影分类

 

第七课 神经网络及深度学习 (2-3课时)

    1. 人工神经网络

    2. 深度学习

    3. TensorFlow框架学习及使用

    4. TensorFlow实现卷积神经网络 (CNN)

    5.  实战案例5-2:根据海报预测电影分类

 

第八课 文本数据分析 (2-3课时)

    1. Python文本数据处理

        -- 正则表达式结合Pandas使用技巧

    2. 自然语言处理及NLTK

    3. 文本特征及分类

    4. 主题模型及LDA

    5.  实战案例6:豆瓣影评数据分析

 

第九课 社交网络分析 (2-3课时)

    1. 图论简介

    2. 网络的操作及可视化

    3. 网络分析

    4. 课程总结

    5. 实战案例7:“权利的游戏”人物关系分析

 

常见问题:
 

Q: 本课程需要什么基础?

A:有基本的大学数学基础, 掌握Python基本编程。

Q: 会有实际上机演示和动手操作吗?
A: 有,几乎每节课,老师均会准备上机演示部分,学员可以学习老师的实践经验。
Q: 本课程必须提前掌握Python吗?
A: 需要掌握基本的Python编程,本课程不会系统性讲授Python的基本编程语言。如果你熟悉其他编程语言Java、C、Scala,学习Python是很容易的。

Q: 学习过程中,有疑问怎么解决?

A: 可以在http://wenda.chinahadoop.cn/,老师会解答;也可以在群里和同学讨论

相关课程

授课教师

梁斌    资深算法工程师查尔斯特大学(Charles Sturt University)计算机博士,从事机器学习、计算机视觉及模式识别等相...