《机器学习》升级版 已关闭

《机器学习》升级版 扫二维码继续学习 二维码时效为半小时

(0评价)
价格: 899.00元

课程名称:

《机器学习》升级版

课程目标:

本课程特点是从数学层面推导最经典的机器学习算法,以及每种算法的示例和代码实现(Python)、如何做算法的参数调试、机器学习算法的应用场景介绍等

主讲老师:

邹博   小象学院独家签约

计算机博士;现在科学院从事科研教学工作,主持国家级科研项目2个,副负责1个;研究方向机器学习、数据挖掘、计算几何。近年来从事机器学习的社会化培训工作,学员过万,擅长机器学习核心算法推导和原理分析,并给出代码实现。

开课时间:

2016822

学习方式:

在线直播,共18

每周3次(周一、三、五晚上20:00-22:00

直播后提供录制回放视频,在线反复观看,有效期1

升级版的内容变化:

1,在阐述机器学习原理的同时,给出算法的源码实现和相应数据;确保大家懂推导,且会实现。

2,删去部分章节中过于晦涩的公式推导,代之以直观的感性解释,增强理解力。

3,重视项目实践,重视已有机器学习包,站在巨人的肩上。

4,重视将实践问题转换成实际模型的能力,分享实际案例。

5,对比不同的特征选择带来的预测效果差异。

6,思考不同算法之间的区别和联系,提高在实际工作中选择算法的能力。

7,涉及和讲解的部分Python库有:Numpy/Scipy/matplotlib/Pandas/scikit-learn/libSVM/LDA/NLTK

8,每个算法模块的讲解包括三部分:(1)原理讲解、(2)自己动手实现、(3)使用已有机器学习库做效果对比。

课程大纲

1、机器学习中的数学基础

Taylor展式的应用

常见概率分布与共轭分布

最大似然估计

中心极限定理及其应用

大数定理及其应用

Lagrange优化

2Python及其数学/机器学习库的使用

机器学习算法类别

机器学习应用的一般流程

解释器Python2.7IDEAnaconda/Pycharm

numpy/scipy/matplotlib/panda库的介绍和典型使用

举例:SVD用于图像处理

3、回归

线性回归

高斯分布

Logistic回归

最大似然估计

梯度下降算法:BGDSGD

特征选择与过拟合

4、回归实践

机器学习sklearn库介绍

Ridge回归、LASSO

Logistic/Softmax回归

回归代码实现和调参

数据可视化

5、决策树和随机森林

熵、联合熵、条件熵、KL散度、互信息

最大似然估计与最大熵模型

ID3C4.5CART详解

决策树的评价

预剪枝和后剪枝

Bagging

随机森林

6、随机森林实践

手写随机森林实践

调用开源库函数完成随机森林

数据结构的综合使用

gini系数

7、提升

提升为什么有效

Adaboost算法

加法模型与指数损失

梯度提升决策树GBDT

8xgboost

自己动手实现GBDT

xgboost库介绍

Taylor展式与学习算法

xgboost应用于实践

9SVM

线性可分支持向量机

软间隔的改进

损失函数的理解

核函数的原理和选择

SMO算法

10SVM实践

libSVM代码库介绍

原始数据和特征提取

手写随机森林实践

调用开源库函数完成SVM

SVMLogistic回归、随机森林三者的横向比较

11、聚类

各种相似度度量及其相互关系

K-meansK-Medoids及变种

AP算法/LPA算法及其应用

密度聚类DBSCAN/DCluster(Science2014)

谱聚类SC

聚类评价和结果指标

12、聚类实践

动手自己实现K-means

K-Means++算法原理和实现

并查集的实践应用

密度聚类的代码实现

使用开源机器学习包完成聚类

13EM算法

最大似然估计

Jensen不等式

朴素理解EM算法

精确推导EM算法

EM算法的深入理解

混合高斯分布

14EM算法实践

多元高斯分布的EM实现

分类结果的数据可视化

EM与聚类的比较

主题模型pLSAEM算法

15、主题模型LDA

贝叶斯学派的模型认识

共轭先验分布

Dirichlet分布

Laplace平滑

Gibbs采样详解

16LDA实践

停止词和高频词

动手自己实现LDA

LDA开源包的使用和过程分析

Metropolis-Hastings算法

MCMC

LDAword2vec的比较

17、隐马尔科夫模型HMM

概率计算问题

前向/后向算法

HMM的参数学习

Baum-Welch算法详解

Viterbi算法详解

18HMM实践

动手自己实现HMM用于中文分词

多个语言分词开源包的使用和过程分析

文件数据格式UFT-8Unicode

停止词和标点符号对分词的影响

前向后向算法计算概率溢出的解决方案

EM算法和MLE的优劣比较

发现新词和分词效果分析

附赠:机器学习用于股票预测(综合)

 

联系方式:

1、参团后,加客服微信:15611440609有重要通知。
2、手机:15611440609

3、邮件:admin@chinahadoop.cn