机器学习与数据挖掘

讲师:尹传亮 发布日期:06-09 浏览量:8

机器学习与数据挖掘

 

机器学习与数据挖掘

 

DAY1:

一、机器学习基本知识

1.机器学习初步知识

    1.1.概念

    1.2.ML分类及算法

2 高等数学及概率论知识

    2.1导数/梯度

    2.2.Taylor

    2.3.凸函数

    2.4.古典概率

    2.5.贝叶斯公式

    2.6.常见概率分布

 

二、数理统计与参数估计

1.重要统计量

    1.1 期望

    1.2.方差

    1.3.协方差与相关系数

    1.4 独立与不相关

 

2.重要定理与不等式

   2.1.Jensen不等式

   2.2 契比雪夫不等式

   2.3.大数定理

   2.4.中心极限定理

 

3.用样本估计参数

   3.1 矩估计

   3.2 极大似然估计

 

DAY2:

三、矩阵分析与应用

1.线性代数基本知识

2.特征分解

3.万能矩阵分解

 

四、凸优化初步

1.优化问题基本知识

2.凸集和凸函数基础

3.凸优化问题

 

五、线性回归与逻辑回归

1.线性回归

   1.1.定义与问题引入

   1.2.损失函数

   1.3.梯度下降

   1.4.过拟合与正则化

2.逻辑回归

   2.1.定义与问题引入

   2.2.损失函数

   2.3.梯度下降与正则化及示例

3.工程应用经验

    3.1.优缺点和应用场景

    3.2.样本处理

    3.3.特征处理

    3.4.算法调优

 

DAY3:

六、特征工程

1.前言

    1.1.机器学习与特征工程的关联

    1.2.实际工业界的特征工程那些事儿

2.数据与特征处理

   2.1.数据选择/清洗/采样

   2.2.数值型/类别型/日期型/文本型特征处理

   2.3.组合特征处理

   2.4.特征处理案例分析

3.特征选择

   3.1.Filter/Wrapper/Embedded

   3.2.开发包

4.特征工程案例

 

七、工作流程与模型优化

1.工作流程(数据处理-特征工程-模型选择-交叉验证)

2.模型优化

3.案例分享

 

DAY4:

八、信息论、最大熵模型与EM算法

1.统计基础回顾

2.信息论基础

3.最大熵模型

4.EM算法

 

九、推荐系统及应用

1.互联网需求变更

    1.1.推荐系统广泛应用

    1.2.推荐系统需求

    1.3.推荐系统结构与评估

2.推荐算法初步

    2.1.基于内容推荐

    2.2.协同过滤

3.推荐算法进阶

    3.1.矩阵分解与隐语义模型

4.推荐系统案例

 

十、聚类算法与应用

1.K-means聚类

2.层次聚类

3.混合高斯模型

4.案例分享

 

DAY5:

十一、决策树与随机森林

1.信息熵

2.决策数学习算法

3.Bagging与随机森林

4.Adaboost/GDBT

 

十二、SVM

1.向量机知识结构

2.向量机的原理

3.算法推导核心过程

4.核函数

 

十三、贝叶斯方法

1.贝叶斯公式

2.朴素贝叶斯

3.朴素贝叶斯在工程应用

4.贝叶斯网络

 

DAY6:

十四 主题模型

1.主题模型的直观理解

2.pLSA模型及优化思路

3.Jensen不等式及变分EM

4.LDA模型及优化思路

5.Dirichlet分布的特性

6.主题模型的应用

 

十五 贝叶斯推理

1.马尔可夫链和MCMC算法

2.Gibbs采样

3.LDA的Gibbs采样推断

4.重温Jensen不等式及LDA的变分EM

5. KL-divergence和变分EM

 

DAY7:

十六、人工神经网络

1.基本概念

   1.1.起源

   1.2.基本结构

2.神奇的分类能力与背后的原理

   2.1.非线性切分问题

   2.2.感知器与逻辑门

   2.3.强大的空间非线性切分能力

3.代码与示例

   3.1.手把手展示神经网络的非线性切分能力

   3.2.Tensorflow多层感知器非线性切分

 

十七、卷积神经网络

1.神经网络与卷积神经网络

   1.1.层级结构

   1.2.数据处理

   1.3.训练算法

   1.4.优缺点

2.实际搭建与训练CNN

   2.1.典型CNN网络

   2.2.训练与优化

3.常用框架与应用

   3.1.常用框架

   3.2.广泛应用

 

DAY8:

十八、循环神经网络与LSTM

1.神经网络与循环神经网络

   1.1.强大的功能

   1.2.层级结构

   1.3.多种RNN

2.LSTM

   2.1.长时依赖问题

   2.2.“记忆细胞”与状态

3.LSTM变体

 

十九、案例分享

1.证券行业-个性化推荐与营销

2.银行行业-流水预警与高价值人群挖掘

3.手机行业-舆情监控与数据洞察


分享
联系客服
返回顶部