计算机视觉6天

讲师:叶梓发布日期:03-03 浏览量:254

计算机视觉

提纲

第一天，实践环境搭建

案例

1、课程简介

2、CPU与GPU

3、Anaconda Python安装

4、TensorFlow或TensorFlow-GPU的安装

5、pytorch安装

6、OpenCV环境安装

第一天，计算机视觉基础概述

案例

1、计算机视觉简介

2、数字图像的存储

3、色彩空间

4、计算机视觉任务的目标分类

5、计算机视觉任务的难点

第一天，Python基本语法概述

案例

1、Python的基本语法

2、引入外部包

3、常用的数据结构

4、定义函数

5、Python中的面向对象编程

6、文件读写

7、访问数据库

第一天，CV领域的数据预处理-基础

案例

1、数据清理

2、规范化

3、无标签时：PCA

4、有标签时：Fisher线性判别

5、数据压缩（DFT、小波变换）

第二天，CV领域的数据预处理-进阶

案例

1、对比度和亮度校正

2、平滑与锐化：初识卷积

3、HE、AHE与CLAHE

4、边缘检测与角点检测

5、斑块检测

6、局部特征描述子

7、SIFT特征与SURF特征

8、ORB特征与HOG特征

第二天，机器学习基础-决策树

案例

熵减过程

贪心法

ID3与C4.5

决策树剪枝

第二天，性能评价指标

案例

精确率；

P、R与F1

ROC与AUC

对数损失

泛化性能评价：k折验证验证

第二天，机器学习基础-集成学习

案例

bagging与boosting

RF（随机森林）

GBDT

Xgboost

LightGBM

CatBoost

第三天，深度学习基础-神经网络

案例

1、神经网络的生物学源头

2、人工神经元及感知机模型

3、前向（Feed Forward）神经网络

4、神经网络的权值

5、激励函数：sigmoid、tanh等

6、损失函数

7、神经网络的训练：梯度下降法

8、手算神经网络BP算法

9、误差反向传播算法详解

第三天，机器学习进阶-支持向量机

案例

“双螺旋”问题

基本模型与惩罚项

求解对偶问题

核函数：映射到高维

从二分类到多分类

第三天，深度学习基础-网络的演化

案例

1、深度学习与神经网络的区别与联系

2、梯度消散问题分析

3、梯度消散解决方案（ReLU）

4、过拟合问题

5、Dropout、Batch Normalization

6、Weight Decay

7、权重的初始化

8、各种梯度下降的优化方法

第四天，图像分类领域的基础模型

案例

1、图像分类概述

2、AlexNet

3、卷积层的误差反向传播

4、池化层的误差反向传播

5、VGG（5层变为5组）

6、迁移学习

8、GoogLenet和Inception模块

9、ResNet

第四天，图像分类领域的新模型

案例

1、ResNext

2、DenseNet

3、EfficientNet

第四天，二阶段目标检测

案例

1、目标检测问题

2、基于级联分类器的人脸检测

3、支持向量机（SVM）简介

4、基于HOG+SVM的行人检测

5、 R-CNN

6、Fast R-CNN

7、Faster R-CNN

第四天，二阶段目标检测

案例

YOLO V1

YOLO V2

YOLO V3

YOLO V4

YOLO V5

YOLO V6、V7

第五天，图像分割

案例

1、基于特征点的图像拼接

2、图像分割概述

3、基于灰度的图像分割

4、graph cut

5、grab cut与GMM

6、全卷积网络（FCN）

7、上采样的三种实现方式

8、膨胀卷积

9、DeepLab

10、结合CRF实现边界分割的精细化

第五天，循环神经网络初步

案例

1、基本的RNN

2、RNN的误差反向传播

3、LSTM单元

4、Bidirectional-LSTM

5、改进的单元GRU

第五天，图像描述

案例

图像描述的传统解决方案

Seq2Seq模型详解

Attention机制

show attention and tell模型详解

图像描述的评判标准

第五天，图像检索

案例

1、应用场景：以图搜图

2、基于颜色直方图的检索

3、基于纹理的检索

4、基于形状的检索

5、KD-tree

6、基于卷积特征的编码与检索

7、LSH及其改进版本

第六天，图像生成

案例

1、AE、VAE与DAE

2、对抗生成网络（GAN）

3、GAN的训练方式

4、DCGAN

5、WGAN

6、风格迁移

7、styleGAN与babyGAN等

第六天，人体姿态识别

案例

人体姿态识别的应用

早期人体姿态识别算法

DeepPose

OpenPose

AlphaPose

第六天，Transformer详解

案例

所有你需要的仅仅是“注意力”

Transformer中的block

自注意力机制

多头注意力

位置编码（为什么可以抛弃RNN）

残差结构与Layer Normalization

解码器的构造

遮罩结构

Transformer代码详解

第六天，Transformer的CV领域应用

案例

iGPT

Vision Transformer（ViT）

BEiT

MAE令人惊奇的效果

MAE详解

未来可期：MaskFeat、BEiT v2等

计算机视觉6天

讲师:叶梓 发布日期:03-03 浏览量:254

讲师:叶梓发布日期:03-03 浏览量:254