计算机视觉6天
讲师:叶梓 发布日期:03-03 浏览量:229
计算机视觉
提纲
第一天,实践环境搭建
案例
1、课程简介
2、CPU与GPU
3、Anaconda Python安装
4、TensorFlow或TensorFlow-GPU的安装
5、pytorch安装
6、OpenCV环境安装
第一天,计算机视觉基础概述
案例
1、计算机视觉简介
2、数字图像的存储
3、色彩空间
4、计算机视觉任务的目标分类
5、计算机视觉任务的难点
第一天,Python基本语法概述
案例
1、Python的基本语法
2、引入外部包
3、常用的数据结构
4、定义函数
5、Python中的面向对象编程
6、文件读写
7、访问数据库
第一天,CV领域的数据预处理-基础
案例
1、数据清理
2、规范化
3、无标签时:PCA
4、有标签时:Fisher线性判别
5、数据压缩(DFT、小波变换)
第二天,CV领域的数据预处理-进阶
案例
1、对比度和亮度校正
2、平滑与锐化:初识卷积
3、HE、AHE与CLAHE
4、边缘检测与角点检测
5、斑块检测
6、局部特征描述子
7、SIFT特征与SURF特征
8、ORB特征与HOG特征
第二天,机器学习基础-决策树
案例
熵减过程
贪心法
ID3与C4.5
决策树剪枝
第二天,性能评价指标
案例
精确率;
P、R与F1
ROC与AUC
对数损失
泛化性能评价:k折验证验证
第二天,机器学习基础-集成学习
案例
bagging与boosting
RF(随机森林)
GBDT
Xgboost
LightGBM
CatBoost
第三天,深度学习基础-神经网络
案例
1、神经网络的生物学源头
2、人工神经元及感知机模型
3、前向(Feed Forward)神经网络
4、神经网络的权值
5、激励函数:sigmoid、tanh等
6、损失函数
7、神经网络的训练:梯度下降法
8、手算神经网络BP算法
9、误差反向传播算法详解
第三天,机器学习进阶-支持向量机
案例
“双螺旋”问题
基本模型与惩罚项
求解对偶问题
核函数:映射到高维
从二分类到多分类
第三天,深度学习基础-网络的演化
案例
1、深度学习与神经网络的区别与联系
2、梯度消散问题分析
3、梯度消散解决方案(ReLU)
4、过拟合问题
5、Dropout、Batch Normalization
6、Weight Decay
7、权重的初始化
8、各种梯度下降的优化方法
第四天,图像分类领域的基础模型
案例
1、图像分类概述
2、AlexNet
3、卷积层的误差反向传播
4、池化层的误差反向传播
5、VGG(5层变为5组)
6、迁移学习
8、GoogLenet和Inception模块
9、ResNet
第四天,图像分类领域的新模型
案例
1、ResNext
2、DenseNet
3、EfficientNet
第四天,二阶段目标检测
案例
1、目标检测问题
2、基于级联分类器的人脸检测
3、支持向量机(SVM)简介
4、基于HOG+SVM的行人检测
5、 R-CNN
6、Fast R-CNN
7、Faster R-CNN
第四天,二阶段目标检测
案例
YOLO V1
YOLO V2
YOLO V3
YOLO V4
YOLO V5
YOLO V6、V7
第五天,图像分割
案例
1、基于特征点的图像拼接
2、图像分割概述
3、基于灰度的图像分割
4、graph cut
5、grab cut与GMM
6、全卷积网络(FCN)
7、上采样的三种实现方式
8、膨胀卷积
9、DeepLab
10、结合CRF实现边界分割的精细化
第五天,循环神经网络初步
案例
1、基本的RNN
2、RNN的误差反向传播
3、LSTM单元
4、Bidirectional-LSTM
5、改进的单元GRU
第五天,图像描述
案例
图像描述的传统解决方案
Seq2Seq模型详解
Attention机制
show attention and tell模型详解
图像描述的评判标准
第五天,图像检索
案例
1、应用场景:以图搜图
2、基于颜色直方图的检索
3、基于纹理的检索
4、基于形状的检索
5、KD-tree
6、基于卷积特征的编码与检索
7、LSH及其改进版本
第六天,图像生成
案例
1、AE、VAE与DAE
2、对抗生成网络(GAN)
3、GAN的训练方式
4、DCGAN
5、WGAN
6、风格迁移
7、styleGAN与babyGAN等
第六天,人体姿态识别
案例
人体姿态识别的应用
早期人体姿态识别算法
DeepPose
OpenPose
AlphaPose
第六天,Transformer详解
案例
所有你需要的仅仅是“注意力”
Transformer中的block
自注意力机制
多头注意力
位置编码(为什么可以抛弃RNN)
残差结构与Layer Normalization
解码器的构造
遮罩结构
Transformer代码详解
第六天,Transformer的CV领域应用
案例
iGPT
Vision Transformer(ViT)
BEiT
MAE令人惊奇的效果
MAE详解
未来可期:MaskFeat、BEiT v2等