大模型技术与应用培训提纲(48)

讲师:叶梓 发布日期:03-03 浏览量:240


大模型技术与应用培训提纲

第一天:基础篇与技术概览

上午(3小时)

大模型技术基础与最新进展

大模型的定义与关键技术概览

生成式人工智能(AIGC)概念

ChatGPT历史与发展

一些关键技术

人工智能实验环境的搭建

机器学习环境与深度学习环境

Python编程与数据科学工具库介绍

GPU与cuda深度学习框架:PyTorchChatGPT模型背后的NLP基础知识

深度学习算法基础

MLP与CNN、RNN

特殊字符、分词与停用词处理技术

词向量与Embedding

介绍大模型前沿应用

文心一言、通义千问等Midjourney等

企业应用场景案例分析

金融机构中的智能风险评估系统案例

教育机构的个性化学习路径推荐系统案例

下午(3小时)

大模型的核心技术深入

Transformer架构的深入解析与优化

Transformer中的block

自注意力机制与多头注意力

位置编码(为什么可以抛弃RNN)

Batch Norm与Layer Norm

解码器的构造

chatGPT的原理介绍

指示学习与InstructGPT相关数据集

有监督微调(SFT)

从人类反馈中RL的思路

奖励建模(RM)

运用PPO改进

企业应用场景案例分析

法律行业的法条自动生成案例

法律行业的智能合同审核与咨询案例

实战演练:基础模型的使用与体验

演示如何使用最新的开源大模型ChatGLM3

学员动手操作,体验模型的基本功能及最新特性

第二天:进阶篇与实战应用

上午(3小时)

大模型的微调和优化

ChatGLM部署

ChatGLM3-6B介绍

ChatGLM3搭建流程

应用场景(工具调用、代码执行)

权重量化

ChatGLM3原理

Code Interpreter

多模态CogVLMWebGLM搜索增强

大模型训练的高效算法与优化技术

LoRAPrefix Tuning

P-Tuning

Prompt Tuning

freeze

企业应用场景案例分析

金融科技中的自动化报告生成与分析案例

医疗研究中的文献检索与知识提取案例

教育技术中的智能教学辅助工具案例

下午(3小时)

实战演练:大模型的微调实践

演示ChatGLM3微调过程

数据准备

模型调整

结果评估

学习LangChain所需的知识储备

词嵌入与语义空间

高维向量的快速模糊匹配

局部敏感哈希(LSH)

向量数据库

建立企业级对话系统

LangChain的原理

大模型利用的难点与痛点

Langchain的基本思路

关键组件

大模型的部署与运维

模型部署的最佳实践,包括容器化、云服务等

ChatGLM.cpp等

Docker简介

K8s简介

运维中的监控、调优与安全性管理

企业应用场景案例分析

企业内部的知识管理系统与智能助手案例

卫生行业的智能助手

通过这个为期两天的培训,学员将能够全面掌握大模型技术的基础知识、最新进展、企业级应用场景以及未来趋势。通过案例分析、实战演练和高级应用开发,学员将能够深入理解并应用大模型技术,为企业带来创新与价值。

分享
联系客服
返回顶部