《大数据分析与数据挖掘》
讲师:刘静芳 发布日期:02-23 浏览量:461
《大数据分析与数据挖掘》
【课程背景】
近些年,由于以社交网站、基于位置的服务LBS 等为代表的新型信息产生方式的涌现,以及云计算、移动和物联网技术的迅猛发展,无处不在的移动、无线传感器等设备无时不刻都在产生数据,数以亿计用户的互联网服务时时刻刻都在产生着数据交互,大数据时代已经到来。在大数据时代,互联网络、社交平台等的覆盖范围正在不断的扩大,大量的增加了各种各样的数据信息,尽管其中包含的有价值的信息比较多,但要想将此类信息价值充分发挥出来,需在海量数据信息中心挖掘出有用的数据,如何分析、管理、利用大数据,在大量的数据中找到有意义的模式和规则,这些工作仍将面临很大的挑战。
【课程收益】
了解数字化转型的内涵,数字化转型的发展阶段和带来的业务转型创新,掌握公司数字化转型的主要流程;了解大数据挖掘的主要方法。
【课程特色】
内容全面、重点清晰
【课程对象】
国央企、大型上市公司财务部门、财务共享中心、互联网金融等部门中高级管理人员;
金融科技行业从业人员;
高新科技行业从业人员;
【课程时间】
1天
【课程大纲】
数字化转型的发展数字化转型的内涵,数字化转型的发展阶段和带来的业务转型创新。
数字化转型的流程
人工智能与大数据什么是大数据、大数据原理,数据分析和数据管理
人工智能的概念、人工智能技术(自然语言处理、统计机器学习、知识图谱技术、数据可视化技术、数据虚拟化技术)
介绍数据挖掘主要步骤,包括:数据获取、数据整理、假设与建模、模型训练与调整、评估与解释、操作或实施、优化。
大数据与统计学的区别数据描述性统计与数据可视化数据描述性统计:数据分布特征;介绍几个统计指标:偏度、峰度等
数据描述性统计的意义
数据可视化工具:类别比较型图表、数据关系型图表、数据分布型图表、时间序列型图表、局部整体型图表数据预处理预处理的步骤:数据获取、数据转换、数据清洗等
数据异常值的判断和处理方式数据集统计检验假设检验
信度检验
正态检验
其他统计检验方法:T检验、F检验、卡方检验
数据相关性与方差分析相关性分析的概念、适用领域、分析方法
相关性分析工具:散点图、相关系数
方差分析:单因素方差分析、双因素方差分析、协方差分析
主成分分析与聚类分析主成分分析概念及原理、优势
聚类分析基本概念、聚类分析方法(系统聚类法、K-均值法、模糊聚类法、有序样品的聚类)时间序列数据分析时间序列数据分析法概念、特点、可能存在的问题
主要模型:算数平均法、加权移动平均法、指数平滑法、长期趋势法
时间序列数据模型应用:季节变动预测法、自回归模型、移动平均模型、自回归移动平均模型。回归分析与数据学习线性回归概念与应用,一元线性回归和多元线性回归、最小二乘法
多项式回归概念与应用
回归决策树
随机森林决策模型
深度学习
人工神经网络