大数据与SAS数据挖掘4天
讲师:孙增辉 发布日期:12-08 浏览量:740
课程名称
课程介绍
本课程是大数据与使用sas做数据挖掘的基础课。
主要内容是:
1、介绍了大数据的定义。回顾大数据的时代背景、大数据的构成,已经大数据的“4v”特征。并且介绍了大数据的技术与应用范围。并介绍了大数据已经对我们产生的影响。以及一个广受欢迎的大数据支撑产品---hadoop软件的安装
2、大数据是数据分析的前提,也是从数据中产生价值的基础。真正产生价值,我们还要通过数据分析----SAS数据挖掘简介、从外部数据源加载数据到SAS数据集、简单的数据分析,三部分。
适合对象
课程适合想要从事大数据、数据分析、数据挖掘工作的初级人员
课程目标
理解大数据的定义
了解大数据技术
明白大数据对我们的影响
Hadoop安装
课程需完成的目标读取原始数据文件和SAS数据集
调查和生成频率表和描述性统计汇总数据
创建的SAS变量和重新编码的数据值
数据子集
结合多个SAS文件
创建列表,汇总,HTML和图形报表。
读取SAS数据集
读取原始数据文件
通过级联和合并相结合的SAS数据集
通过赋值语句和条件逻辑创建的SAS变量
课程大纲
大数据的定义
大数据的时代背景
大数据的”4V”特征
大数据的构成
大数据的技术与应用
大数据要解决的问题
大数据的相关技术
大数据的应用实例
机遇与挑战
这是一场生活、工作与思维的变革。
精准营销
业务拓展
客户服务
风险控制
商业模式
Hadoop 软件安装
安装准备
安装过程
需要注意的问题
SAS简介
在SAS系统概述
开始与SAS系统
介绍SAS程序
运行SAS程序
掌握基本概念
诊断和纠正语法错误
探索您的SAS环境
快速熟悉SAS数据集
SAS数据库
解决方案习题
生产报告表
入门与打印程序
排序和分组观察
识别观察
特殊WHERE语句运算符
加强输出
自定义报表外观
格式化数据值
创建的HTML报告
创建的SAS数据集
读取原始数据文件:输入栏
读取原始数据文件:格式化输入
检查数据错误
指定变量属性
更改变量属性
读取Excel电子表格
数据步编程
读SAS数据集和创建变量
条件处理
删除和保存变量
混合使用SAS数据集
串连SAS数据集
合并SAS数据集
8.3结合使用SAS数据集:附加功能
制作摘要报告
介绍报告摘要
基本总结报告
报告程序
TABULATE程序
介绍图形
生产条形图和饼图
提高输出
制作图解
数据描述统计分析之PROC MEANS
PROC MEANS语法
相关值的含义
案例
数据描述统计分析之PROC GPLOT
PROC GPLOT语法
案例
数据挖掘之线性回归 PROC REG
PROC REG语法
案例
模型选择
模型预测