大数据与SAS数据挖掘4天

讲师:孙增辉 发布日期:12-08 浏览量:740


课程名称

课程介绍

本课程是大数据与使用sas做数据挖掘的基础课。

主要内容是:

1、介绍了大数据的定义。回顾大数据的时代背景、大数据的构成,已经大数据的“4v”特征。并且介绍了大数据的技术与应用范围。并介绍了大数据已经对我们产生的影响。以及一个广受欢迎的大数据支撑产品---hadoop软件的安装

2、大数据是数据分析的前提,也是从数据中产生价值的基础。真正产生价值,我们还要通过数据分析----SAS数据挖掘简介、从外部数据源加载数据到SAS数据集、简单的数据分析,三部分。

适合对象

课程适合想要从事大数据、数据分析、数据挖掘工作的初级人员

课程目标

理解大数据的定义

了解大数据技术

明白大数据对我们的影响

Hadoop安装

课程需完成的目标读取原始数据文件和SAS数据集

调查和生成频率表和描述性统计汇总数据

创建的SAS变量和重新编码的数据值

数据子集

结合多个SAS文件

创建列表,汇总,HTML和图形报表。

读取SAS数据集

读取原始数据文件

通过级联和合并相结合的SAS数据集

通过赋值语句和条件逻辑创建的SAS变量

课程大纲

大数据的定义

大数据的时代背景

大数据的”4V”特征

大数据的构成

大数据的技术与应用

大数据要解决的问题

大数据的相关技术

大数据的应用实例

机遇与挑战

这是一场生活、工作与思维的变革。

精准营销

业务拓展

客户服务

风险控制

商业模式

Hadoop 软件安装

安装准备

安装过程

需要注意的问题

SAS简介

在SAS系统概述

开始与SAS系统

介绍SAS程序

运行SAS程序

掌握基本概念

诊断和纠正语法错误

探索您的SAS环境

快速熟悉SAS数据集

SAS数据库

解决方案习题

生产报告表

入门与打印程序

排序和分组观察

识别观察

特殊WHERE语句运算符

加强输出

自定义报表外观

格式化数据值

创建的HTML报告

创建的SAS数据集

读取原始数据文件:输入栏

读取原始数据文件:格式化输入

检查数据错误

指定变量属性

更改变量属性

读取Excel电子表格

数据步编程

读SAS数据集和创建变量

条件处理

删除和保存变量

混合使用SAS数据集

串连SAS数据集

合并SAS数据集

8.3结合使用SAS数据集:附加功能

制作摘要报告

介绍报告摘要

基本总结报告

报告程序

TABULATE程序

介绍图形

生产条形图和饼图

提高输出

制作图解

数据描述统计分析之PROC MEANS

PROC MEANS语法

相关值的含义

案例

数据描述统计分析之PROC GPLOT

PROC GPLOT语法

案例

数据挖掘之线性回归 PROC REG

PROC REG语法

案例 

模型选择

模型预测

分享
联系客服
返回顶部