SAS培训课程体系(选修专题目录)
专题一:SAS编程入门与Base SAS
专题二:SAS高级编程与宏语言
专题三:SAS SQL与数据整合
专题四:SAS统计分析(STAT模块)
专题五:SAS数据挖掘与机器学习
专题六:SAS时间序列与预测分析
专题七:SAS Viya现代分析平台
专题八:行业实战(金融/医药/市场)
专题一:SAS编程入门与Base SAS培训课程
课程名称:SAS编程入门与Base SAS培训课程
培训对象:
-
零基础SAS编程初学者
-
数据分析师/统计分析师(需掌握SAS基础)
-
高校统计学/数据科学专业学生
-
希望获得SAS Base认证的技术人员
培训目标:
使学员从零开始掌握SAS编程的核心概念与基础语法,熟悉SAS开发环境与程序运行机制;熟练使用DATA步进行数据输入、输出与处理,掌握PROC步进行基本统计分析;理解SAS逻辑库与数据集管理;具备独立编写SAS程序完成数据读取、清洗与基础分析的能力,为SAS Base认证考试打下坚实基础。
培训内容介绍 :
-
SAS系统概述与开发环境
SAS软件发展历程与模块体系(Base/STAT/ETS/EM等);SAS三大窗口(编辑器/日志/输出)功能与使用;SAS逻辑库概念与配置;SAS程序运行机制与提交方式;第一个SAS程序:Hello World。
-
SAS语法基础
SAS语句结构与规则;变量命名规范与数据类型(数值型/字符型);SAS常量与缺失值表示;注释的使用;全局语句与局部语句;SAS程序执行逻辑。
-
数据步(DATA步)基础
DATA步基本结构;创建SAS数据集;SET语句读取已有数据集;INFILE与INPUT语句读取外部文本文件;导入Excel文件(IMPORT过程);访问关系型数据库数据。
-
变量操作与新变量创建
赋值语句与表达式;常用算术运算符;字符连接与处理;数值函数(求和/均值/取整);字符函数(SUBSTR/TRIM/UPCASE);日期函数(TODAY/MDY/YRDIF);条件赋值(IF-THEN/ELSE)。
-
条件处理与选择语句
IF语句与子集IF;WHERE语句使用与区别;IF-THEN/ELSE逻辑控制;SELECT语句多条件分支;IN操作符;缺失值判断。
-
数据排序与分组
PROC SORT过程语法;BY语句与排序顺序;NODUPKEY去重选项;分组处理基础;FIRST.与LAST.变量应用。
-
数据集操作
数据集纵向合并(SET语句);数据集横向合并(MERGE语句);一对一合并与匹配合并;UPDATE语句更新数据集;数据集转置(TRANSPOSE过程)。
-
输出控制与报表生成
PRINT过程制作列表报表;FORMAT过程定义输出格式;LABEL语句添加变量标签;TITLE/FOOTNOTE全局语句;ODS输出传送系统基础(输出到HTML/PDF/RTF)。
-
基础统计过程
MEANS过程计算描述统计量;UNIVARIATE过程深入分析;FREQ过程频数统计与交叉表;CORR过程相关性分析;输出结果解读。
-
SAS程序调试
常见语法错误类型;日志解读与错误定位;PUTLOG语句调试技巧;观测值调试方法;系统选项设置。
-
SAS认证备考
SAS Certified Specialist: Base Programming认证要求;考试题型与答题技巧;模拟试题演练。
-
综合实战:数据清洗与基础分析
从外部文件读取原始数据→数据清洗(缺失值处理/异常值过滤)→新变量计算→数据集合并→描述性统计报表生成→ODS输出格式化报告。
专题二:SAS高级编程与宏语言培训课程
课程名称:SAS高级编程与宏语言培训课程
培训对象:
-
具备Base SAS基础的编程人员
-
需要处理复杂数据结构的分析师
-
希望提高编程效率的SAS开发者
-
准备SAS Advanced认证的技术人员
培训目标:
使学员深入掌握SAS高级编程技术,包括DATA步进阶技巧、数组与哈希对象应用、PROC SQL高级查询;熟练使用SAS宏语言实现程序自动化与参数化设计;理解SAS程序性能优化方法;具备处理复杂数据结构和开发可复用SAS程序的能力,为SAS Advanced Professional认证做好准备。
培训内容介绍 :
-
DATA步进阶技术
DATA步执行逻辑深入理解(编译期vs执行期);PDV(程序数据向量)机制;自动变量(N/ERROR);直接访问与随机访问技术;POINT=选项应用。
-
数组(ARRAY)编程
数组定义与引用;显性数组与隐性数组;数组维度与下标;DO循环与数组结合;数组在重复计算中的应用;多维数组基础。
-
哈希对象(HASH)编程
哈希对象概念与优势;哈希对象定义与实例化;哈希表查找与更新;哈希迭代器应用;哈希在数据快速匹配中的应用。
-
数据转置与重组
复杂数据转置需求;TRANSPOSE过程高级选项;数组实现自定义转置;长宽格式转换;堆叠与拆分数据集。
-
PROC SQL高级应用
SQL在SAS中的实现;复杂多表连接(内/外/复杂连接);子查询与相关子查询;集合操作(UNION/EXCEPT/INTERSECT);创建与更新表;视图创建;SQL性能优化。
-
SAS宏语言基础
宏语言作用与原理;宏变量定义(%LET);宏变量引用(&);宏函数(%UPCASE/%SUBSTR/%SCAN);系统宏变量;宏表达式。
-
宏程序开发
宏定义(%MACRO/%MEND);宏参数传递(位置参数/关键字参数);宏程序调用;宏条件语句(%IF/%THEN/%ELSE);宏循环语句(%DO/%END)。
-
宏高级特性
宏函数开发;宏与DATA步交互(CALL SYMPUT/SYMPUTX);解析符号变量(%NRSTR/%SUPERQ);宏存储与复用(AUTOCALL库);宏调试选项(MPRINT/MLOGIC/MERROR)。
-
效率优化技术
WHERE与子集IF性能对比;索引创建与应用;BY语句分组处理效率;压缩数据集;内存选项设置;大数据集处理策略。
-
自定义函数与例程
PROC FCMP过程;创建自定义函数;创建子例程;函数库管理;在DATA步中调用自定义函数。
-
高级输入输出
读取复杂格式外部数据(多行记录/分层数据);读取XML/JSON数据;DBMS数据访问优化;数据加密与安全选项。
-
综合实战:自动化报表系统开发
开发可复用的宏程序库:参数化数据导入宏→动态变量计算宏→自动化统计报表生成宏→ODS输出控制宏→宏程序文档化与打包。
专题三:SAS SQL与数据整合培训课程
课程名称:SAS SQL与数据整合培训课程
培训对象:
-
需要处理多源数据的SAS程序员
-
数据仓库/ETL开发人员
-
数据库管理员(需与SAS交互)
-
数据分析师(需复杂数据查询能力)
培训目标:
使学员系统掌握SAS中PROC SQL的核心语法与高级查询技巧,熟练进行多表连接、子查询、集合操作;理解SAS与各类数据源的整合方法,包括关系型数据库、Hadoop、Excel等;掌握数据清洗、转换与整合的完整流程;具备构建复杂数据视图和数据集成的实战能力。
培训内容介绍 :
-
PROC SQL概述
SQL在SAS中的实现;PROC SQL与DATA步对比;PROC SQL执行流程;SELECT语句基本结构;列选择与别名。
-
单表查询
WHERE子句条件过滤;ORDER BY排序;GROUP BY分组聚合;HAVING分组后过滤;DISTINCT去重;汇总函数应用(COUNT/SUM/AVG/MIN/MAX)。
-
多表连接查询
内连接(INNER JOIN);外连接(LEFT/RIGHT/FULL JOIN);复杂连接条件;多表连接顺序与性能;自连接应用;连接与子查询选择。
-
子查询
标量子查询;行子查询;表子查询;相关子查询;EXISTS与NOT EXISTS;IN与NOT IN;子查询在SELECT/FROM/WHERE中的应用。
-
集合操作
UNION与UNION ALL;EXCEPT集合差;INTERSECT集合交;集合操作注意事项;集合操作与连接查询对比。
-
数据创建与管理
CREATE TABLE创建表;CREATE VIEW创建视图;INSERT插入数据;UPDATE更新数据;DELETE删除数据;DROP删除表/视图;ALTER TABLE修改结构。
-
SAS逻辑库与数据源连接
LIBNAME语句原理;连接各类数据库(Oracle/MySQL/SQL Server);传递查询优化(DBMS=选项);跨库连接查询。
-
Hadoop大数据整合
SAS/ACCESS to Hadoop;连接Hive表;读取HDFS文件;处理Parquet/ORC列式存储;SAS与Hive SQL交互。
-
Excel与文本文件整合
导入Excel多工作表;读取CSV/带分隔符文本;处理不规范格式文本;批量导入与导出;数据清洗(特殊字符/编码问题)。
-
数据清洗与质量提升
缺失值识别与处理;重复记录检测与删除;异常值识别方法;数据标准化与格式化;数据一致性校验。
-
数据转换与加工
行列转换实现(CASE WHEN聚合);条件聚合技术;累积计算实现;排名与分组序号;窗口函数模拟(SAS中实现)。
-
性能优化
SQL执行计划解读;索引创建与应用;子查询优化技巧;连接顺序优化;数据分区策略;大数据集处理建议。
-
综合实战:多源数据整合分析
从多个数据源(Oracle订单表/Excel客户表/Hive日志表)抽取数据→数据清洗与标准化→多表连接构建分析宽表→复杂查询生成业务指标→创建视图供报表调用→性能优化与验证。
专题四:SAS统计分析(STAT模块)培训课程
课程名称:SAS统计分析(STAT模块)培训课程
培训对象:
-
统计分析师/研究员
-
市场研究/用户研究从业者
-
高校师生(需统计分析能力)
-
医学/社会科学领域研究人员
培训目标:
使学员系统掌握SAS/STAT模块的核心统计分析方法,包括描述统计、假设检验、方差分析、回归分析、多元统计分析等;理解各类统计方法的适用场景与假设条件;熟练进行统计建模、结果解读与报告输出;具备独立完成从数据准备到统计推断的完整分析能力。
培训内容介绍 :
-
统计分析基础
统计推断基本概念;参数估计与假设检验原理;SAS/STAT模块概述;常用统计过程列表。
-
描述统计分析
UNIVARIATE过程深入(分位数/极端值/正态性检验);MEANS过程高级选项;FREQ过程复杂交叉表;统计量输出与存储。
-
t检验系列
单样本t检验(TTEST过程);独立样本t检验(方差齐性检验);配对样本t检验;非参数替代方法(NPAR1WAY过程);效应量计算。
-
方差分析(ANOVA)
单因素方差分析(ANOVA过程/GLM过程);多重比较方法(LSD/Tukey/Duncan);双因素方差分析(主效应/交互效应);随机区组设计;重复测量方差分析。
-
相关分析
CORR过程(皮尔逊/斯皮尔曼/肯德尔);偏相关分析;相关矩阵可视化;相关系数显著性检验。
-
线性回归分析
REG过程语法;一元线性回归;多元线性回归;变量筛选方法(逐步/向前/向后);模型诊断(残差分析/共线性诊断);异常值识别;预测与置信区间。
-
广义线性模型
GLM过程应用;协方差分析(ANCOVA);非平衡设计处理;固定效应与随机效应;混合模型初步。
-
逻辑回归分析
LOGISTIC过程语法;二分类逻辑回归;模型拟合优度检验;优势比(OR值)计算;分类预测准确率;ROC曲线与AUC值;多分类逻辑回归。
-
主成分分析(PCA)
PRINCOMP过程;特征值与方差解释率;主成分得分计算;因子载荷矩阵解读;碎石图绘制。
-
因子分析
FACTOR过程语法;因子提取方法;因子旋转(正交/斜交);因子得分计算;结果解释与命名。
-
聚类分析
系统聚类(CLUSTER过程);K-means快速聚类(FASTCLUS过程);两步聚类(STEPDISC过程);聚类结果可视化;聚类数选择方法。
-
判别分析
DISCRIM过程;典型判别分析;逐步判别分析;分类效果评估;交叉验证。
-
结果输出与解读
ODS输出统计量;统计表格规范呈现;统计图生成与编辑(SGPLOT);分析报告撰写;统计结果业务化解读。
-
综合实战:多元统计分析项目
以市场调研数据为例:数据预处理→描述统计分析→因子分析降维→聚类分析客户分群→不同客群差异检验→判别分析预测→综合分析报告。
专题五:SAS数据挖掘与机器学习培训课程
课程名称:SAS数据挖掘与机器学习培训课程
培训对象:
-
数据挖掘工程师/算法工程师
-
风控建模/信用评分卡开发人员
-
营销分析/用户行为分析人员
-
希望掌握SAS EM工具的分析师
培训目标:
使学员掌握SAS Enterprise Miner数据挖掘全流程方法论(SEMMA),熟练使用SAS EM进行数据探索、变量筛选、模型训练与评估;掌握主流机器学习算法(决策树/神经网络/逻辑回归/聚类/关联规则)的SAS实现;具备构建信用评分卡、客户分群、购物篮分析等商业模型的能力。
培训内容介绍 :
-
数据挖掘概述与SEMMA方法论
数据挖掘定义与CRISP-DM;SAS SEMMA方法论(Sample/Explore/Modify/Model/Assess);SAS Enterprise Miner界面与工作流;数据挖掘项目流程。
-
数据探索与预处理
数据导入与分区(训练/验证/测试);数据探索节点(分布分析/统计汇总);变量变换与标准化;缺失值处理策略;异常值识别与处理。
-
变量筛选与降维
变量聚类节点;变量选择节点(基于重要性/R-square);主成分分析应用;因子分析应用;IV值计算与变量筛选。
-
决策树模型
决策树算法原理;SAS EM决策树节点配置;树生长与剪枝策略;规则提取与解释;决策树模型评估。
-
神经网络模型
神经网络基础(多层感知器/反向传播);SAS EM神经网络节点配置;网络结构选择;过拟合控制;神经网络模型应用。
-
逻辑回归模型
逻辑回归节点配置;变量选择方法;逐步回归应用;模型诊断(共线性/异常值);评分卡转换。
-
聚类分析
聚类节点配置;K-means算法;层次聚类;聚类数选择(肘部法则/轮廓系数);聚类结果解释与可视化。
-
关联规则挖掘
关联规则原理(支持度/置信度/提升度);关联节点配置;购物篮分析应用;规则筛选与解释;关联规则可视化。
-
模型评估与比较
模型评估指标(混淆矩阵/准确率/召回率/F1值/ROC曲线/Lift图);模型比较节点;模型选择策略;模型部署准备。
-
信用评分卡开发
信用评分卡原理;变量分箱与WOE编码;IV值计算;逻辑回归建模;评分卡刻度化;评分卡验证。
-
集成学习
随机森林原理;梯度提升树(GBM);模型集成方法(投票/平均/堆叠);SAS EM集成节点配置。
-
模型部署与应用
评分代码生成(SAS代码/PMML);模型发布流程;新数据批量评分;模型监控与更新;模型文档化。
-
综合实战:信用评分卡全流程开发
银行信贷数据→数据探索与清洗→变量分箱与WOE编码→IV筛选→逻辑回归建模→模型评估(KS值/AR值)→评分卡转换→评分卡验证→模型部署准备。
专题六:SAS时间序列与预测分析培训课程
课程名称:SAS时间序列与预测分析培训课程
培训对象:
-
金融/经济领域分析师
-
销售预测/需求计划人员
-
供应链管理从业者
-
需要时间序列建模能力的统计人员
培训目标:
使学员系统掌握SAS/ETS模块的时间序列分析方法,理解时间序列分解、平稳性检验、ARIMA建模等核心技术;熟练使用SAS进行时间序列数据预处理、模型识别、参数估计与预测;掌握指数平滑、干预模型、面板数据分析等进阶方法;具备独立完成企业销售预测、经济指标分析等任务的能力。
培训内容介绍 :
-
时间序列基础概念
时间序列定义与成分(趋势/季节/循环/随机);平稳性概念;自相关与偏自相关函数;SAS/ETS模块概述。
-
时间序列数据准备
时间变量定义(DATE/INTERVAL);时序数据排序与补齐;缺失值处理方法;时序数据探索(PROC TIMESERIES)。
-
时间序列分解
乘法模型与加法模型;PROC X12季节调整方法;趋势提取;季节因子计算;分解结果解读。
-
平稳性检验
单位根检验(PROC ARIMA的Stationarity选项);ADF检验;KPSS检验;差分阶数确定。
-
ARIMA模型
ARIMA模型原理(AR/I/MA);识别阶段(ACF/PACF分析);估计阶段(PROC ARIMA);诊断阶段(残差检验);预测阶段;自动ARIMA实现。
-
指数平滑方法
简单指数平滑;Holt线性趋势;Holt-Winters季节模型;PROC ESM应用;平滑参数估计;模型选择标准(AIC/BIC)。
-
干预模型
干预事件影响分析;脉冲干预与阶跃干预;干预模型构建;干预效果评估;PROC ARIMA干预实现。
-
面板数据分析
面板数据结构;固定效应模型;随机效应模型;Hausman检验;PROC PANEL应用。
-
多元时间序列
向量自回归模型(VAR);协整检验;误差修正模型(ECM);格兰杰因果检验;PROC VARMAX应用。
-
预测精度评估
预测误差指标(MAE/MAPE/RMSE);预测区间计算;滚动预测验证;模型比较方法。
-
SAS Visual Forecasting
SAS Visual Forecasting简介;自动化预测流程;大规模预测应用;预测结果可视化。
-
综合实战:企业销售预测系统
历史销售数据导入→时序探索与分解→平稳性检验→ARIMA/指数平滑模型选择→模型估计与诊断→未来12个月预测→预测区间计算→预测报告生成→模型监控方案设计。
专题七:SAS Viya现代分析平台培训课程
课程名称:SAS Viya现代分析平台培训课程
培训对象:
-
传统SAS用户向云平台转型
-
大数据工程师/数据科学家
-
需要高性能分析的统计人员
-
希望掌握现代SAS技术的开发者
培训目标:
使学员理解SAS Viya云原生架构的核心概念与优势;掌握在SAS Viya平台上运行传统SAS代码的方法;熟练使用CAS(云分析服务)进行高性能数据处理;了解CASL编程语言与分布式计算;具备将传统SAS程序迁移到Viya平台并进行优化的能力。
培训内容介绍 :
-
SAS Viya架构概述
SAS Viya云原生架构;CAS(云分析服务)引擎;多租户设计;内存计算特性;与SAS 9对比;SAS Viya部署模式(公有云/私有云/混合云)。
-
Viya环境与界面
SAS Viya Web界面;SAS Studio in Viya;Jupyter Notebook集成;可视化工具(Visual Analytics/Visual Statistics);环境导航。
-
传统代码在Viya中运行
在Viya上运行SAS 9代码兼容性;代码自动优化机制;SAS 9与Viya代码差异;迁移注意事项。
-
CAS连接与数据管理
连接CAS服务器(CASLIB);数据加载到内存;CAS表与SAS数据集转换;支持的文件格式(SASHDAT/Parquet/CSV/Excel);分布式数据存储。
-
CAS数据处理
DATA步在CAS中执行;PROC SQL在CAS中执行(FedSQL);CAS-enabled过程;数据分区与并行处理。
-
CASL编程语言
CASL语法基础;CASL vs传统SAS;数据操作action;表管理action;结果处理;CASL自动化脚本。
-
高性能分析过程
PROC CAS应用;分布式统计计算;大规模数据建模(决策树/回归/神经网络);内存计算优势;性能对比分析。
-
可视化分析(Visual Analytics)
Visual Analytics界面;数据探索与可视化;仪表盘设计;报表发布;移动端访问。
-
机器学习(Visual Statistics)
交互式建模界面;自动化机器学习;模型比较与选择;模型发布。
-
开放模型集成
与Python/R集成;使用SAS Viya REST API;开放源代码模型部署;模型生命周期管理。
-
传统SAS程序迁移
迁移评估方法;代码兼容性检查;性能瓶颈识别;优化策略;迁移测试与验证。
-
综合实战:传统SAS程序迁移与优化
选取传统SAS程序→迁移评估→代码调整(CAS优化)→数据加载(CASLIB)→执行对比测试→性能优化→结果验证→迁移文档化。
专题八:行业实战(金融/医药/市场)培训课程
课程名称:行业实战(金融/医药/市场)培训课程
培训对象:
-
金融行业分析师(银行/保险/证券)
-
医药行业临床数据分析师(CRO/药企)
-
市场研究/CRM分析人员
-
希望提升行业实战能力的SAS用户
培训目标:
使学员了解SAS在不同行业的典型应用场景与解决方案;掌握金融行业风险建模、信用评分卡开发方法;熟悉医药行业临床试验数据分析流程与CDISC标准;掌握市场细分、客户价值分析、营销组合优化等商业分析方法;具备将SAS技术应用于具体行业业务的实战能力。
培训内容介绍 :
金融方向
-
金融行业SAS应用概览
银行/保险/证券典型应用;风险管理体系;监管合规需求;SAS金融解决方案介绍。
-
信用风险建模
申请评分卡开发(A卡);行为评分卡开发(B卡);催收评分卡开发(C卡);变量筛选与分箱;评分卡刻度化。
-
反欺诈分析
欺诈模式识别;异常交易检测;社交网络分析(SNA);规则引擎与模型结合。
-
客户关系管理
RFM模型构建;客户价值分群;交叉销售与提升销售;客户流失预警。
-
营销活动优化
响应模型构建;营销组合优化(SAS Marketing Optimization);活动效果评估;A/B测试分析。
医药方向
-
临床数据标准
CDISC标准体系(SDTM/ADaM);SAS临床编程规范;临床数据集构建。
-
临床试验数据分析
临床数据导入与清洗;不良事件分析;实验室数据分析;有效性分析;安全性分析。
-
生存分析
Kaplan-Meier生存曲线;Cox比例风险模型;生命表分析;PROC LIFETEST/PROC PHREG应用。
-
新药申报报告
临床研究报告生成;Tables/Listings/Figures制作;ODS RTF输出;符合监管要求的数据提交。
市场方向
-
市场调研数据分析
问卷数据清洗;满意度分析;品牌健康度监测;NPS计算与分析。
-
市场细分分析
聚类分析客户分群;因子分析降维;对应分析品牌定位;细分市场画像。
-
购物篮分析
关联规则挖掘;交叉销售机会识别;商品陈列优化;购买行为模式分析。
-
综合实战:行业案例完整复现
行业案例一(金融):银行客户信用评分卡开发全流程
行业案例二(医药):临床试验基线数据分析与报表生成
行业案例三(市场):零售客户分群与营销策略制定
如果您想学习本课程,请
预约报名
如果没找到合适的课程或有特殊培训需求,请
订制培训
除培训外,同时提供相关技术咨询与技术支持服务,有需求请发需求表到邮箱soft@info-soft.cn,或致电4007991916
技术服务需求表点击在线申请
服务特点:
海量专家资源,精准匹配相关行业,相关项目专家,针对实际需求,顾问式咨询,互动式授课,案例教学,小班授课,实际项目演示,快捷高效,省时省力省钱。
专家力量:
中国科学院软件研究所,计算研究所高级研究人员
oracle,微软,vmware,MSC,Ansys,candence,Altium,达索等大型公司高级工程师,项目经理,技术支持专家
中科信软培训中心,资深专家或讲师
大多名牌大学,硕士以上学历,相关技术专业,理论素养丰富
多年实际项目经历,大型项目实战案例,热情,乐于技术分享
针对客户实际需求,案例教学,互动式沟通,学有所获