机器学习（回归、分类、聚类、时间序列）培训-中科信软培训中心

课程培训

数据方向培训

大厂培训

业务与运营

科学计算与工程仿真

机械设计培训

CFD培训

CAE培训

其它

设计方向

软考类

机器学习（回归、分类、聚类、时间序列）培训

机器学习（回归、分类、聚类、时间序列）培训课程大纲

培训对象：

数据分析师/数据挖掘工程师/算法工程师
需要预测建模能力的业务分析人员
金融/电商/电信/制造等行业数据从业者
希望系统掌握机器学习核心算法的技术人员
对回归、分类、聚类、时间序列预测有特定需求的职场人士

培训目标：
使学员系统掌握机器学习四大核心任务（回归、分类、聚类、时间序列）的原理与实战应用；理解各类算法的适用场景、数学原理与模型评估方法；熟练运用Python Scikit-learn等工具进行建模与调优；能够独立完成从数据预处理、模型构建到结果解读的完整项目，解决实际业务中的预测、分类、分群与时间序列问题。

培训内容介绍：

一、机器学习概述与数学基础

1.1 机器学习概念与分类：机器学习的定义与发展历程；监督学习（回归/分类）与非监督学习（聚类/降维）的区别；机器学习项目的一般流程（CRISP-DM方法论）；四大核心任务的应用场景概述。

1.2 数学基础回顾：线性代数基础（向量/矩阵运算/特征值）；概率论基础（随机变量/概率分布/贝叶斯定理）；微积分与最优化（导数/梯度下降法）；偏差-方差权衡与过拟合概念。

二、Python数据科学工具栈

2.1 开发环境搭建：Anaconda安装与配置；Jupyter Notebook使用；虚拟环境管理。

2.2 数据科学核心库：NumPy数值计算（数组操作/广播机制/聚合计算）；Pandas数据处理（Series/DataFrame/数据清洗/分组聚合）；Matplotlib/Seaborn数据可视化基础。

2.3 Scikit-learn建模基础：统一建模接口（fit/predict/score）；数据集划分（train_test_split）；数据预处理工具（StandardScaler/OneHotEncoder）；Pipeline构建与使用。

三、回归分析

3.1 回归问题概述：回归任务定义（预测连续值）；应用场景（房价预测/销量预测/风险评估）；回归与分类的区别。

3.2 线性回归：一元线性回归原理（最小二乘法/梯度下降）；多元线性回归；模型评估指标（MSE/RMSE/MAE/R²）；模型显著性检验（F检验/t检验）。

3.3 正则化回归：过拟合问题与正则化思想；岭回归（L2正则化）；Lasso回归（L1正则化）与特征选择；ElasticNet弹性网络。

3.4 回归模型诊断：残差分析（正态性/同方差性/独立性）；共线性诊断（VIF）；异常值与强影响点识别（Cook距离）。

3.5 非线性回归：多项式回归；广义加性模型（GAM）简介；回归模型在业务预测中的应用案例。

四、分类算法（上）——逻辑回归与KNN

4.1 分类问题概述：分类任务定义（预测离散类别）；应用场景（信用评分/客户流失/欺诈检测）；二分类与多分类问题。

4.2 逻辑回归：逻辑回归原理（Sigmoid函数/最大似然估计）；二项与多项逻辑回归；逻辑回归系数解读（优势比）；逻辑回归在信贷审批中的应用。

4.3 K-近邻（KNN）算法：KNN原理（距离度量/K值选择/决策规则）；KD树与Ball树加速；KNN参数调优；KNN适用场景与局限性。

4.4 分类模型评估指标：混淆矩阵与代价矩阵；准确率/精确率/召回率/F1-score；ROC曲线与AUC值；PR曲线适用场景（不平衡数据）。

五、分类算法（中）——决策树与朴素贝叶斯

5.1 决策树算法：决策树原理（树结构/分裂准则）；信息增益、基尼系数与增益率；常用决策树算法（ID3/C4.5/CART）；决策树剪枝策略（预剪枝/后剪枝）；决策树可视化与规则提取。

5.2 朴素贝叶斯：贝叶斯定理基础；朴素贝叶斯条件独立假设；三种朴素贝叶斯模型（高斯/多项式/伯努利）；朴素贝叶斯在文本分类中的应用。

5.3 不平衡数据处理：不平衡数据定义与影响；数据层面方法（过采样SMOTE/欠采样）；算法层面方法（代价敏感学习/阈值调整）；评估指标选择（F1-score/AUC-PR）。

六、分类算法（下）——支持向量机与集成学习

6.1 支持向量机（SVM）：SVM基本原理（最大间隔超平面）；线性可分与线性不可分问题；核函数技巧（线性核/多项式核/RBF核）；软间隔与惩罚参数C；SVM参数调优。

6.2 集成学习思想：集成学习理论基础（弱学习器组合强学习器）；Bagging与Boosting对比。

6.3 Bagging与随机森林：Bagging原理（Bootstrap聚合）；随机森林算法（特征随机采样）；特征重要性分析；随机森林在金融风控中的应用。

6.4 Boosting算法：AdaBoost原理（样本权重调整）；梯度提升树（GBDT）；XGBoost原理与优势；LightGBM与CatBoost简介。

6.5 模型融合策略：投票法（硬投票/软投票）；平均法；堆叠法（Stacking）。

七、聚类分析

7.1 无监督学习概述：无监督学习定义与价值；聚类问题与应用场景（客户分群/图像分割/异常检测）。

7.2 相似性度量：距离度量（欧氏距离/曼哈顿距离/余弦相似度）；相似度与相异度概念。

7.3 K-Means聚类：K-Means算法原理与步骤；K值选择（肘部法则/轮廓系数）；K-Means++初始化；K-Means优缺点与应用场景。

7.4 层次聚类：层次聚类原理（凝聚式/分裂式）；距离度量方法（单链/全链/平均链/Ward）；树状图（Dendrogram）解读。

7.5 DBSCAN密度聚类：DBSCAN原理（核心点/边界点/噪音点）；参数选择（ε/MinPts）；DBSCAN优缺点（识别任意形状聚类/抗噪）。

7.6 聚类评估：外部指标（ARI/AMI/NMI）；内部指标（轮廓系数/Calinski-Harabasz指数）。

7.7 降维与可视化：主成分分析（PCA）原理；t-SNE与UMAP高维数据可视化；聚类在客户分群中的应用案例。

八、时间序列分析与预测

8.1 时间序列基础：时间序列定义与成分（趋势/季节/循环/随机）；平稳性概念；自相关与偏自相关函数；时间序列可视化与探索。

8.2 时间序列预处理：缺失值处理；重采样（升采样/降采样）；时间特征工程（滞后特征/滚动窗口特征）；训练集与测试集划分（时间序列交叉验证）。

8.3 经典时序模型：移动平均法（SMA/WMA）；指数平滑法（SES/Holt/Holt-Winters）；季节性分解。

8.4 ARIMA模型：AR模型（自回归）原理；MA模型（移动平均）原理；ARIMA模型（整合移动平均自回归）；模型识别（ACF/PACF定阶）；季节性ARIMA（SARIMA）。

8.5 机器学习时序预测：时间序列转换为监督学习问题；特征构造（滞后特征/滚动统计）；树模型时序预测（XGBoost/LightGBM）；多步预测策略（直接预测/递归预测）。

8.6 深度学习时序预测：RNN/LSTM原理；GRU时序预测；LSTM在销售预测中的应用。

8.7 预测评估：预测误差指标（MAE/MSE/RMSE/MAPE/sMAPE）；预测区间与置信区间；模型比较与选择（AIC/BIC）。

九、模型评估、选择与优化

9.1 模型评估方法：留出法（Hold-out）；K折交叉验证（K-Fold）；分层K折交叉验证（Stratified K-Fold）；时间序列交叉验证（Time Series Split）。

9.2 学习曲线与验证曲线：学习曲线解读（欠拟合/过拟合诊断）；验证曲线参数调优指导。

9.3 超参数调优：手动调优（经验法）；网格搜索（Grid Search）原理与实现；随机搜索（Randomized Search）；贝叶斯优化（Bayesian Optimization）简介。

9.4 模型选择准则：偏差-方差权衡；模型复杂度与泛化能力；模型比较与统计检验。

十、综合实战项目

10.1 回归项目：房价预测/销售预测；数据探索→特征工程→线性回归/正则化回归→模型评估与诊断。

10.2 分类项目：银行客户流失预测/信用卡欺诈检测；不平衡数据处理→多模型对比（逻辑回归/决策树/随机森林/XGBoost）→模型评估→业务策略制定。

10.3 聚类项目：客户价值分群（RFM特征构建）；K-Means/层次聚类/DBSCAN对比→聚类结果评估→客户画像构建→精准营销策略。

10.4 时间序列项目：销量预测/电力负荷预测；时间序列分解→平稳性检验→ARIMA/机器学习模型对比→预测结果评估。

如果您想学习本课程，请预约报名
如果没找到合适的课程或有特殊培训需求，请订制培训
除培训外，同时提供相关技术咨询与技术支持服务，有需求请发需求表到邮箱soft@info-soft.cn,或致电4007991916
技术服务需求表点击在线申请

服务特点：
海量专家资源，精准匹配相关行业，相关项目专家，针对实际需求，顾问式咨询，互动式授课，案例教学，小班授课，实际项目演示，快捷高效，省时省力省钱。

专家力量：
中国科学院软件研究所，计算研究所高级研究人员
oracle,微软，vmware，MSC,Ansys，candence,Altium,达索等大型公司高级工程师，项目经理，技术支持专家
中科信软培训中心，资深专家或讲师
大多名牌大学，硕士以上学历，相关技术专业，理论素养丰富
多年实际项目经历，大型项目实战案例，热情，乐于技术分享
针对客户实际需求，案例教学，互动式沟通，学有所获

报名表下载

点击进入报名表

联系我们更多>>

咨询电话：010-62883247

4007991916

咨询邮箱：soft@info-soft.cn

微信咨询

随时听讲课

聚焦技术实践