互联网
类型
可以朗读
语音朗读
277千字
字数
2022-06-01
发行日期
展开全部
主编推荐语
以工业大数据的特点和需求为牵引,阐述了工业大数据分析的算法与实现机制。
内容简介
全书分10章,可划分为四个部分。
第一部分(第1章)是数据分析概览,目的是建立起数据分析算法的概念框架,并给出学习路线。
第二部分(第2~5章),侧重在通用数据分析算法,包括数据预处理、机器学习、时序挖掘算法和优化等其他算法。
第三部分(第6~8章),讨论了工业分析的算法思路,覆盖了生产质量分析(PQM)、生产效率优化(PEM)等典型分析课题的算法组合套路。
第四部分侧重在分析工程方法,第9章讨论了工业专家知识沉淀方法,第10章讨论了数据分析的软件工程。
本书适合工业大数据分析从业者、工业企业研发技术人员、工业互联网企业数据分析师阅读,也可作为上述人员的培训教材和相关专业师生的参考书。
目录
- 版权信息
- 大数据与“智能+”产教融合丛书编辑委员会
- 丛书序一
- 丛书序二
- 前言
- 第1章 工业大数据分析概览
- 1.1 工业大数据分析的范畴与特点
- 1.1.1 数据分析的范畴
- 1.1.2 典型分析主题
- 1.1.3 工业数据分析的特点
- 1.1.4 数据分析的典型手段
- 1.2 数据挖掘的过程方法
- 1.2.1 CRISP-DM简介
- 1.2.2 分析课题的执行路径
- 1.3 数据分析工具软件
- 1.3.1 脚本语言软件
- 1.3.2 图形化桌面软件
- 1.3.3 云端分析软件
- 1.4 工业大数据分析师的算法修养
- 1.4.1 分析算法理解的维度与路径
- 1.4.2 必读图书
- 1.4.3 分析算法背后的朴素思想
- 1.4.4 工程化思维
- 参考文献
- 第2章 数据预处理
- 2.1 数据操作基础
- 2.1.1 数据框的基本操作
- 2.1.2 数据可视化
- 2.2 数据分析的数据操作技巧
- 2.2.1 cumsum等primitive函数的利用:避免循环
- 2.2.2 带时间戳的数据框合并
- 2.2.3 时序数据可视化:多个子图共用一个x轴
- 2.2.4 时序数据可视化:NA用来间隔显示时序
- 2.2.5 参数区间的对比显示(在概率密度图上)
- 2.2.6 获取R文件的所在路径
- 2.2.7 分段线性回归如何通过lm()实现
- 2.3 探索型数据分析(EDA)
- 2.3.1 引言
- 2.3.2 R语言EDA包
- 2.3.3 其他工具包
- 2.3.4 小结
- 2.4 数据质量问题
- 2.4.1 数据的业务化
- 2.4.2 业务的数据化
- 2.4.3 机理演绎法
- 2.4.4 细致求实的基本素养
- 2.4.5 小结
- 2.5 特征提取
- 2.5.1 基于数据类型的特征提取
- 2.5.2 基于关联关系的特征自动生成
- 2.5.3 基于语法树的变量间组合特征生成
- 2.6 特征选择
- 2.6.1 特征选择的框架
- 2.6.2 搜索策略
- 2.6.3 子集评价
- 2.6.4 小结
- 参考文献
- 第3章 机器学习算法
- 3.1 统计分析
- 3.1.1 概率分布
- 3.1.2 参数估计
- 3.1.3 假设检验
- 3.2 统计分布拟合
- 3.2.1 引言
- 3.2.2 基于核函数的非参数方法
- 3.2.3 单概率分布的参数化拟合
- 3.2.4 混合概率分布估计
- 3.2.5 小结
- 3.3 线性回归模型
- 3.3.1 引言
- 3.3.2 基础线性回归模型——OLS模型
- 3.3.3 OLS模型检验
- 3.3.4 鲁棒线性回归
- 3.3.5 结构复杂度惩罚(正则化)
- 3.3.6 扩展
- 3.4 多元自适应回归样条(MARS)
- 3.4.1 引言
- 3.4.2 前向计算过程
- 3.4.3 后剪枝过程
- 3.4.4 变量重要性评价
- 3.4.5 MARS与其他算法的关系
- 3.5 神经网络
- 3.5.1 ANN逼近能力的直观理解
- 3.5.2 极限学习机
- 3.6 决策树
- 3.6.1 决策树的概念
- 3.6.2 决策树构建过程
- 3.6.3 常用决策树算法
- 3.7 支持向量机(SVM)
- 3.7.1 引言
- 3.7.2 epsilon-SVR算法
- 3.7.3 nu-SVR算法
- 3.7.4 不同SVM算法包的差异
- 3.7.5 扩展
- 3.8 隐马尔可夫模型
- 3.8.1 引言
- 3.8.2 工作原理
- 3.8.3 示例
- 3.8.4 讨论
- 3.9 概率图模型与贝叶斯方法
- 3.9.1 引言
- 3.9.2 朴素贝叶斯
- 3.9.3 贝叶斯网络
- 3.9.4 一般图模型
- 3.9.5 讨论与扩展阅读
- 3.10 集成学习
- 3.10.1 引言
- 3.10.2 Bagging方法
- 3.10.3 Boosting方法
- 3.10.4 Stacking方法
- 3.11 模型评价
- 3.11.1 引言
- 3.11.2 评价指标
- 3.11.3 评价方法
- 3.11.4 特征重要度
- 3.12 聚类
- 3.12.1 引言
- 3.12.2 基于距离的聚类:K-means、PAM
- 3.12.3 基于层次的聚类:Hclust
- 3.12.4 基于密度的聚类:DBSCAN
- 3.12.5 基于分布的聚类:GMM
- 3.12.6 聚类结果的评价
- 3.13 关联规则
- 3.13.1 引言
- 3.13.2 关联规则概念与度量指标
- 3.13.3 关联规则实现过程
- 3.13.4 关联规则算法
- 3.13.5 关联规则可视化
- 3.13.6 关联规则评价
- 3.14 深度学习
- 3.14.1 引言
- 3.14.2 深度学习算法分类
- 3.14.3 深度学习框架
- 3.14.4 常见疑惑
- 3.14.5 深度学习算法的加速
- 3.15 机器学习算法的其他视角
- 3.15.1 计算负载模式
- 3.15.2 并行化计算
- 3.15.3 新计算范式
- 参考文献
- 第4章 时序数据挖掘算法
- 4.1 时序算法简介
- 4.2 信号处理算法
- 4.2.1 傅里叶变换的直观理解
- 4.2.2 时频分析
- 4.2.3 时序变换
- 4.2.4 压缩感知
- 4.3 时序分解
- 4.3.1 STL
- 4.3.2 奇异谱分析
- 4.3.3 EMD及扩展方法
- 4.4 时序分割
- 4.4.1 Changepoint
- 4.4.2 TreeSplit
- 4.4.3 Autoplait
- 4.4.4 应用示例
- 4.5 时序再表征
- 4.6 序列模式挖掘
- 4.6.1 数值型频繁模式
- 4.6.2 符号型频繁模式
- 4.7 时序异常检测
- 4.7.1 基于度量的方法
- 4.7.2 基于模型重构的方法
- 4.7.3 基于频繁模式挖掘的方法
- 4.8 时序聚类
- 4.8.1 DTW距离
- 4.8.2 SAX距离
- 4.9 时序分类
- 4.9.1 经典分析算法
- 4.9.2 深度学习的方法
- 4.10 时序预测
- 4.10.1 基于时序分解的预测算法
- 4.10.2 基于回归建模的预测算法
- 参考文献
- 第5章 其他算法
- 5.1 最优化算法
- 5.1.1 模型分类
- 5.1.2 经典组合优化模型
- 5.1.3 典型工具
- 5.2 规则推理算法
- 5.3 系统辨识算法
- 5.3.1 算法分类
- 5.3.2 典型工具
- 5.4 特定数据类型的算法
- 5.4.1 文本数据
- 5.4.2 图像数据
- 5.4.3 时空数据
- 参考文献
- 第6章 工业分析中的典型处理方法
- 6.1 工业分析中的数据预处理
- 6.1.1 工况划分
- 6.1.2 数据缺失
- 6.1.3 时间数据不连续
- 6.1.4 强噪声
- 6.1.5 大惯性系统
- 6.1.6 趋势项的消除
- 6.2 通用时序特征
- 6.3 典型征兆特征
- 6.3.1 毛刺检测特征
- 6.3.2 单调趋势模式
- 6.3.3 平稳过程的漂移检测
- 6.3.4 多点位不一致
- 6.3.5 超界
- 6.3.6 变点检测
- 6.3.7 一维曲线平滑与分区
- 6.3.8 二维形状分析
- 6.3.9 持续某种状态
- 6.4 工业时序分析问题
- 6.4.1 工业时序数据的特点
- 6.4.2 短时序分类问题
- 6.4.3 长时序分类问题
- 6.4.4 不同类型问题的转换
- 参考文献
- 第7章 生产质量数据分析算法
- 7.1 概述
- 7.2 基础算法
- 7.2.1 物料跟踪模型
- 7.2.2 过程稳定性监控
- 7.3 时空模式分析
- 7.4 连续流程生产
- 7.4.1 应用示例
- 7.4.2 工况划分
- 7.4.3 操作参数优化
- 7.4.4 其他分析
- 7.5 批次流程生产
- 7.5.1 应用示例
- 7.5.2 理想工艺过程拟合
- 7.5.3 动态控制优化
- 7.6 离散生产
- 7.6.1 应用示例
- 7.6.2 最佳工艺路径挖掘
- 7.6.3 异常排查
- 7.6.4 操作参数优化
- 7.7 总结
- 参考文献
- 第8章 生产效率优化
- 8.1 决策优化问题的建模思路
- 8.2 线性规划的建模技巧
- 8.2.1 绝对值
- 8.2.2 Min-Max问题
- 8.2.3 分式目标函数
- 8.2.4 范围约束
- 8.3 整数规划的建模技巧
- 8.3.1 决策变量值域不连续
- 8.3.2 目标函数不连续
- 8.3.3 或关系约束
- 8.3.4 条件型约束
- 8.3.5 逻辑表达式
- 8.3.6 消除变量相乘
- 8.3.7 大M法
- 8.4 应用示例:电梯养护服务优化
- 8.4.1 业务问题描述
- 8.4.2 问题一:路线优化
- 8.4.3 问题二:排班计划
- 8.4.4 思考与小结
- 8.5 经营预测类问题
- 8.5.1 预测量的要素分解方法
- 8.5.2 例外场景的处理
- 8.5.3 宏观环境变化的处理方法
- 参考文献
- 第9章 行业知识沉淀方法
- 9.1 讨论范畴
- 9.1.1 知识类型
- 9.1.2 技术方法
- 9.1.3 业务领域
- 9.1.4 方法论的作用
- 9.1.5 现有的知识沉淀方法论
- 9.2 知识沉淀方法的维度模型
- 9.3 模型要素维度
- 9.3.1 共性要素
- 9.3.2 传感器异常报警
- 9.3.3 异常预警:“特征量-征兆量-研判规则”的范式
- 9.3.4 健康评估:“劣化度-健康度-综合评价”的范式
- 9.3.5 故障类型研判:“特征量-证据/现象-推理逻辑”的范式
- 9.3.6 故障处置效果监控:“症状-异常类型/严重等级-处置措施-状态”的范式
- 9.3.7 故障预测:4种思路
- 9.3.8 性能优化:无固定范式
- 9.4 设备对象维度
- 9.5 建模方法维度
- 9.5.1 专家规则驱动的方法:AI-FIT-PM过程模型
- 9.5.2 少量样本驱动的方法
- 9.5.3 数据驱动的方法
- 9.5.4 不同方法间的转化
- 9.6 软件维度
- 9.6.1 领域建模
- 9.6.2 模型研发环境
- 9.6.3 模型部署运行环境
- 9.7 应用示例1:磨煤机堵磨预警
- 9.8 应用示例2:磨煤机暗断煤检测
- 9.9 应用示例3:发电机线棒高温预警
- 9.9.1 案例背景
- 9.9.2 系统动力学模型
- 9.9.3 异常预警规则模型
- 9.9.4 故障排查逻辑
- 9.10 讨论与总结
- 参考文献
- 第10章 数据分析软件工程
- 10.1 数据分析项目失败的原因
- 10.2 传统的数据分析模式
- 10.3 生产环境下的机器学习模型
- 10.3.1 应用范式
- 10.3.2 模型格式
- 10.4 MLOps
- 10.4.1 MLOps的内容
- 10.4.2 MLOps与其他Ops的关系
- 10.4.3 MLOps的支撑软件
- 10.4.4 工业数据分析MLOps的特点
- 10.4.5 MLOps的适用范围
- 10.5 分析应用组件
- 10.5.1 分析服务引擎
- 10.5.2 Web应用引擎
- 10.6 分析报告工具
- 10.6.1 交互式报告工具
- 10.6.2 基于Markdown的报告工具
- 10.6.3 基于Office API的报告工具
- 10.7 计算任务管理
- 10.7.1 任务管理
- 10.7.2 计算并行化
- 10.8 总结
- 参考文献
展开全部
出版方
机械工业出版社
机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。