展开全部

主编推荐语

以工业大数据的特点和需求为牵引,阐述了工业大数据分析的算法与实现机制。

内容简介

全书分10章,可划分为四个部分。

第一部分(第1章)是数据分析概览,目的是建立起数据分析算法的概念框架,并给出学习路线。

第二部分(第2~5章),侧重在通用数据分析算法,包括数据预处理、机器学习、时序挖掘算法和优化等其他算法。

第三部分(第6~8章),讨论了工业分析的算法思路,覆盖了生产质量分析(PQM)、生产效率优化(PEM)等典型分析课题的算法组合套路。

第四部分侧重在分析工程方法,第9章讨论了工业专家知识沉淀方法,第10章讨论了数据分析的软件工程。

本书适合工业大数据分析从业者、工业企业研发技术人员、工业互联网企业数据分析师阅读,也可作为上述人员的培训教材和相关专业师生的参考书。

目录

  • 版权信息
  • 大数据与“智能+”产教融合丛书编辑委员会
  • 丛书序一
  • 丛书序二
  • 前言
  • 第1章 工业大数据分析概览
  • 1.1 工业大数据分析的范畴与特点
  • 1.1.1 数据分析的范畴
  • 1.1.2 典型分析主题
  • 1.1.3 工业数据分析的特点
  • 1.1.4 数据分析的典型手段
  • 1.2 数据挖掘的过程方法
  • 1.2.1 CRISP-DM简介
  • 1.2.2 分析课题的执行路径
  • 1.3 数据分析工具软件
  • 1.3.1 脚本语言软件
  • 1.3.2 图形化桌面软件
  • 1.3.3 云端分析软件
  • 1.4 工业大数据分析师的算法修养
  • 1.4.1 分析算法理解的维度与路径
  • 1.4.2 必读图书
  • 1.4.3 分析算法背后的朴素思想
  • 1.4.4 工程化思维
  • 参考文献
  • 第2章 数据预处理
  • 2.1 数据操作基础
  • 2.1.1 数据框的基本操作
  • 2.1.2 数据可视化
  • 2.2 数据分析的数据操作技巧
  • 2.2.1 cumsum等primitive函数的利用:避免循环
  • 2.2.2 带时间戳的数据框合并
  • 2.2.3 时序数据可视化:多个子图共用一个x轴
  • 2.2.4 时序数据可视化:NA用来间隔显示时序
  • 2.2.5 参数区间的对比显示(在概率密度图上)
  • 2.2.6 获取R文件的所在路径
  • 2.2.7 分段线性回归如何通过lm()实现
  • 2.3 探索型数据分析(EDA)
  • 2.3.1 引言
  • 2.3.2 R语言EDA包
  • 2.3.3 其他工具包
  • 2.3.4 小结
  • 2.4 数据质量问题
  • 2.4.1 数据的业务化
  • 2.4.2 业务的数据化
  • 2.4.3 机理演绎法
  • 2.4.4 细致求实的基本素养
  • 2.4.5 小结
  • 2.5 特征提取
  • 2.5.1 基于数据类型的特征提取
  • 2.5.2 基于关联关系的特征自动生成
  • 2.5.3 基于语法树的变量间组合特征生成
  • 2.6 特征选择
  • 2.6.1 特征选择的框架
  • 2.6.2 搜索策略
  • 2.6.3 子集评价
  • 2.6.4 小结
  • 参考文献
  • 第3章 机器学习算法
  • 3.1 统计分析
  • 3.1.1 概率分布
  • 3.1.2 参数估计
  • 3.1.3 假设检验
  • 3.2 统计分布拟合
  • 3.2.1 引言
  • 3.2.2 基于核函数的非参数方法
  • 3.2.3 单概率分布的参数化拟合
  • 3.2.4 混合概率分布估计
  • 3.2.5 小结
  • 3.3 线性回归模型
  • 3.3.1 引言
  • 3.3.2 基础线性回归模型——OLS模型
  • 3.3.3 OLS模型检验
  • 3.3.4 鲁棒线性回归
  • 3.3.5 结构复杂度惩罚(正则化)
  • 3.3.6 扩展
  • 3.4 多元自适应回归样条(MARS)
  • 3.4.1 引言
  • 3.4.2 前向计算过程
  • 3.4.3 后剪枝过程
  • 3.4.4 变量重要性评价
  • 3.4.5 MARS与其他算法的关系
  • 3.5 神经网络
  • 3.5.1 ANN逼近能力的直观理解
  • 3.5.2 极限学习机
  • 3.6 决策树
  • 3.6.1 决策树的概念
  • 3.6.2 决策树构建过程
  • 3.6.3 常用决策树算法
  • 3.7 支持向量机(SVM)
  • 3.7.1 引言
  • 3.7.2 epsilon-SVR算法
  • 3.7.3 nu-SVR算法
  • 3.7.4 不同SVM算法包的差异
  • 3.7.5 扩展
  • 3.8 隐马尔可夫模型
  • 3.8.1 引言
  • 3.8.2 工作原理
  • 3.8.3 示例
  • 3.8.4 讨论
  • 3.9 概率图模型与贝叶斯方法
  • 3.9.1 引言
  • 3.9.2 朴素贝叶斯
  • 3.9.3 贝叶斯网络
  • 3.9.4 一般图模型
  • 3.9.5 讨论与扩展阅读
  • 3.10 集成学习
  • 3.10.1 引言
  • 3.10.2 Bagging方法
  • 3.10.3 Boosting方法
  • 3.10.4 Stacking方法
  • 3.11 模型评价
  • 3.11.1 引言
  • 3.11.2 评价指标
  • 3.11.3 评价方法
  • 3.11.4 特征重要度
  • 3.12 聚类
  • 3.12.1 引言
  • 3.12.2 基于距离的聚类:K-means、PAM
  • 3.12.3 基于层次的聚类:Hclust
  • 3.12.4 基于密度的聚类:DBSCAN
  • 3.12.5 基于分布的聚类:GMM
  • 3.12.6 聚类结果的评价
  • 3.13 关联规则
  • 3.13.1 引言
  • 3.13.2 关联规则概念与度量指标
  • 3.13.3 关联规则实现过程
  • 3.13.4 关联规则算法
  • 3.13.5 关联规则可视化
  • 3.13.6 关联规则评价
  • 3.14 深度学习
  • 3.14.1 引言
  • 3.14.2 深度学习算法分类
  • 3.14.3 深度学习框架
  • 3.14.4 常见疑惑
  • 3.14.5 深度学习算法的加速
  • 3.15 机器学习算法的其他视角
  • 3.15.1 计算负载模式
  • 3.15.2 并行化计算
  • 3.15.3 新计算范式
  • 参考文献
  • 第4章 时序数据挖掘算法
  • 4.1 时序算法简介
  • 4.2 信号处理算法
  • 4.2.1 傅里叶变换的直观理解
  • 4.2.2 时频分析
  • 4.2.3 时序变换
  • 4.2.4 压缩感知
  • 4.3 时序分解
  • 4.3.1 STL
  • 4.3.2 奇异谱分析
  • 4.3.3 EMD及扩展方法
  • 4.4 时序分割
  • 4.4.1 Changepoint
  • 4.4.2 TreeSplit
  • 4.4.3 Autoplait
  • 4.4.4 应用示例
  • 4.5 时序再表征
  • 4.6 序列模式挖掘
  • 4.6.1 数值型频繁模式
  • 4.6.2 符号型频繁模式
  • 4.7 时序异常检测
  • 4.7.1 基于度量的方法
  • 4.7.2 基于模型重构的方法
  • 4.7.3 基于频繁模式挖掘的方法
  • 4.8 时序聚类
  • 4.8.1 DTW距离
  • 4.8.2 SAX距离
  • 4.9 时序分类
  • 4.9.1 经典分析算法
  • 4.9.2 深度学习的方法
  • 4.10 时序预测
  • 4.10.1 基于时序分解的预测算法
  • 4.10.2 基于回归建模的预测算法
  • 参考文献
  • 第5章 其他算法
  • 5.1 最优化算法
  • 5.1.1 模型分类
  • 5.1.2 经典组合优化模型
  • 5.1.3 典型工具
  • 5.2 规则推理算法
  • 5.3 系统辨识算法
  • 5.3.1 算法分类
  • 5.3.2 典型工具
  • 5.4 特定数据类型的算法
  • 5.4.1 文本数据
  • 5.4.2 图像数据
  • 5.4.3 时空数据
  • 参考文献
  • 第6章 工业分析中的典型处理方法
  • 6.1 工业分析中的数据预处理
  • 6.1.1 工况划分
  • 6.1.2 数据缺失
  • 6.1.3 时间数据不连续
  • 6.1.4 强噪声
  • 6.1.5 大惯性系统
  • 6.1.6 趋势项的消除
  • 6.2 通用时序特征
  • 6.3 典型征兆特征
  • 6.3.1 毛刺检测特征
  • 6.3.2 单调趋势模式
  • 6.3.3 平稳过程的漂移检测
  • 6.3.4 多点位不一致
  • 6.3.5 超界
  • 6.3.6 变点检测
  • 6.3.7 一维曲线平滑与分区
  • 6.3.8 二维形状分析
  • 6.3.9 持续某种状态
  • 6.4 工业时序分析问题
  • 6.4.1 工业时序数据的特点
  • 6.4.2 短时序分类问题
  • 6.4.3 长时序分类问题
  • 6.4.4 不同类型问题的转换
  • 参考文献
  • 第7章 生产质量数据分析算法
  • 7.1 概述
  • 7.2 基础算法
  • 7.2.1 物料跟踪模型
  • 7.2.2 过程稳定性监控
  • 7.3 时空模式分析
  • 7.4 连续流程生产
  • 7.4.1 应用示例
  • 7.4.2 工况划分
  • 7.4.3 操作参数优化
  • 7.4.4 其他分析
  • 7.5 批次流程生产
  • 7.5.1 应用示例
  • 7.5.2 理想工艺过程拟合
  • 7.5.3 动态控制优化
  • 7.6 离散生产
  • 7.6.1 应用示例
  • 7.6.2 最佳工艺路径挖掘
  • 7.6.3 异常排查
  • 7.6.4 操作参数优化
  • 7.7 总结
  • 参考文献
  • 第8章 生产效率优化
  • 8.1 决策优化问题的建模思路
  • 8.2 线性规划的建模技巧
  • 8.2.1 绝对值
  • 8.2.2 Min-Max问题
  • 8.2.3 分式目标函数
  • 8.2.4 范围约束
  • 8.3 整数规划的建模技巧
  • 8.3.1 决策变量值域不连续
  • 8.3.2 目标函数不连续
  • 8.3.3 或关系约束
  • 8.3.4 条件型约束
  • 8.3.5 逻辑表达式
  • 8.3.6 消除变量相乘
  • 8.3.7 大M法
  • 8.4 应用示例:电梯养护服务优化
  • 8.4.1 业务问题描述
  • 8.4.2 问题一:路线优化
  • 8.4.3 问题二:排班计划
  • 8.4.4 思考与小结
  • 8.5 经营预测类问题
  • 8.5.1 预测量的要素分解方法
  • 8.5.2 例外场景的处理
  • 8.5.3 宏观环境变化的处理方法
  • 参考文献
  • 第9章 行业知识沉淀方法
  • 9.1 讨论范畴
  • 9.1.1 知识类型
  • 9.1.2 技术方法
  • 9.1.3 业务领域
  • 9.1.4 方法论的作用
  • 9.1.5 现有的知识沉淀方法论
  • 9.2 知识沉淀方法的维度模型
  • 9.3 模型要素维度
  • 9.3.1 共性要素
  • 9.3.2 传感器异常报警
  • 9.3.3 异常预警:“特征量-征兆量-研判规则”的范式
  • 9.3.4 健康评估:“劣化度-健康度-综合评价”的范式
  • 9.3.5 故障类型研判:“特征量-证据/现象-推理逻辑”的范式
  • 9.3.6 故障处置效果监控:“症状-异常类型/严重等级-处置措施-状态”的范式
  • 9.3.7 故障预测:4种思路
  • 9.3.8 性能优化:无固定范式
  • 9.4 设备对象维度
  • 9.5 建模方法维度
  • 9.5.1 专家规则驱动的方法:AI-FIT-PM过程模型
  • 9.5.2 少量样本驱动的方法
  • 9.5.3 数据驱动的方法
  • 9.5.4 不同方法间的转化
  • 9.6 软件维度
  • 9.6.1 领域建模
  • 9.6.2 模型研发环境
  • 9.6.3 模型部署运行环境
  • 9.7 应用示例1:磨煤机堵磨预警
  • 9.8 应用示例2:磨煤机暗断煤检测
  • 9.9 应用示例3:发电机线棒高温预警
  • 9.9.1 案例背景
  • 9.9.2 系统动力学模型
  • 9.9.3 异常预警规则模型
  • 9.9.4 故障排查逻辑
  • 9.10 讨论与总结
  • 参考文献
  • 第10章 数据分析软件工程
  • 10.1 数据分析项目失败的原因
  • 10.2 传统的数据分析模式
  • 10.3 生产环境下的机器学习模型
  • 10.3.1 应用范式
  • 10.3.2 模型格式
  • 10.4 MLOps
  • 10.4.1 MLOps的内容
  • 10.4.2 MLOps与其他Ops的关系
  • 10.4.3 MLOps的支撑软件
  • 10.4.4 工业数据分析MLOps的特点
  • 10.4.5 MLOps的适用范围
  • 10.5 分析应用组件
  • 10.5.1 分析服务引擎
  • 10.5.2 Web应用引擎
  • 10.6 分析报告工具
  • 10.6.1 交互式报告工具
  • 10.6.2 基于Markdown的报告工具
  • 10.6.3 基于Office API的报告工具
  • 10.7 计算任务管理
  • 10.7.1 任务管理
  • 10.7.2 计算并行化
  • 10.8 总结
  • 参考文献
展开全部

评分及书评

评分不足
1个评分

出版方

机械工业出版社

机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。