科技
类型
可以朗读
语音朗读
235千字
字数
2019-03-01
发行日期
展开全部
主编推荐语
全面掌握IBM SPSS Modeler工具
内容简介
本书将详尽的介绍IBM SPSS Modeler,主要涵盖基本软件操作,基本数据分析,高级数据挖掘,以及开发进阶使用等内容,力求帮助大家全面掌握Modeler工具。此外,本书也尽可能地把专业晦涩的数据科学知识及商业应用内容,以通俗易懂的方式传递给大家,同时结合实例,方便大家学习。
目录
- 版权信息
- 内容提要
- 前言
- 本书特色
- 致谢
- 联系方式和电子资源
- 资源与支持
- 配套资源
- 提交勘误
- 与我们联系
- 关于异步社区和异步图书
- 第1章 IBM SPSS Modeler基本介绍
- 1.1 SPSS简介
- 1.2 SPSS Modeler的特点
- 1.3 CRISP-DM方法论
- 1.4 SPSS Modeler 下载与安装
- 1.5 SPSS Modeler的主界面及基本操作
- 1.5.1 主界面介绍
- 1.5.2 鼠标基本操作
- 1.6 SPSS Modeler连接服务器端
- 1.7 从SPSS Modeler中获取帮助
- 1.8 实战技巧
- 第2章 数据读取——源节点
- 2.1 数据的身份(存储类型、测量级别和角色)
- 2.1.1 变量的存储类型
- 2.1.2 变量的测量级别
- 2.1.3 变量的角色
- 2.2 数据读取
- 2.2.1 读取Excel文件数据
- 2.2.2 读取变量文件数据
- 2.2.3 读取SPSS(.sav)文件数据
- 2.2.4 读取数据库数据
- 2.3 实战技巧
- 第3章 数据整理——关于数据的基本设定与集成
- 3.1 字段的“类型”功能
- 3.2 字段的“过滤器”功能
- 3.3 数据集成
- 3.3.1 数据的记录集成:追加节点
- 3.3.2 数据的字段集成:合并节点
- 3.4 实战技巧
- 第4章 数据整理——关于行的处理
- 4.1 数据“选择”功能
- 4.1.1 功能介绍
- 4.1.2 实战技巧
- 4.2 使用参数及全局变量实现数据选择功能
- 4.2.1 参数功能
- 4.2.2 使用参数实例介绍
- 4.2.3 使用全局变量功能介绍
- 4.2.4 使用全局变量实例介绍
- 4.3 数据排序
- 4.4 数据区分
- 4.5 数据汇总
- 4.5.1 功能介绍
- 4.5.2 实战技巧
- 第5章 数据整理——关于列的处理
- 5.1 导出
- 5.1.1 功能介绍
- 5.1.2 实例介绍
- 5.2 填充
- 5.3 重新分类
- 5.4 匿名化
- 5.5 分级化
- 5.6 设为标志
- 5.6.1 功能介绍
- 5.6.2 实例介绍
- 5.7 重建
- 5.7.1 功能介绍
- 5.7.2 实例介绍
- 5.8 转置
- 5.8.1 功能介绍
- 5.8.2 实例介绍
- 5.9 历史记录
- 5.9.1 功能介绍
- 5.9.2 实例介绍
- 5.10 字段重排
- 5.11 时间间隔
- 5.11.1 功能介绍
- 5.11.2 实例介绍
- 5.12 自动数据准备
- 第6章 图形可视化——图形节点
- 6.1 “散点图”节点
- 6.1.1 散点图
- 6.1.2 线图
- 6.1.3 多重散点图
- 6.1.4 时间散点图
- 6.2 “条形图”节点
- 6.2.1 简单条形图
- 6.2.2 堆积条形图
- 6.3 “直方图”节点
- 6.3.1 直方图
- 6.3.2 堆积直方图
- 6.4 “网络”节点
- 6.5 “图形板”节点
- 6.5.1 气泡图
- 6.5.2 散点图矩阵
- 6.5.3 箱图
- 6.5.4 聚类箱图
- 6.5.5 热图
- 6.6 实战技巧:图形的编辑模式
- 第7章 描述性统计分析
- 7.1 描述性统计分析概述
- 7.2 数据审核,一键输出描述性统计分析结果
- 7.3 缺失值的定义、检查和处理
- 7.3.1 缺失值的定义和检查
- 7.3.2 缺失值的自动化处理
- 7.4 实战技巧
- 第8章 常用的统计检验分析
- 8.1 两个连续型变量的关系分析——相关分析
- 8.1.1 相关分析
- 8.1.2 相关分析实践——“Statistics”节点
- 8.2 两个分类型变量的关系分析——卡方检验
- 8.2.1 列联表与卡方检验
- 8.2.2 卡方检验实践——“矩阵”节点
- 8.3 连续型变量与分类型变量间的关系分析——t检验及卡方分析
- 8.3.1 两组独立样本均值比较
- 8.3.2 两组配对样本均值比较
- 8.3.3 方差分析
- 8.3.4 均值比较实践——“平均值”节点
- 8.4 实战技巧:相关分析的注意事项
- 第9章 回归分析
- 9.1 一元线性回归分析
- 9.2 一元线性回归实践
- 9.3 多元线性回归分析
- 9.4 多元线性回归实践
- 9.5 逐步回归分析
- 9.6 逐步回归实践
- 9.7 实战技巧
- 第10章 Logistic回归分析
- 10.1 Logistic回归理论概要
- 10.2 Logistic回归中的检验
- 10.2.1 方程的显著性检验
- 10.2.2 系数显著性检验
- 10.2.3 拟合优度检验
- 10.3 Logistic回归实践案例
- 10.4 实战技巧
- 第11章 建模前的优化及准备工作
- 11.1 样本管理与分区
- 11.1.1 数据抽样
- 11.1.2 数据分区
- 11.1.3 数据平衡
- 11.2 特征选择
- 11.3 数据变换
- 11.4 实战技巧:分区与平衡的顺序
- 第12章 RFM分析
- 第13章 决策树
- 13.1 决策树概述
- 13.1.1 决策树的直观理解
- 13.1.2 决策树的生长
- 13.1.3 决策树的剪枝
- 13.2 C5.0算法
- 13.2.1 C5.0算法的决策树生长
- 13.2.2 C5.0算法的决策树剪枝
- 13.2.3 代价敏感学习
- 13.2.4 C5.0算法实践案例
- 13.3 CART算法
- 13.3.1 CART算法的决策树生长
- 13.3.2 CART算法的决策树剪枝
- 13.3.3 先验概率
- 13.3.4 CART算法实践案例
- 13.4 实战技巧
- 13.4.1 生成规则集
- 13.4.2 跟踪规则
- 第14章 神经网络
- 14.1 感知机
- 14.2 多层感知机与误差反向传播算法
- 14.2.1 隐藏层
- 14.2.2 反向传播算法
- 14.3 神经网络实践
- 14.4 实战技巧:生成“报告”
- 第15章 集成学习算法
- 15.1 Bagging
- 15.2 Boosting
- 15.3 随机森林
- 15.4 集成学习算法实践
- 15.4.1 Bagging和Boosting实践
- 15.4.2 随机森林实践
- 15.4.3 各个集成学习算法的结果比较
- 15.5 异质集成——“整体”节点
- 第16章 聚类分析
- 16.1 聚类方法概述
- 16.2 聚类方法的关键:距离
- 16.3 K-means算法
- 16.3.1 K-means算法原理
- 16.3.2 K-means的其他注意事项
- 16.4 K-means聚类实践
- 16.5 实践技巧:使用平行图进行比较分析
- 第17章 KNN分类器
- 17.1 KNN学习方法原理
- 17.2 KNN分类实践
- 17.2.1 分类预测
- 17.2.2 最近邻识别
- 第18章 关联分析
- 18.1 关联分析的基本概念
- 18.2 关联规则的有效性指标
- 18.2.1 关联规则的基础评价性指标
- 18.2.2 关联规则的实用性指标
- 18.2.3 其他的关联规则评估指标
- 18.3 Apriori算法
- 18.3.1 生成频繁项集
- 18.3.2 生成关联规则
- 18.4 Apriori关联分析实践
- 18.5 实战技巧:导出生成的关联规则
- 第19章 自动建模
- 19.1 自动分类
- 19.1.1 功能介绍
- 19.1.2 实例介绍
- 19.2 自动聚类
- 19.2.1 功能介绍
- 19.2.2 实例介绍
- 19.3 自动数值
- 19.3.1 功能介绍
- 19.3.2 实例介绍
- 第20章 蒙特卡罗模拟法
- 20.1 模拟生成
- 20.1.1 功能介绍
- 20.1.2 实例介绍
- 20.2 模拟拟合
- 20.2.1 功能介绍
- 20.2.2 实例介绍
- 20.3 模拟求值
- 20.3.1 功能介绍
- 20.3.2 实例介绍
- 第21章 SPSS Modeler的集成与扩展
- 21.1 SPSS Modeler与R、Python集成
- 21.1.1 概述
- 21.1.2 SPSS Modeler与R的集成环境准备
- 21.1.3 与R的集成功能介绍
- 21.1.4 实例介绍
- 21.2 定制对话框实现与R、Python的集成
- 21.2.1 定制对话框简介
- 21.2.2 安装配置自定义节点
- 21.3 SPSS Modeler扩展功能
- 21.3.1 功能介绍
- 21.3.2 获取天气数据的应用分析案例
- 第22章 SPSS Modeler模型部署
- 22.1 产品架构
- 22.2 通过批处理任务定时运行模型
- 22.2.1 功能介绍
- 22.2.2 实例介绍
- 22.3 SPSS Modeler服务器安装及管理(For Linux)
- 22.3.1 正常维护SPSS Modeler服务器
- 22.3.2 SPSS Modeler 服务器如何在Linux上安装及配置
- 22.3.3 配置ODBC连接数据库
- 22.4 SPSS Modeler官方支持的数据库和Hadoop平台
- 第23章 性能优化
- 23.1 功能介绍
- 23.2 客户端SQL性能优化
- 23.3 数据库内建模
- 23.3.1 功能介绍
- 23.3.2 实例介绍
- 23.4 使用外部程序批量加载
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。