展开全部

主编推荐语

本书以R语言简介、数据挖掘基础为开篇,旨在让读者对所用工具及数据挖掘方法有所了解。

内容简介

本书深入地介绍了利用R语言进行数据分析及构建预测模型的多种实用方法,包括回归、聚类、关联和分类分析等常用学习算法的实现,每一种算法都通过具体案例详细说明构建模型、实现模型以及评价模型的过程。

本书系统讲解了相关的R语言的基础知识,包括环境准备以及数据转换、分析和结果可视化的方法等。

本书既可以作为相关专业数据分析的教材,也可以作为大数据网络培训或技术人员自学的参考资料。

目录

  • 版权信息
  • 内容简介
  • 前言
  • 第1章 R语言简介
  • 1.1 获取R
  • 1.2 R使用入门
  • 1.2.1 R操作界面
  • 1.2.2 RStudio窗口介绍
  • 1.2.3 R的常用操作
  • 1.3 R的简单操作
  • 1.3.1 基本数学运算
  • 1.3.2 变量
  • 1.3.3 数据结构
  • 1.4 R数据分析包
  • 1.5 小结
  • 参考文献
  • 第2章 数据挖掘基础
  • 2.1 数据挖掘的定义
  • 2.2 数据探索及预处理
  • 2.2.1 脏数据分析
  • 2.2.2 数据特征分析
  • 2.2.3 数据预处理
  • 2.3 模型简介
  • 2.3.1 聚类模型
  • 2.3.2 回归模型
  • 2.3.3 决策树
  • 2.3.4 人工神经网络
  • 2.3.5 关联规则分析模型
  • 2.4 小结
  • 参考文献
  • 第3章 数据挖掘网站用户行为分析及网页智能推荐
  • 3.1 背景与挖掘目标
  • 3.2 用户分群
  • 3.2.1 用户分群的分析方法
  • 3.2.2 数据的抽取
  • 3.2.3 数据的预处理与探索分析
  • 3.2.4 用户分群结果
  • 3.2.5 用户分群的应用
  • 3.3 网页智能推荐
  • 3.3.1 网页智能推荐的分析方法
  • 3.3.2 数据的预处理
  • 3.3.3 组合推荐模型
  • 3.3.4 组合推荐结果
  • 3.4 总结
  • 3.4.1 相关结论及应用
  • 3.4.2 相关的问题思考
  • 参考文献
  • 第4章 生活服务点评网站客户分群
  • 4.1 背景与挖掘目标
  • 4.2 分析方法与过程
  • 4.2.1 数据抽取
  • 4.2.2 数据探索
  • 4.2.3 数据预处理
  • 4.2.4 模型构建
  • 4.3 小结
  • 第5章 水冷中央空调系统的优化控制策略
  • 5.1 背景及挖掘目标
  • 5.2 分析的方法及流程
  • 5.3 数据预处理
  • 5.3.1 变量选取
  • 5.3.2 数据探索
  • 5.3.3 数据变换
  • 5.4 优化控制模型
  • 5.4.1 总耗电量与可控变量
  • 5.4.2 冷却负载与可控变量
  • 5.5 模型求解
  • 5.5.1 工作日模型求解
  • 5.5.2 确定状态值
  • 5.6 总结
  • 参考文献
  • 第6章 电商评价文本的主题特征词分析
  • 6.1 背景与挖掘目标
  • 6.2 分析的方法及过程
  • 6.2.1 评论数据采集
  • 6.2.2 文本数据预处理
  • 6.2.3 基于LDA主题模型的特征词分析
  • 6.3 小结
  • 参考文献
  • 第7章 均线投资策略
  • 7.1 背景及投资策略介绍
  • 7.1.1 移动平均线相关理论介绍
  • 7.1.2 名词及概念介绍
  • 7.2 基于移动平均线的投资策略
  • 7.2.1 单均线投资策略
  • 7.2.2 双均线投资策略
  • 7.3 双均线投资策略实际应用
  • 7.3.1 双均线投资策略总体流程
  • 7.3.2 数据获取
  • 7.3.3 简单的K线图实现
  • 7.3.4 均线模型
  • 7.3.5 其他双均线策略的收益
  • 7.4 主要结论及展望
  • 7.4.1 结论
  • 7.4.2 后续策略的展望
  • 参考文献
  • 致谢
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

电子工业出版社

电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。