展开全部

主编推荐语

R语言数据分析实用指南,适用于专业学生及从业人员。

内容简介

本书介绍了R语言在数据分析中的应用,讲解了数据分析的基本内容,数据分析的实现过程。介绍了数据分析过程中如何进行数据处理,数据探索。数据分析过程中常用的机器学习模型,介绍了文本挖掘,社交网络分析等等内容。本书介绍了数据分析的相关内容,其中避免了复杂的理论讨论,更加偏重于数据分析的实现与应用,有非常高的实用价值。本书适用于,统计学,计算机,机器学习,数学等相关专业的本科,研究生使用,同样也能够帮助互联网,市场营销等从业人员解决实际问题。

目录

  • 版权信息
  • 作者简介
  • 内容简介
  • 前言
  • 第1章 数据分析项目的流程
  • 1.1 数据分析项目中的角色
  • 1.2 数据分析项目的阶段
  • 1.3 总结
  • 第2章 数据的读取
  • 2.1 RData数据
  • 2.2 readr高效读取数据
  • 2.3 读取Excel数据
  • 2.4 读取SPSS、SAS、STATA数据
  • 2.5 R语言操作数据库
  • 2.6 总结
  • 第3章 数据探索
  • 3.1 缺失值的识别与处理
  • 3.2 异常值
  • 3.3 dlookr数据处理包
  • 3.4 数据相关性
  • 3.5 自动化创建数据探索报告
  • 3.6 总结
  • 第4章 生存分析
  • 4.1 生存分析的基本内容
  • 4.2 使用R语言进行生存分析
  • 4.3 非参数模型
  • 4.4 半参数模型生存分析方法
  • 4.5 参数模型
  • 4.6 随机生存森林模型
  • 4.7 总结
  • 第5章 主成分分析
  • 5.1 概述
  • 5.2 主成分分析详解
  • 5.3 使用R语言进行主成分分析
  • 5.4 总结
  • 第6章 多维缩放
  • 6.1 MDS的工作原理
  • 6.2 在R语言中实现MDS
  • 6.3 MDS的优点
  • 6.4 总结
  • 第7章 线性回归模型
  • 7.1 线性回归模型概述
  • 7.2 在R语言中实现回归模型
  • 7.3 总结
  • 第8章 逻辑回归模型
  • 8.1 逻辑回归的原理
  • 8.2 在R语言中实现逻辑回归模型
  • 8.3 总结
  • 第9章 聚类模型
  • 9.1 概述
  • 9.2 在R语言中实现聚类模型
  • 9.3 总结
  • 第10章 关联规则
  • 10.1 关联规则概述
  • 10.2 关联规则的基本概念
  • 10.3 在R语言中实现关联规划
  • 10.4 总结
  • 第11章 随机森林
  • 11.1 随机森林的基本概念
  • 11.2 在R语言中实现随机森林
  • 11.3 总结
  • 第12章 支持向量机
  • 12.1 概述
  • 12.2 在R语言中实现支持向量机
  • 12.3 总结
  • 第13章 神经网络
  • 13.1 概述
  • 13.2 在R语言中实现神经网络
  • 13.3 总结
  • 第14章 文本挖掘
  • 14.1 概述
  • 14.2 text2vec背景及其基本原理
  • 14.3 DTM与TFIDF的原理和实现
  • 14.4 情感分析
  • 14.5 LDA主题模型及其实现
  • 14.6 构建自动问答系统
  • 14.7 总结
  • 第15章 社交网络分析
  • 15.1 社交网络概述
  • 15.2 igraph简介
  • 15.3 社交网络的常见结构
  • 15.4 社交网络分析算法
  • 15.5 微博社交群体分析
  • 15.6 总结
  • 第16章 H2O机器学习
  • 16.1 H2O机器学习平台
  • 16.2 在R语言中使用H2O
  • 16.3 H2O Flow
  • 16.4 总结
  • 第17章 R语言爬虫
  • 17.1 快速爬取网页数据
  • 17.2 rvest简介
  • 17.3 爬取BOSS直聘数据
  • 17.4 模拟登录
  • 17.5 总结
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

清华大学出版社

清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。