科技
类型
可以朗读
语音朗读
106千字
字数
2023-01-01
发行日期
展开全部
主编推荐语
本书主要介绍与数据分析有关的语法基础。
内容简介
本书主要使用Scipy库来实现假设检验,使用statsmodels库来拟合统计模型,并且尽量使用简洁的代码来完成数据分析,譬如在第7部分中介绍了利用Pandas库在同步完成数据清洗和统计图绘制,减少代码书写量,提高数据分析效率。
本书的编写突出实用性,注重数据前期处理与医学统计分析相结合;按照资料类型介绍统计学方法,有利于读者在实际数据分析中快速查找对应的统计学方法;在介绍每种统等
目录
- 版权信息
- 前言
- 1 Python简介与安装
- 1.1 Python的优点
- 1.2 Python的安装与配置
- 1.2.1 Windows系统下的安装与配置
- 1.2.2 Mac系统下的安装与配置
- 1.2.3 Linux系统下的安装与配置
- 1.3 Anaconda的使用方法
- 1.3.1 打开命令行终端
- 1.3.2 更新软件下载渠道
- 1.3.3 创建conda虚拟环境
- 1.3.4 安装软件库
- 1.3.5 conda常用命令合集
- 1.4 Jupyter Notebook
- 1.4.1 打开Jupyter Notebook
- 1.4.2 Jupyter Notebook界面
- 2 Python语言基础与重要的库
- 2.1 Python快速入门
- 2.1.1 第一个Python程序
- 2.1.2 Python的缩进
- 2.1.3 查询帮助文件
- 2.1.4 Tab键自动补全代码
- 2.2 Python语法基础
- 2.2.1 变量和数据类型
- 2.2.2 运算符
- 2.2.3 列表、元组和字典
- 2.2.4 函数
- 2.3 重要的Python库
- 3 数据集创建
- 3.1 NumPy多维数组对象
- 3.1.1 NumPy数组属性
- 3.1.2 NumPy数组创建
- 3.1.3 NumPy切片和索引
- 3.2 Pandas数据结构
- 3.2.1 Series(一维数据)
- 3.2.2 DataFrame(二维数据)
- 3.2.3 NumPy与Pandas转换
- 3.3 数据取值与选择
- 3.3.1 Series(一维数据)
- 3.3.2 DataFrame(二维数据)
- 3.4 数据读取与存储
- 3.4.1 Pandas读取Excel数据
- 3.4.2 Pandas读取CSV文件
- 3.4.3 Pandas读取Txt数据
- 3.4.4 Pandas读取SAS、Stata和SPSS数据
- 3.4.5 存储数据
- 4 基本数据管理
- 4.1 数据基本信息与结构查看
- 4.2 创建新变量
- 4.3 变量重命名
- 4.4 数据类型转换
- 4.4.1 基本数据类型转换
- 4.4.2 时间日期数据类型转换
- 4.5 数据排序
- 4.5.1 按索引标签排序
- 4.5.2 按列值排序
- 4.6 缺失值处理
- 4.6.1 缺失值判断
- 4.6.2 缺失值删除
- 4.7 缺失数据填补
- 4.8 重复数据处理
- 4.9 数据集的合并
- 4.9.1 merge()方法
- 4.9.2 concat()方法
- 4.9.3 join()方法
- 4.10 数据集取子集
- 4.10.1 直接选择
- 4.10.2 loc()函数选取子集
- 4.10.3 iloc()函数选取子集
- 4.11 数据分组
- 4.11.1 groupby()函数
- 4.11.2 cut()和qcut()函数
- 4.12 melt()函数
- 4.13 数据集更新
- 4.13.1 replace()函数
- 4.13.2 update()函数
- 4.14 数据集比较
- 5 高级数据管理
- 5.1 控制流
- 5.1.1 条件(分支)语句
- 5.1.2 循环结构
- 5.2 函数
- 5.2.1 pandas函数
- 5.2.2 lambda函数
- 5.3 向量化字符串操作
- 5.4 正则表达式
- 6 网络数据采集
- 6.1 初识爬虫
- 6.2 http协议与url
- 6.2.1 http请求
- 6.2.2 http响应
- 6.3 网页结构
- 6.3.1 HTML标签
- 6.3.2 HTML属性
- 6.4 Requests库
- 6.4.1 获取网页
- 6.4.2 POST请求
- 6.5 BeautifulSoup库
- 6.5.1 BeautifulSoup对象
- 6.5.2 BeautifulSoup标签
- 6.5.3 遍历节点
- 6.5.4 方法选择器
- 7 资料类型及展示
- 7.1 资料类型
- 7.2 统计描述
- 7.2.1 定量资料
- 7.2.2 定性资料
- 7.3 数据透视表
- 7.4 表格重塑
- 7.5 绘制图形
- 7.5.1 绘制图形的基本步骤
- 7.5.2 常见统计图
- 7.5.3 子图绘制
- 7.5.4 金字塔图
- 7.5.5 其他图形绘制
- 8 定量资料统计方法
- 8.1 单样本资料与已知总体参数比较
- 8.1.1 单样本资料的t检验
- 8.1.2 Wilcoxon符号秩和检验
- 8.2 两组资料之间的比较
- 8.2.1 配对t检验
- 8.2.2 配对设计资料的非参数检验
- 8.2.3 两组独立样本的t检验
- 8.2.4 两组资料的非参数检验
- 8.3 两组以上资料比较
- 8.3.1 方差分析
- 8.3.2 Kruskal-Wallis H检验
- 8.4 相关分析
- 8.4.1 直线相关分析
- 8.4.2 秩相关
- 8.5 线性回归分析
- 8.5.1 基本原理
- 8.5.2 应用条件
- 8.5.3 线性回归分析的Python实现
- 9 分类资料数据分析
- 9.1 卡方检验
- 9.1.1 四格表资料的卡方检验
- 9.1.2 R×C列联表资料的卡方检验
- 9.1.3 卡方检验的选用
- 9.1.4 卡方检验的Python实现
- 9.2 Fisher确切概率法
- 9.2.1 Fisher确切概率法使用条件
- 9.2.2 Fisher确切概率法的Python实现
- 9.3 配对卡方检验
- 9.3.1 配对卡方检验使用条件
- 9.3.2 配对卡方检验的Python实现
- 9.4 多个相关样本的非参数检验(Cochran Q检验)
- 9.4.1 Cochran Q检验的Python实现
- 9.5 趋势卡方检验
- 9.5.1 趋势卡方检验的Python实现
- 10 多重线性回归
- 10.1 多重线性回归分析
- 10.1.1 多重线性回归模型简介
- 10.1.2 多重线性回归使用条件
- 10.1.3 资料格式
- 10.1.4 多重线性回归分析的Python实现
- 10.2 自变量筛选
- 10.2.1 逐步回归分析的Python实现
- 10.3 多重共线性和回归诊断
- 10.3.1 共线性诊断
- 10.3.2 模型诊断
- 11 logistic回归
- 11.1 二分类logistic回归
- 11.1.1 二分类logistic回归的使用条件
- 11.1.2 资料格式
- 11.1.3 logistic回归的Python实现
- 11.1.4 广义线性模型
- 11.2 有序logistic回归
- 11.2.1 资料格式
- 11.2.2 有序多分类logistic回归的Python实现
- 11.3 无序多分类logistic回归
- 11.3.1 资料格式
- 11.3.2 多分类无序logistic回归的Python实现
- 11.4 条件logistic回归
- 11.4.1 资料格式
- 11.4.2 条件logistic回归的Python实现
- 12 Poisson回归
- 12.1 Poisson回归的应用条件
- 12.2 资料格式
- 12.3 利用广义线性模型实现Poisson回归
- 13 生存分析
- 13.1 基本概念
- 13.1.1 生存时间
- 13.1.2 生存时间资料的类型
- 13.1.3 生存概率、生存率与风险函数
- 13.2 生存分析研究的主要内容
- 13.3 生存率的估计与组间比较
- 13.4 中位生存时间与生存曲线
- 13.5 Cox比例风险模型
- 13.5.1 Cox模型简介
- 13.5.2 Cox模型分析的资料格式
- 13.5.3 Cox模型分析的Python实现
- 13.5.4 Cox模型分析注意事项
- 14 时间序列分析
- 14.1 时间序列的预处理
- 14.1.1 平稳性检验
- 14.1.2 纯随机性检验
- 14.2 平稳时间序列建模
- 14.3 非平稳时间序列预处理
- 14.4 ARIMA模型
- 14.4.1 资料格式
- 14.4.2 ARIMA模型的Python实现
- 14.5 季节性ARIMA模型
展开全部
出版方
人民卫生出版社
人民卫生出版社是中华人民共和国国家卫生健康委员会直属的中央级医药卫生专业出版社,成立于1953年6月1日,是中国规模大、实力强、出版品种多的医学出版机构。1993年被中宣部、新闻出版署评为中国首批优秀出版社。