互联网
类型
可以朗读
语音朗读
117千字
字数
2022-01-01
发行日期
展开全部
主编推荐语
数据分析是当今大数据时代最关键的技术,其广泛应用于包括医学在内的各个领域。
内容简介
Python语言简单易用,第三方库功能强大,提供了完整的数据分析框架,深受广大数据分析人员的青睐。本书涵盖传统的统计分析方法和较为复杂的机器学习算法,结合大量精选的实例,使用Python进行数据分析,对常用分析方法进行深入浅出的介绍,以帮助读者解决数据分析中的实际问题。
本书强调实战和应用,尽量淡化分析方法的推导和计算过程,大量的Python程序示例是本书的亮点。阅读本书,读者不仅能掌握使用Python及相关库快速解决实际问题的方法,还能更深入地理解数据分析。
本书不仅适合临床医学、公共卫生及其他医学相关专业的本科生和研究生使用,亦可作为其他专业的学生和科研人员学习数据分析的参考书。
目录
- 版权信息
- 内容提要
- 前言
- 资源与支持
- 第1章 Python语言基础
- 1.1 关于Python
- 1.2 为什么使用Python分析数据
- 1.3 重要的Python库
- 1.4 安装与设置
- 1.4.1 在Windows或MacOS系统上安装Anaconda
- 1.4.2 在Linux系统上安装Anaconda
- 1.4.3 安装和更新包
- 1.4.4 Python解释器
- 1.4.5 导入库
- 1.5 代码编写工具
- 1.6 开始使用Python
- 1.6.1 获取帮助
- 1.6.2 把Python当作一个计算器
- 1.6.3 Python对象
- 1.7 工作目录
- 1.8 习题
- 第2章 基本数据结构
- 2.1 列表
- 2.1.1 列表的创建
- 2.1.2 列表基本操作
- 2.1.3 列表方法与函数操作
- 2.2 元组
- 2.2.1 元组的创建
- 2.2.2 元组的操作
- 2.3 字典
- 2.3.1 字典的创建
- 2.3.2 字典的操作
- 2.4 集合
- 2.4.1 集合的创建
- 2.4.2 集合的操作
- 2.5 习题
- 第3章 控制流、函数与文件操作
- 3.1 条件语句
- 3.1.1 简单条件结构
- 3.1.2 嵌套条件结构
- 3.2 循环语句
- 3.2.1 for循环
- 3.2.2 while循环
- 3.3 函数
- 3.3.1 定义函数
- 3.3.2 默认参数
- 3.3.3 任意参数
- 3.3.4 匿名函数
- 3.4 文件操作
- 3.4.1 读取txt文件
- 3.4.2 写入txt文件
- 3.4.3 读写CSV文件
- 3.5 习题
- 第4章 NumPy基础
- 4.1 创建数组对象
- 4.1.1 使用函数array创建数组对象
- 4.1.2 使用专门函数创建数组对象
- 4.1.3 生成伪随机数
- 4.2 数组操作
- 4.2.1 数组重塑
- 4.2.2 数组转置和轴变换
- 4.2.3 数组的索引和切片
- 4.3 数组运算
- 4.3.1 通用函数
- 4.3.2 基本统计运算
- 4.3.3 矩阵运算
- 4.4 数组文件的保存与导入
- 4.5 习题
- 第5章 Pandas入门
- 5.1 Pandas数据结构
- 5.1.1 Series
- 5.1.2 DataFrame
- 5.2 Pandas对象基本操作
- 5.2.1 索引操作
- 5.2.2 DataFrame的查询与子集选择
- 5.3 DataFrame的导入和导出
- 5.3.1 读写文本文件
- 5.3.2 读写其他格式的文件
- 5.4 Pandas数据预处理
- 5.4.1 数据的合并
- 5.4.2 数据长宽格式的转换
- 5.4.3 缺失值的识别与处理
- 5.4.4 数据值的转换
- 5.5 习题
- 第6章 数据可视化
- 6.1 Matplotlib绘图基础
- 6.1.1 函数plot与图形元素
- 6.1.2 全局参数查看与设置
- 6.1.3 一页多图
- 6.1.4 保存图形
- 6.1.5 基本统计图形
- 6.2 Seaborn数据可视化
- 6.2.1 Seaborn简介
- 6.2.2 直方图和密度曲线图
- 6.2.3 条形图
- 6.2.4 箱线图和小提琴图
- 6.2.5 点图
- 6.2.6 带状点图与簇状点图
- 6.2.7 散点图
- 6.2.8 散点图矩阵
- 6.2.9 多面板图
- 6.2.10 回归图
- 6.2.11 分面网格图
- 6.2.12 Seaborn图形保存
- 6.3 其他Python数据可视化工具
- 6.4 习题
- 第7章 基本统计分析
- 7.1 查看数据集信息
- 7.2 数值型变量的统计描述
- 7.3 数值型变量的假设检验
- 7.3.1 单个样本的t检验
- 7.3.2 独立样本的t检验
- 7.3.3 非独立样本的t检验
- 7.3.4 单因素方差分析
- 7.3.5 组间差异的非参数检验
- 7.3.6 连续型变量之间的相关性
- 7.4 分类变量的列联表和独立性检验
- 7.4.1 生成频数表
- 7.4.2 独立性检验
- 7.5 习题
- 第8章 线性模型与广义线性模型
- 8.1 线性模型
- 8.1.1 简单线性回归模型
- 8.1.2 多重线性回归模型
- 8.2 Logistic回归
- 8.2.1 Logistic回归模型
- 8.2.2 Logistic回归实例
- 8.3 Poisson回归
- 8.3.1 Poisson回归模型
- 8.3.2 Poisson回归实例
- 8.4 生存分析与Cox回归
- 8.4.1 生存分析简介
- 8.4.2 生存率的Kaplan-Meier估计
- 8.4.3 Cox回归
- 8.5 习题
- 第9章 Scikit-learn机器学习入门
- 9.1 机器学习简介
- 9.2 加载数据集
- 9.3 学习和预测
- 9.3.1 无监督学习
- 9.3.2 监督学习
- 9.4 模型的选择与评估
- 9.5 习题
- 第10章 TensorFlow深度学习入门
- 10.1 深度学习简介
- 10.2 感知机与神经网络
- 10.3 激活函数
- 10.4 损失函数
- 10.5 优化器
- 10.6 构建并训练神经网络
- 10.7 习题
- 第11章 图像分类卷积神经网络模型
- 11.1 卷积神经网络
- 11.1.1 局部感受野
- 11.1.2 共享权重和偏置
- 11.1.3 池化
- 11.2 加载数据集
- 11.3 构建卷积神经网络模型
- 11.4 编译并训练模型
- 11.5 评估模型
- 11.6 习题
- 习题参考答案
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。