互联网
类型
可以朗读
语音朗读
119千字
字数
2023-01-01
发行日期
展开全部
主编推荐语
以人工智能下的大数据时代为背景,全面系统地介绍如何探索数据、整理数据并分析数据。
内容简介
数据作为一种新型生产要素,在未来的社会发展过程中将扮演越来越重要的角色,提升数据素养将有助于促进中国人工智能后备人才的高质量发展。
本书以人工智能下的大数据时代为背景,从数据素养、数据分析基础、统计分析、机器学习多个维度全面系统地介绍了如何探索数据、整理数据并分析数据。
本书没有给出晦涩难懂的数学公式,也不涉及复杂烦琐的程序代码,而是在阐述基本原理的基础上,辅以简洁的Python程序,让读者能够快速入门,提升个人的数据综合素养。
目录
- 版权信息
- 内容简介
- 丛书编委会
- 本书编委会
- 前言
- 第1章 人工智能下的大数据时代
- 1.1 大数据时代和人工智能
- 1.1.1 一切皆为数据
- 1.1.2 数据高速增长时代
- 1.1.3 利用人工智能掘金大数据
- 1.2 人工智能三要素
- 1.2.1 数据——AI之源
- 1.2.2 算法——AI之核
- 1.2.3 算力——AI之驱
- 1.3 数据素养
- 1.3.1 何为数据素养
- 1.3.2 数据素养为何重要
- 1.3.3 如何提升数据素养
- 1.4 本章小结
- 第2章 Python数据分析基础
- 2.1 Python基础
- 2.1.1 Python简介
- 2.1.2 Python数据类型
- 2.1.3 常用的操作、函数和方法
- 2.1.4 列表、元组、字典
- 2.1.5 顺序结构
- 2.1.6 分支结构
- 2.1.7 循环结构
- 2.2 Python数据分析环境
- 2.2.1 使用pip安装数据分析相关库
- 2.2.2 安装Anaconda
- 2.3 Python数据分析相关库
- 2.3.1 NumPy库
- 2.3.2 Matplotlib库
- 2.3.3 SciPy库
- 2.3.4 Pandas库
- 2.3.5 xlrd库
- 2.3.6 PyMySQL库
- 2.3.7 其他数据分析相关库
- 2.4 本章小结
- 第3章 Jupyter环境的使用
- 3.1 Jupyter Notebook概述
- 3.1.1 Jupyter Notebook简介及优点
- 3.1.2 Jupyter Notebook开发环境的搭建
- 3.1.3 使用pip命令安装
- 3.2 认识Jupyter Notebook
- 3.2.1 认识Files、Running、Clusters页面
- 3.2.2 认识Jupyter Notebook的主页面
- 3.3 新建、运行、保存Jupyter Notebook文件
- 3.3.1 新建一个Jupyter Notebook
- 3.3.2 运行代码
- 3.3.3 重命名Jupyter Notebook文件
- 3.3.4 保存Jupyter Notebook文件
- 3.4 处理不同类型的数据
- 3.4.1 处理txt文件
- 3.4.2 处理CSV文件
- 3.4.3 处理Excel文件
- 3.4.4 处理sql文件
- 3.5 在Markdown中使用LaTeX输入数学公式
- 3.5.1 使用LaTeX输入一个数学公式
- 3.5.2 LaTeX的两种公式格式
- 3.5.3 常用数学公式的写法
- 3.6 Jupyter Notebook应用实例解析
- 3.6.1 实例一:能力六维雷达图的绘制
- 3.6.2 实例二:词频统计
- 3.7 本章小结
- 第4章 探索数据
- 4.1 走进数据的世界
- 4.1.1 定义数据
- 4.1.2 数据的分类
- 4.1.3 深挖数据的四种能力
- 4.1.4 善用指标分析问题
- 4.2 数据的评估
- 4.2.1 指标真的可靠吗
- 4.2.2 统计数据会“说谎”
- 4.3 数据怎么用
- 4.3.1 数据清洗
- 4.3.2 数据的标准化
- 4.4 本章小结
- 第5章 描述统计
- 5.1 数据集中趋势
- 5.1.1 均值的定义与应用
- 5.1.2 中位数的定义与应用
- 5.1.3 众数的定义与应用
- 5.1.4 案例分析
- 5.2 数据离散程度
- 5.2.1 极差的定义与应用
- 5.2.2 方差的定义与应用
- 5.3 本章小结
- 第6章 推断统计
- 6.1 基础知识要点
- 6.1.1 排列与组合
- 6.1.2 随机事件及其概率
- 6.2 概率分布及其特征
- 6.2.1 二项分布
- 6.2.2 正态分布
- 6.3 统计量
- 6.3.1 总体与样本
- 6.3.2 参数估计
- 6.3.3 假设检验
- 6.4 本章小结
- 第7章 数据可视化
- 7.1 什么是数据可视化
- 7.1.1 数据可视化的定义和意义
- 7.1.2 数据可视化的发展历史
- 7.2 图形对象与元素
- 7.2.1 如何建立坐标系
- 7.2.2 如何设置坐标轴的文本和图例
- 7.3 可视化色彩的运用原理
- 7.3.1 RGB颜色模式
- 7.3.2 HSL颜色模式
- 7.3.3 颜色搭配的技巧和案例
- 7.4 图表的基本类型
- 7.4.1 如何绘制柱形图
- 7.4.2 如何绘制散点图
- 7.4.3 如何绘制饼形图
- 7.4.4 如何绘制折线图
- 7.5 数据分析及可视化案例
- 7.5.1 数据可视化经典案例
- 7.5.2 非结构化数据的可视化案例
- 7.6 常见的数据可视化流程
- 7.7 本章小结
- 第8章 NumPy数组
- 8.1 NumPy库简介
- 8.2 NumPy数组的生成
- 8.2.1 生成一般数组
- 8.2.2 生成特殊数组
- 8.2.3 生成随机数组
- 8.3 NumPy数组基础
- 8.3.1 NumPy数组的基本属性
- 8.3.2 数组索引:获取单个元素
- 8.3.3 数组切片:获取子数组
- 8.4 NumPy数组重塑
- 8.4.1 NumPy数组的变形
- 8.4.2 NumPy数组的转置和换轴
- 8.4.3 NumPy数组的拼接与分裂
- 8.5 NumPy库中的线性代数
- 8.5.1 矩阵乘法
- 8.5.2 行列式
- 8.5.3 求线性方程的解
- 8.6 通用函数
- 8.6.1 一元通用函数
- 8.6.2 二元通用函数
- 8.6.3 广播
- 8.7 常用的数据分析函数
- 8.7.1 条件函数
- 8.7.2 聚合函数
- 8.7.3 快速排序
- 8.7.4 唯一值与其他集合逻辑
- 8.8 本章小结
- 第9章 时间序列数据
- 9.1 时间序列的定义及分类
- 9.1.1 时间序列的定义
- 9.1.2 时间序列的分类
- 9.2 时间序列的描述性分析
- 9.2.1 图形描述
- 9.2.2 增长率分析
- 9.3 时间序列的预测
- 9.3.1 确定时间序列成分
- 9.3.2 选择预测方法
- 9.3.3 预测方法评估
- 9.4 平稳时间序列的预测
- 9.4.1 简单平均法
- 9.4.2 移动平均法
- 9.4.3 指数平滑法
- 9.5 趋势型和复合型时间序列的预测
- 9.5.1 线性趋势预测
- 9.5.2 非线性趋势预测
- 9.5.3 复合型时间序列的分解预测
- 9.6 使用Python处理时间序列数据
- 9.6.1 时间序列数据处理工具的选择
- 9.6.2 时间序列数据的导入
- 9.6.3 时间序列数据预处理
- 9.6.4 时间序列数据处理
- 9.7 本章小结
- 第10章 文本数据
- 10.1 文本数据的导入
- 10.1.1 文本数据与自然语言处理
- 10.1.2 分词
- 10.2 文本数据的处理
- 10.2.1 文本特征初探
- 10.2.2 文本信息的提取
- 10.2.3 文本向量化
- 10.3 文本分析的应用
- 10.3.1 文本分类
- 10.3.2 文本情感分析
- 10.4 本章小结
- 第11章 回归分析
- 11.1 叩响人工智能之门
- 11.1.1 人工智能与机器学习
- 11.1.2 工欲善其事,必先利其器
- 11.1.3 算法,该“出道”了
- 11.2 万朝归宗:线性回归
- 11.2.1 一元之道
- 11.2.2 从一元到多元
- 11.2.3 学习和工作中的线性回归
- 11.3 回归增强术
- 11.3.1 非线性回归
- 11.3.2 可分类的回归
- 11.3.3 能降维的回归
- 11.4 本章小结
- 第12章 聚类分析
- 12.1 数据之眼看聚类
- 12.1.1 什么是聚类
- 12.1.2 人工智能的未来:无监督学习
- 12.1.3 距离产生美
- 12.2 K均值聚类
- 12.2.1 K均值聚类的思想
- 12.2.2 抽丝剥茧K均值
- 12.2.3 鸢尾花的K均值聚类
- 12.3 案例:数据下的省(区、市)
- 12.3.1 提出问题
- 12.3.2 数据获取与处理
- 12.3.3 建模分析与结果
- 12.4 本章小结
- 第13章 数据素养综合案例
- 13.1 综合案例一:利用人工智能爬取大数据,轻松掌握股市动态
- 13.1.1 认识人工智能网络爬虫
- 13.1.2 爬取股市大数据,分析需求
- 13.1.3 爬取股市大数据案例
- 13.2 综合案例二:人工智能数据——体型分析
- 13.2.1 K最邻近分类算法原理
- 13.2.2 使用KNN分类算法对体型进行分类的案例
- 13.3 其他案例集
- 13.3.1 计算生肖
- 13.3.2 猜数游戏
- 13.3.3 二维列表排序
- 13.3.4 学生信息录入
- 13.3.5 打印回文素数(合数)
- 13.3.6 数据库加密
- 13.3.7 计算圆台的体积和表面积
- 13.4 本章小结
展开全部
出版方
电子工业出版社
电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。