展开全部

主编推荐语

以人工智能下的大数据时代为背景,全面系统地介绍如何探索数据、整理数据并分析数据。

内容简介

数据作为一种新型生产要素,在未来的社会发展过程中将扮演越来越重要的角色,提升数据素养将有助于促进中国人工智能后备人才的高质量发展。

本书以人工智能下的大数据时代为背景,从数据素养、数据分析基础、统计分析、机器学习多个维度全面系统地介绍了如何探索数据、整理数据并分析数据。

本书没有给出晦涩难懂的数学公式,也不涉及复杂烦琐的程序代码,而是在阐述基本原理的基础上,辅以简洁的Python程序,让读者能够快速入门,提升个人的数据综合素养。

目录

  • 版权信息
  • 内容简介
  • 丛书编委会
  • 本书编委会
  • 前言
  • 第1章 人工智能下的大数据时代
  • 1.1 大数据时代和人工智能
  • 1.1.1 一切皆为数据
  • 1.1.2 数据高速增长时代
  • 1.1.3 利用人工智能掘金大数据
  • 1.2 人工智能三要素
  • 1.2.1 数据——AI之源
  • 1.2.2 算法——AI之核
  • 1.2.3 算力——AI之驱
  • 1.3 数据素养
  • 1.3.1 何为数据素养
  • 1.3.2 数据素养为何重要
  • 1.3.3 如何提升数据素养
  • 1.4 本章小结
  • 第2章 Python数据分析基础
  • 2.1 Python基础
  • 2.1.1 Python简介
  • 2.1.2 Python数据类型
  • 2.1.3 常用的操作、函数和方法
  • 2.1.4 列表、元组、字典
  • 2.1.5 顺序结构
  • 2.1.6 分支结构
  • 2.1.7 循环结构
  • 2.2 Python数据分析环境
  • 2.2.1 使用pip安装数据分析相关库
  • 2.2.2 安装Anaconda
  • 2.3 Python数据分析相关库
  • 2.3.1 NumPy库
  • 2.3.2 Matplotlib库
  • 2.3.3 SciPy库
  • 2.3.4 Pandas库
  • 2.3.5 xlrd库
  • 2.3.6 PyMySQL库
  • 2.3.7 其他数据分析相关库
  • 2.4 本章小结
  • 第3章 Jupyter环境的使用
  • 3.1 Jupyter Notebook概述
  • 3.1.1 Jupyter Notebook简介及优点
  • 3.1.2 Jupyter Notebook开发环境的搭建
  • 3.1.3 使用pip命令安装
  • 3.2 认识Jupyter Notebook
  • 3.2.1 认识Files、Running、Clusters页面
  • 3.2.2 认识Jupyter Notebook的主页面
  • 3.3 新建、运行、保存Jupyter Notebook文件
  • 3.3.1 新建一个Jupyter Notebook
  • 3.3.2 运行代码
  • 3.3.3 重命名Jupyter Notebook文件
  • 3.3.4 保存Jupyter Notebook文件
  • 3.4 处理不同类型的数据
  • 3.4.1 处理txt文件
  • 3.4.2 处理CSV文件
  • 3.4.3 处理Excel文件
  • 3.4.4 处理sql文件
  • 3.5 在Markdown中使用LaTeX输入数学公式
  • 3.5.1 使用LaTeX输入一个数学公式
  • 3.5.2 LaTeX的两种公式格式
  • 3.5.3 常用数学公式的写法
  • 3.6 Jupyter Notebook应用实例解析
  • 3.6.1 实例一:能力六维雷达图的绘制
  • 3.6.2 实例二:词频统计
  • 3.7 本章小结
  • 第4章 探索数据
  • 4.1 走进数据的世界
  • 4.1.1 定义数据
  • 4.1.2 数据的分类
  • 4.1.3 深挖数据的四种能力
  • 4.1.4 善用指标分析问题
  • 4.2 数据的评估
  • 4.2.1 指标真的可靠吗
  • 4.2.2 统计数据会“说谎”
  • 4.3 数据怎么用
  • 4.3.1 数据清洗
  • 4.3.2 数据的标准化
  • 4.4 本章小结
  • 第5章 描述统计
  • 5.1 数据集中趋势
  • 5.1.1 均值的定义与应用
  • 5.1.2 中位数的定义与应用
  • 5.1.3 众数的定义与应用
  • 5.1.4 案例分析
  • 5.2 数据离散程度
  • 5.2.1 极差的定义与应用
  • 5.2.2 方差的定义与应用
  • 5.3 本章小结
  • 第6章 推断统计
  • 6.1 基础知识要点
  • 6.1.1 排列与组合
  • 6.1.2 随机事件及其概率
  • 6.2 概率分布及其特征
  • 6.2.1 二项分布
  • 6.2.2 正态分布
  • 6.3 统计量
  • 6.3.1 总体与样本
  • 6.3.2 参数估计
  • 6.3.3 假设检验
  • 6.4 本章小结
  • 第7章 数据可视化
  • 7.1 什么是数据可视化
  • 7.1.1 数据可视化的定义和意义
  • 7.1.2 数据可视化的发展历史
  • 7.2 图形对象与元素
  • 7.2.1 如何建立坐标系
  • 7.2.2 如何设置坐标轴的文本和图例
  • 7.3 可视化色彩的运用原理
  • 7.3.1 RGB颜色模式
  • 7.3.2 HSL颜色模式
  • 7.3.3 颜色搭配的技巧和案例
  • 7.4 图表的基本类型
  • 7.4.1 如何绘制柱形图
  • 7.4.2 如何绘制散点图
  • 7.4.3 如何绘制饼形图
  • 7.4.4 如何绘制折线图
  • 7.5 数据分析及可视化案例
  • 7.5.1 数据可视化经典案例
  • 7.5.2 非结构化数据的可视化案例
  • 7.6 常见的数据可视化流程
  • 7.7 本章小结
  • 第8章 NumPy数组
  • 8.1 NumPy库简介
  • 8.2 NumPy数组的生成
  • 8.2.1 生成一般数组
  • 8.2.2 生成特殊数组
  • 8.2.3 生成随机数组
  • 8.3 NumPy数组基础
  • 8.3.1 NumPy数组的基本属性
  • 8.3.2 数组索引:获取单个元素
  • 8.3.3 数组切片:获取子数组
  • 8.4 NumPy数组重塑
  • 8.4.1 NumPy数组的变形
  • 8.4.2 NumPy数组的转置和换轴
  • 8.4.3 NumPy数组的拼接与分裂
  • 8.5 NumPy库中的线性代数
  • 8.5.1 矩阵乘法
  • 8.5.2 行列式
  • 8.5.3 求线性方程的解
  • 8.6 通用函数
  • 8.6.1 一元通用函数
  • 8.6.2 二元通用函数
  • 8.6.3 广播
  • 8.7 常用的数据分析函数
  • 8.7.1 条件函数
  • 8.7.2 聚合函数
  • 8.7.3 快速排序
  • 8.7.4 唯一值与其他集合逻辑
  • 8.8 本章小结
  • 第9章 时间序列数据
  • 9.1 时间序列的定义及分类
  • 9.1.1 时间序列的定义
  • 9.1.2 时间序列的分类
  • 9.2 时间序列的描述性分析
  • 9.2.1 图形描述
  • 9.2.2 增长率分析
  • 9.3 时间序列的预测
  • 9.3.1 确定时间序列成分
  • 9.3.2 选择预测方法
  • 9.3.3 预测方法评估
  • 9.4 平稳时间序列的预测
  • 9.4.1 简单平均法
  • 9.4.2 移动平均法
  • 9.4.3 指数平滑法
  • 9.5 趋势型和复合型时间序列的预测
  • 9.5.1 线性趋势预测
  • 9.5.2 非线性趋势预测
  • 9.5.3 复合型时间序列的分解预测
  • 9.6 使用Python处理时间序列数据
  • 9.6.1 时间序列数据处理工具的选择
  • 9.6.2 时间序列数据的导入
  • 9.6.3 时间序列数据预处理
  • 9.6.4 时间序列数据处理
  • 9.7 本章小结
  • 第10章 文本数据
  • 10.1 文本数据的导入
  • 10.1.1 文本数据与自然语言处理
  • 10.1.2 分词
  • 10.2 文本数据的处理
  • 10.2.1 文本特征初探
  • 10.2.2 文本信息的提取
  • 10.2.3 文本向量化
  • 10.3 文本分析的应用
  • 10.3.1 文本分类
  • 10.3.2 文本情感分析
  • 10.4 本章小结
  • 第11章 回归分析
  • 11.1 叩响人工智能之门
  • 11.1.1 人工智能与机器学习
  • 11.1.2 工欲善其事,必先利其器
  • 11.1.3 算法,该“出道”了
  • 11.2 万朝归宗:线性回归
  • 11.2.1 一元之道
  • 11.2.2 从一元到多元
  • 11.2.3 学习和工作中的线性回归
  • 11.3 回归增强术
  • 11.3.1 非线性回归
  • 11.3.2 可分类的回归
  • 11.3.3 能降维的回归
  • 11.4 本章小结
  • 第12章 聚类分析
  • 12.1 数据之眼看聚类
  • 12.1.1 什么是聚类
  • 12.1.2 人工智能的未来:无监督学习
  • 12.1.3 距离产生美
  • 12.2 K均值聚类
  • 12.2.1 K均值聚类的思想
  • 12.2.2 抽丝剥茧K均值
  • 12.2.3 鸢尾花的K均值聚类
  • 12.3 案例:数据下的省(区、市)
  • 12.3.1 提出问题
  • 12.3.2 数据获取与处理
  • 12.3.3 建模分析与结果
  • 12.4 本章小结
  • 第13章 数据素养综合案例
  • 13.1 综合案例一:利用人工智能爬取大数据,轻松掌握股市动态
  • 13.1.1 认识人工智能网络爬虫
  • 13.1.2 爬取股市大数据,分析需求
  • 13.1.3 爬取股市大数据案例
  • 13.2 综合案例二:人工智能数据——体型分析
  • 13.2.1 K最邻近分类算法原理
  • 13.2.2 使用KNN分类算法对体型进行分类的案例
  • 13.3 其他案例集
  • 13.3.1 计算生肖
  • 13.3.2 猜数游戏
  • 13.3.3 二维列表排序
  • 13.3.4 学生信息录入
  • 13.3.5 打印回文素数(合数)
  • 13.3.6 数据库加密
  • 13.3.7 计算圆台的体积和表面积
  • 13.4 本章小结
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

电子工业出版社

电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。