展开全部

主编推荐语

本书是针对于非统计科班出身的企业人员讲述数据分析和挖掘的著作,也是诸多数据挖掘书籍中为数不多的穿插大量真实实践应用案例和场景的著作。

内容简介

本书分为三大部分,第一部分基础篇(第1章和第2章)主要介绍数据分析的概念、术语、方法、模型等,为后续的内容展开奠定基础。第二部分制表篇(第3章到第5章)介绍数据的采集、整理以及常用数据报表的制作。第三部分数据分析篇(第6章到第14章)占据了本书的大部分篇幅,囊括了常用的、有代表性的、实用的功能,包括数据扫描、数据标注、异常值分析、回归等。

目录

  • 版权信息
  • 前言
  • 第1章 什么是数据分析
  • 1.1 一眼就看到结论还需要数据分析吗
  • 1.1.1 企业数据量
  • 1.1.2 数据复杂度
  • 1.1.3 数据颗粒度
  • 1.2 数据分析能给我们带来什么
  • 1.2.1 了解数据的整体状况
  • 1.2.2 快速查询数据
  • 1.2.3 数据之间关系的探索
  • 1.2.4 业务预测
  • 1.3 数据分析的几大抓手
  • 1.3.1 足够多的数据
  • 1.3.2 数据质量
  • 1.3.3 合适的工具
  • 1.3.4 分析结果的呈现
  • 1.4 数据分析的流程
  • 1.4.1 数据采集
  • 1.4.2 数据整理
  • 1.4.3 制表
  • 1.4.4 数据分析
  • 1.4.5 数据展示(呈现)
  • 1.5 如何成为数据分析高手
  • 1.5.1 “拳不离手,曲不离口”
  • 1.5.2 熟练掌握常用工具
  • 1.5.3 最好能编点程序
  • 1.5.4 一定要通晓业务
  • 第2章 数据分析的理论、工具、模型
  • 2.1 基本概念和术语
  • 2.1.1 基本概念
  • 2.1.2 术语
  • 2.2 选择称手的软件工具
  • 2.2.1 EXCEL
  • 2.2.2 VBA
  • 2.2.3 Access
  • 2.2.4 SPSS
  • 2.2.5 XLSTAT
  • 2.2.6 Modeler
  • 2.2.7 R语言
  • 2.3 在分析需求和模型之间搭起桥梁
  • 2.3.1 识别需求
  • 2.3.2 分解需求
  • 2.3.3 选择工具和模型
  • 第3章 数据采集与整理
  • 3.1 数据采集的几条重要原则
  • 3.1.1 要足够“复杂”
  • 3.1.2 要足够“细”
  • 3.1.3 要有“跨度”
  • 3.1.4 要有可行性
  • 3.2 用“逐步推进法”推测需要的数据
  • 3.3 耗时耗力的数据整理过程
  • 3.3.1 重复、空行、空列数据删除
  • 3.3.2 缺失值的填充和分析
  • 3.3.3 数据间逻辑的排查
  • 3.4 数据量太大了怎么办
  • 3.4.1 放到数据库中处理
  • 3.4.2 用专业工具处理
  • 3.4.3 数据抽样
  • 第4章 数据分析的基础:制表(上)
  • 4.1 以数据合并为目标的制表
  • 4.1.1 跨工作表合并
  • 4.1.2 跨工作簿合并
  • 4.2 以数据筛选为目标的制表
  • 4.2.1 普通数据筛选
  • 4.2.2 高级筛选
  • 4.2.3 计算筛选
  • 4.2.4 函数筛选
  • 4.3 以获得概要数据为目标的制表
  • 4.3.1 分类汇总方法
  • 4.3.2 数据透视表汇总
  • 第5章 数据分析的基础:制表(下)
  • 5.1 “七个百分比”让你懂得大部分表格类型
  • 5.1.1 行总计的百分比
  • 5.1.2 列总计的百分比
  • 5.1.3 全部总计的百分比
  • 5.1.4 父行(列)的百分比
  • 5.1.5 累计占比
  • 5.1.6 环比
  • 5.1.7 同比
  • 5.2 分组功能经常让分析峰回路转
  • 5.2.1 文本的分组
  • 5.2.2 等步长的数据分组
  • 5.2.3 不等步长的数据分组
  • 5.2.4 日期型的分组
  • 5.3 随意生成各种派生指标
  • 5.3.1 添加字段
  • 5.3.2 添加项
  • 5.4 从大数据库中挑选要分析的数据:Microsoft Query
  • 5.5 强大的SQL
  • 5.5.1 SQL的基本语法
  • 5.5.2 SQL的应用
  • 第6章 数据扫描:给数据做体检
  • 6.1 在EXCEL中给数据做扫描
  • 6.2 SPSS中给数据做扫描
  • 6.3 在Modeler中给数据做扫描
  • 6.4 其他相应的指标
  • 第7章 数据标注:给数据上色
  • 7.1 大数据块的整体标注
  • 7.1.1 突出显示单元格规则
  • 7.1.2 特殊数据选取规则
  • 7.2 根据业务逻辑在数据中标注上色
  • 7.2.1 数据条、色阶、图标集的应用
  • 7.2.2 规则的理解
  • 7.2.3 根据业务需求改变规则
  • 7.3 采用公式实现复杂强大的数据标注
  • 7.3.1 理解逻辑表达式的含义
  • 7.3.2 复杂逻辑公式的应用
  • 7.4 如何在一张表格中实现多种标注规则
  • 7.4.1 多规则的应用
  • 7.4.2 如何理解“遇真则停止”
  • 第8章 找到数据中的“特殊分子”
  • 8.1 什么是异常值
  • 8.2 异常值的判断标准
  • 8.3 用绘图技巧找到异常值
  • 8.3.1 散点图
  • 8.3.2 面板图
  • 8.4 用公式函数法发掘异常值
  • 8.5 三倍标准差法
  • 第9章 相关分析与决策树
  • 9.1 Pearson相关
  • 9.1.1 应用场景
  • 9.1.2 输出指标的解析
  • 9.2 典型相关分析
  • 9.2.1 操作步骤
  • 9.2.2 结果解读
  • 9.3 决策树
  • 9.3.1 什么时候需要用决策树
  • 9.3.2 决策树的操作和指标解释
  • 第10章 聚类
  • 10.1 多维度数据的分类怎么办
  • 10.1.1 低维度数据的分类方法
  • 10.1.2 高维度数据的分类需求
  • 10.1.3 常用的聚类操作介绍
  • 10.2 聚类的烦恼1:如何面对数量级差别大的数据
  • 10.3 聚类的烦恼2:如何判断聚类的质量
  • 第11章 回归
  • 11.1 如何寻找现有数据的内在规律
  • 11.1.1 什么是数据拟合
  • 11.1.2 多元线性回归
  • 11.2 logistic回归
  • 11.2.1 回归(客户“买”与“不买”)
  • 11.2.2 多元logistic回归(多个品牌的选择)
  • 11.2.3 多元有序logistic回归
  • 第12章 关联分析
  • 12.1 因果关系的弱化
  • 12.2 关联分析的指标
  • 12.2.1 支持度
  • 12.2.2 置信度
  • 12.2.3 提升度
  • 12.3 什么样的数据适合做关联分析
  • 12.3.1 商超数据
  • 12.3.2 金融数据
  • 12.3.3 生产质量数据
  • 12.4 关联分析的具体操作
  • 第13章 预测
  • 13.1 什么是预测,预测的准确度高吗
  • 13.2 移动平滑
  • 13.3 指数平滑
  • 13.3.1 二次指数平滑
  • 13.3.2 三次指数平滑
  • 13.4 对周期性数据的分解
  • 13.5 ARIMA预测法
  • 第14章 高级绘图技巧
  • 14.1 怎样才算图画得好
  • 14.2 双轴图的技巧和运用
  • 14.3 不同数量级数据的高效对比展示
  • 14.4 数据标签的妙用
  • 14.5 图形中的重点标注
  • 14.6 绘图美学——多点审美素养
  • 14.6.1 整体布局
  • 14.6.2 线型的选择
  • 14.6.3 色彩对比
  • 后记 数据分析经验之我见
  • 本书彩插图
展开全部

评分及书评

4.7
3个评分
  • 用户头像
    给这本书评了
    5.0

    企业数据量是企业可分析度的第一要素,企业数据量的大小往往取决于两个因素:一是企业的行业属性,二是企业的信息化程度。众所周知,互联网行业往往也是产生大量数据的行业,“BAT” 不仅仅引领了各自行业的发展,同时也是数据行业发展的标杆。

      转发
      评论
      用户头像
      给这本书评了
      4.0
      言简意赅的一本工具书

      就问:书中案例的数据在哪里下载?

        转发
        评论
        用户头像
        给这本书评了
        5.0

        深入浅出易懂,对数据呈现帮助较大。

          转发
          评论

        出版方

        机械工业出版社有限公司

        机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。