主编推荐语
从商业理解、量化模型、数据技术3个纬度全面讲解数据科学的应用场景、理论支撑和技术底座。
内容简介
这是一本将数据科学三要素——商业理解、量化模型、数据技术全面打通的实战性著作,是来自腾讯、滴滴、快手等一线互联网企业的数据科学家、数据分析师和算法工程师的经验总结。
全书三个部分,内容相对独立,既能帮助初学者建立知识体系,又能帮助从业者解决商业中的实际问题,还能帮助有经验的专家快速掌握数据科学的最新技术和发展动向。
内容围绕非实验环境下的观测数据的分析、实验的设计和分析、自助式数据科学平台3大主题展开,涉及统计学、经济学、机器学习、实验科学等多个领域,包含大量常用的数据科学方法、简洁的代码实现和经典的实战案例。
第1部分(第1~6章)观测数据的分析技术讲解了非实验环境下不同观测数据分析场景所对应的分析框架、原理及实际操作,包括消费者选择偏好分析、消费者在时间维度上的行为分析、基于机器学习的用户生命周期价值预测、基于可解释模型技术的商业场景挖掘、基于矩阵分解技术的用户行为规律发现与挖掘,以及在不能进行实验分析时如何更科学地进行全量评估等内容。
第二部分(第7~9章)实验设计和分析技术从A/B实验的基本原理出发,深入浅出地介绍了各种商业场景下进行实验设计需要参考的原则和运用的方法,尤其是在有样本量约束条件下提升实验效能的方法及商业场景限制导致的非传统实验设计。
第三部分(第10~12章)自助式数据科学平台SQLFlow针对性的讲解了开源的工程化的自助式数据科学平台SQLFlow,并通过系统配置、黑盒模型的解读器应用、聚类分析场景等案例帮助读者快速了解这一面向未来的数据科学技术。
目录
- 版权信息
- 作者简介
- 序一
- 序二
- 前言
- 第一部分 观测数据的分析技术
- 第1章 如何分析用户的选择
- 1.1 深入理解选择行为
- 1.2 DCM详述
- 1.3 DCM模型的Python实践
- 1.4 本章小结
- 第2章 与时间相关的行为分析
- 2.1 生存分析与二手车定价案例
- 2.2 生存分析的理论框架
- 2.3 生存分析在二手车定价案例中的应用
- 2.4 本章小结
- 第3章 洞察用户长期价值: 基于神经网络的LTV建模
- 3.1 用户长期价值的概念和商业应用
- 3.2 基于Keras的LTV模型实践
- 3.3 本章小结
- 第4章 使用体系化分析方法进行场景挖掘
- 4.1 经验化分析与体系化分析
- 4.2 体系化分析常用工具
- 4.3 场景挖掘分析的应用与实现
- 4.4 本章小结
- 第5章 行为规律的发现与挖掘
- 5.1 对有序数据的规律分析
- 5.2 SVD聚类建模Python实战
- 5.3 对无序稀疏数据的规律分析
- 5.4 本章小结
- 第6章 对观测到的事件进行因果推断
- 6.1 使用全量评估分析已发生的事件
- 6.2 全量评估的主要方法
- 6.3 全量评估方法的应用
- 6.4 本章小结
- 第二部分 实验设计和分析技术
- 第7章 如何比较两个策略的效果
- 7.1 正确推断因果关系
- 7.2 运用A/B实验进行策略比较
- 7.3 A/B实验应用步骤
- 7.4 A/B实验案例
- 7.5 本章小结
- 第8章 提高实验效能
- 8.1 控制实验指标方差的必要性和手段
- 8.2 用随机区组设计控制实验指标方差
- 8.3 随机区组实验应用步骤
- 8.4 随机区组实验案例介绍
- 8.5 随机区组实验的常见问题
- 8.6 本章小结
- 第9章 特殊场景下的实验设计和分析方法
- 9.1 解决分流实验对象之间的干扰
- 9.2 Switchback实验和评估方法
- 9.3 交叉实验
- 9.4 强约束条件下的实验方法
- 9.5 本章小结
- 第三部分 自助式数据科学平台SQLFlow
- 第10章 SQLFlow
- 10.1 SQLFlow简介
- 10.2 设置SQLFlow运行环境
- 10.3 向SQLFlow提交分析模型
- 10.4 本章小结
- 第11章 机器学习模型可解释性
- 11.1 模型的可解释性
- 11.2 常见的可解释模型
- 11.3 黑盒模型的解释性
- 11.4 本章小结
- 第12章 基于LSTM-Autoencoder的无监督聚类模型
- 12.1 聚类分析的广泛应用
- 12.2 聚类模型的应用案例
- 12.3 SQLFlow中基于深度学习的聚类模型
- 12.4 本章小结
出版方
机械工业出版社有限公司
机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。