展开全部

主编推荐语

本书以智能的方式为设计和实现用于实际应用的数据分析方案奠定了坚实的基础。

内容简介

本书详细介绍了数据科学领域的相关智能技术,包括数据分析、基本学习算法、模糊逻辑、人工神经网络、基因算法和进化计算、使用R语言进行大数据分析等。

目录

  • 版权信息
  • 译者序
  • 前言
  • 第1章 绪论
  • 1.1 引言
  • 1.2 数据科学的历史
  • 1.3 现代商业中数据科学的重要性
  • 1.4 数据科学家
  • 1.5 三维数据科学活动
  • 1.5.1 管理数据流
  • 1.5.2 处理数据管理
  • 1.5.3 数据分析
  • 1.6 数据科学与其他领域交叉
  • 1.7 数据分析思维
  • 1.8 应用领域
  • 1.8.1 资源的可持续发展
  • 1.8.2 利用社交平台进行各种活动
  • 1.8.3 智能Web应用
  • 1.8.4 Google自动统计员项目
  • 1.9 应用计算智能管理数据科学活动
  • 1.10 商业中的数据科学场景
  • 1.11 有助于数据科学的工具和技术
  • 1.11.1 数据清洗工具
  • 1.11.2 数据管理和建模工具
  • 1.11.3 数据可视化工具
  • 1.12 练习
  • 参考文献
  • 第2章 数据分析
  • 2.1 引言
  • 2.2 跨行业标准过程
  • 2.3 数据分析生命周期
  • 2.4 数据科学项目生命周期
  • 2.5 数据分析的复杂性
  • 2.6 从数据到洞察力
  • 2.7 构建分析能力:银行案例
  • 2.8 数据质量
  • 2.9 数据准备过程
  • 2.10 沟通分析结果
  • 2.10.1 沟通分析结果的策略
  • 2.10.2 数据可视化
  • 2.10.3 可视化技术
  • 2.11 练习
  • 参考文献
  • 第3章 基本学习算法
  • 3.1 从数据中学习
  • 3.2 监督学习
  • 3.2.1 线性回归
  • 3.2.2 决策树
  • 3.2.3 随机森林
  • 3.2.4 k-近邻算法
  • 3.2.5 逻辑回归
  • 3.2.6 模型组合器
  • 3.2.7 朴素贝叶斯
  • 3.2.8 贝叶斯信念网络
  • 3.2.9 支持向量机
  • 3.3 无监督学习
  • 3.3.1 Apriori算法
  • 3.3.2 k-means算法
  • 3.3.3 用于数据压缩的降维
  • 3.4 强化学习
  • 3.5 案例研究:使用机器学习进行市场营销活动
  • 3.6 练习
  • 参考文献
  • 第4章 模糊逻辑
  • 4.1 引言
  • 4.2 模糊隶属函数
  • 4.2.1 三角形隶属函数
  • 4.2.2 梯形隶属函数
  • 4.2.3 高斯隶属函数
  • 4.2.4 sigmoid隶属函数
  • 4.3 隶属值分配方法
  • 4.4 模糊化与解模糊化方法
  • 4.5 模糊集合操作
  • 4.5.1 模糊集合的并集
  • 4.5.2 模糊集合的交集
  • 4.5.3 模糊集合的补集
  • 4.6 模糊集合性质
  • 4.7 模糊关系
  • 4.8 模糊命题
  • 4.8.1 模糊连接词
  • 4.8.2 析取
  • 4.8.3 合取
  • 4.8.4 否定
  • 4.8.5 蕴含
  • 4.9 模糊推理
  • 4.10 基于模糊规则的系统
  • 4.11 数据科学的模糊逻辑
  • 4.11.1 应用1:Web内容挖掘
  • 4.11.2 应用2:Web结构挖掘
  • 4.11.3 应用3:Web使用挖掘
  • 4.11.4 应用4:环境和社交数据处理
  • 4.12 用模糊逻辑进行数据科学活动的工具和技术
  • 4.13 练习
  • 参考文献
  • 第5章 人工神经网络
  • 5.1 引言
  • 5.2 符号学习方法
  • 5.3 人工神经网络及其特点
  • 5.4 ANN模型
  • 5.4.1 Hopfield模型
  • 5.4.2 感知器模型
  • 5.4.3 多层感知器
  • 5.4.4 多层感知器的深度学习
  • 5.4.5 其他ANN模型
  • 5.4.6 线性回归与神经网络
  • 5.5 ANN工具和程序
  • 5.6 社交网络平台上的情感挖掘
  • 5.6.1 情感挖掘相关工作
  • 5.6.2 广泛架构
  • 5.6.3 神经网络设计
  • 5.7 应用与挑战
  • 5.8 关注点
  • 5.9 练习
  • 参考文献
  • 第6章 遗传算法与进化计算
  • 6.1 引言
  • 6.2 遗传算法
  • 6.3 遗传算法的基本原理
  • 6.3.1 个体编码
  • 6.3.2 变异
  • 6.3.3 交叉
  • 6.3.4 适应度函数
  • 6.3.5 选择
  • 6.3.6 其他编码策略
  • 6.4 利用遗传算法进行函数优化的实例
  • 6.5 模式与模式定理
  • 6.5.1 实例、定义位和模式顺序
  • 6.5.2 模式的重要性
  • 6.6 基于特殊应用的遗传算子
  • 6.7 进化编程
  • 6.8 遗传算法在医疗保健中的应用
  • 6.8.1 医疗保健案例
  • 6.8.2 基于遗传算法的病人调度系统
  • 6.8.3 编码候选者
  • 6.8.4 种群上的操作
  • 6.8.5 其他应用
  • 6.9 练习
  • 参考文献
  • 第7章 其他元启发式和分类方法
  • 7.1 引言
  • 7.2 自适应记忆过程
  • 7.2.1 禁忌搜索
  • 7.2.2 分散搜索
  • 7.2.3 路径重连
  • 7.3 群体智能
  • 7.3.1 蚁群优化
  • 7.3.2 人工蜂群算法
  • 7.3.3 河流形成动力学
  • 7.3.4 粒子群优化
  • 7.3.5 随机扩散搜索
  • 7.3.6 群体智能与大数据
  • 7.4 案例推理
  • 7.4.1 案例推理中的学习
  • 7.4.2 案例推理与数据科学
  • 7.4.3 处理复杂的领域
  • 7.5 粗糙集
  • 7.6 练习
  • 参考文献
  • 第8章 分析和大数据
  • 8.1 引言
  • 8.2 传统分析与大数据分析
  • 8.3 大规模并行处理
  • 8.3.1 MapReduce
  • 8.3.2 与RDBMS的比较
  • 8.3.3 共享存储的并行编程
  • 8.3.4 Apache Hadoop生态系统
  • 8.3.5 Hadoop分布式文件系统
  • 8.4 NoSQL
  • 8.5 SPARK
  • 8.6 运动的数据
  • 8.6.1 数据流处理
  • 8.6.2 实时数据流
  • 8.6.3 数据流与DBMS
  • 8.7 扩展机器学习算法
  • 8.8 数据科学中的隐私、安全和伦理
  • 8.9 练习
  • 参考文献
  • 第9章 R语言的数据科学活动
  • 9.1 入门
  • 9.2 运行代码
  • 9.3 R基础知识
  • 9.4 分析数据
  • 9.5 示例
  • 9.5.1 线性回归
  • 9.5.2 逻辑回归
  • 9.5.3 预测
  • 9.5.4 k-最近邻分类
  • 9.5.5 朴素贝叶斯
  • 9.5.6 决策树
  • 9.5.7 k-means聚类
  • 9.5.8 随机森林
  • 9.5.9 Apriori
  • 9.5.10 AdaBoost
  • 9.5.11 降维
  • 9.5.12 支持向量机
  • 9.5.13 人工神经网络
  • 9.6 在R中可视化
  • 9.7 编写自己的函数
  • 9.8 Hadoop上的开源R
  • 参考文献
  • 附录A 数据科学工具
  • 附录B 计算智能工具
展开全部

评分及书评

评分不足
2个评分
  • 用户头像
    给这本书评了
    5.0

    本书不仅介绍数据科学中的基本概念、基本技术和方法,帮助读者理解并掌握一些数据科学中的智能技术;还介绍了数据科学中涉及的监督学习、无监督学习、模糊推理、人工神经网络、进化计算、元启发式方法、群体智能、并行算法以及 R 语言编程。本书包含了大量的真实案例和面向应用的项目练习题,有助于读者深入理解书中的算法如何在实际中运用。

      转发
      评论
      用户头像
      给这本书评了
      5.0

      数据是来自某个领域的原始观测值。原始数据是一组事实的集合,比如数字、单词、测量值,或者事物的文本说明。单词 “数据”(data)来自于拉丁文 “datum”,其含义为给定的事物。数据是无处不在的,亦是事物测量仪器化的重要单位。所有的实体直接或间接地与事务相关,如商业中的客户、商业业务的组成部分,以及处理业务的外部实体,这些实体产生了大量的数据。数据通常被看作是为了参考或分析而收集在一起的事实、统计资料和观测值。数据为推理和计算提供了基础。

        转发
        评论

      出版方

      机械工业出版社有限公司

      机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。