展开全部

主编推荐语

一本关于python、数据科学和AI的极简入门书。

内容简介

通过学习本书提供的500多个实际示例,你将学会使用交互式IPython解释器和JupyterNotebook并快速掌握Python编码方法。

在学习完第1~5章的Python基础知识以及第6和7章的一些关键内容之后,你将能够处理第11~16章中有关人工智能案例的重要实操内容,包括自然语言处理,用于情感分析的Twitter数据挖掘,使用IBMWatson的认知计算,利用分类和回归进行的有监督机器学习,通过聚类进行的无监督机器学习,基于深度学习和卷积神经网络的计算机视觉,基于递归神经网络的深度学习,基于Hadoop、Spark和NoSQL数据库的大数据处理,物联网等。你还将直接或间接使用基于云的服务,如Twitter、GoogleTranslate、IBMWatson、MicrosoftAzure、OpenMapQuest、PubNub等。

目录

  • 版权信息
  • 审稿人评论
  • 译者序
  • 前言
  • 作者简介
  • 开始阅读本书之前
  • 第一部分 Python基础知识快速入门
  • 第1章 Python及大数据概述
  • 1.1 简介
  • 1.2 快速回顾面向对象技术的基础知识
  • 1.3 Python
  • 1.4 Python库
  • 1.5 试用IPython和Jupyter Notebook
  • 1.6 云和物联网
  • 1.7 大数据有多大
  • 1.8 案例研究:大数据移动应用程序
  • 1.9 数据科学入门:人工智能—计算机科学与数据科学的交叉学科
  • 1.10 小结
  • 第2章 Python程序设计概述
  • 2.1 简介
  • 2.2 变量和赋值语句
  • 2.3 算术运算
  • 2.4 print函数、单引号和双引号
  • 2.5 三引号字符串
  • 2.6 从用户处获取输入
  • 2.7 决策:if语句和比较运算符
  • 2.8 对象和动态类型
  • 2.9 数据科学入门:基础的描述性统计
  • 2.10 小结
  • 第3章 控制语句
  • 3.1 简介
  • 3.2 控制语句概述
  • 3.3 if语句
  • 3.4 if...else和if...elif...else语句
  • 3.5 while语句
  • 3.6 for语句
  • 3.7 增强赋值
  • 3.8 序列控制迭代和格式化字符串
  • 3.9 边界值控制的迭代
  • 3.10 内置函数range:深入讨论
  • 3.11 使用Decimal类型处理货币金额
  • 3.12 break和continue语句
  • 3.13 布尔运算符and、or和not
  • 3.14 数据科学入门:集中趋势度量—均值、中值和众数
  • 3.15 小结
  • 第4章 函数
  • 4.1 简介
  • 4.2 函数定义
  • 4.3 多参数函数
  • 4.4 随机数生成
  • 4.5 案例研究:一个运气游戏
  • 4.6 Python标准库
  • 4.7 math模块中的函数
  • 4.8 在IPython中使用制表符自动补全
  • 4.9 默认参数值
  • 4.10 关键字参数
  • 4.11 不定长参数列表
  • 4.12 方法:属于对象的函数
  • 4.13 作用域规则
  • 4.14 import:深入讨论
  • 4.15 向函数传递参数:深入讨论
  • 4.16 递归
  • 4.17 函数式编程
  • 4.18 数据科学入门:离中趋势度量
  • 4.19 小结
  • 第5章 序列:列表和元组
  • 5.1 简介
  • 5.2 列表
  • 5.3 元组
  • 5.4 序列解包
  • 5.5 序列切片
  • 5.6 使用del声明
  • 5.7 将列表传递给函数
  • 5.8 列表排序
  • 5.9 序列搜索
  • 5.10 列表的其他方法
  • 5.11 使用列表模拟堆栈
  • 5.12 列表推导式
  • 5.13 生成器表达式
  • 5.14 过滤、映射和归约
  • 5.15 其他的序列处理函数
  • 5.16 二维列表
  • 5.17 数据科学入门:模拟和静态可视化
  • 5.18 小结
  • 第二部分 Python数据结构、字符串和文件
  • 第6章 字典和集合
  • 6.1 简介
  • 6.2 字典
  • 6.3 集合
  • 6.4 数据科学入门:动态可视化
  • 6.5 小结
  • 第7章 使用NumPy进行面向数组的编程
  • 7.1 简介
  • 7.2 从现有数据创建数组
  • 7.3 数组属性
  • 7.4 用特定值填充数组
  • 7.5 从范围创建数组
  • 7.6 列表与数组的性能比较:引入%timeit
  • 7.7 数组运算符
  • 7.8 NumPy计算方法
  • 7.9 通用函数
  • 7.10 索引和切片
  • 7.11 视图:浅拷贝
  • 7.12 视图:深拷贝
  • 7.13 重塑和转置
  • 7.14 数据科学入门:pandas Series和DataFrame
  • 7.15 小结
  • 第8章 字符串:深入讨论
  • 8.1 简介
  • 8.2 格式化字符串
  • 8.3 拼接和重复字符串
  • 8.4 去除字符串中的空白字符
  • 8.5 字符大小写转换
  • 8.6 字符串的比较运算符
  • 8.7 查找子字符串
  • 8.8 替换子字符串
  • 8.9 字符串拆分和连接
  • 8.10 字符串测试方法
  • 8.11 原始字符串
  • 8.12 正则表达式介绍
  • 8.13 数据科学入门:pandas、正则表达式和数据治理
  • 8.14 小结
  • 第9章 文件和异常
  • 9.1 简介
  • 9.2 文件
  • 9.3 文本文件处理
  • 9.4 更新文本文件
  • 9.5 使用JSON进行序列化
  • 9.6 关注安全:pickle序列化和反序列化
  • 9.7 关于文件的附加说明
  • 9.8 处理异常
  • 9.9 finally子句
  • 9.10 显式地引发一个异常
  • 9.11 (选学)堆栈展开和回溯
  • 9.12 数据科学入门:使用CSV文件
  • 9.13 小结
  • 第三部分 Python高级主题
  • 第10章 面向对象编程
  • 10.1 简介
  • 10.2 自定义Account类
  • 10.3 属性访问控制
  • 10.4 用于数据访问的property
  • 10.5 模拟“私有”属性
  • 10.6 案例研究:洗牌和分牌模拟
  • 10.7 继承:基类和子类
  • 10.8 构建继承层次结构:引入多态性
  • 10.9 鸭子类型和多态性
  • 10.10 运算符重载
  • 10.11 异常类层次结构和自定义异常
  • 10.12 具名元组
  • 10.13 Python 3.7的新数据类简介
  • 10.14 使用文档字符串和doctest进行单元测试
  • 10.15 命名空间和作用域
  • 10.16 数据科学入门:时间序列和简单线性回归
  • 10.17 小结
  • 第四部分 人工智能、云和大数据案例研究
  • 第11章 自然语言处理
  • 11.1 简介
  • 11.2 TextBlob
  • 11.3 使用柱状图和词云可视化词频
  • 11.4 使用Textatistic库进行可读性评估
  • 11.5 使用spaCy命名实体识别
  • 11.6 使用spaCy进行相似性检测
  • 11.7 其他NLP库和工具
  • 11.8 机器学习和深度学习自然语言应用
  • 11.9 自然语言数据集
  • 11.10 小结
  • 第12章 Twitter数据挖掘
  • 12.1 简介
  • 12.2 Twitter API概况
  • 12.3 创建一个Twitter账户
  • 12.4 获取Twitter凭据,创建应用程序
  • 12.5 什么是推文
  • 12.6 Tweepy
  • 12.7 通过Tweepy进行Twitter身份验证
  • 12.8 获取一个Twitter账户的相关信息
  • 12.9 Tweepy Cursor简介:获得一个账户的关注者和朋友
  • 12.10 搜索最新的推文
  • 12.11 热门话题发现:Twitter热门话题API
  • 12.12 推文分析前的清理或预处理
  • 12.13 Twitter流API
  • 12.14 推文情感分析
  • 12.15 地理编码和映射
  • 12.16 存储推文的方法
  • 12.17 Twitter和时间序列
  • 12.18 小结
  • 第13章 IBM Watson和认知计算
  • 13.1 简介
  • 13.2 IBM云账户和云控制台
  • 13.3 Watson服务
  • 13.4 额外的服务和工具
  • 13.5 Watson开发者云Python SDK
  • 13.6 案例研究:旅行者翻译伴侣APP
  • 13.7 Watson资源
  • 13.8 小结
  • 第14章 机器学习:分类、回归和聚类
  • 14.1 简介
  • 14.2 案例研究:用k近邻算法和Digits数据集进行分类(第1部分)
  • 14.3 案例研究:利用k近邻算法和Digits数据集进行分类(第2部分)
  • 14.4 案例研究:时间序列和简单线性回归
  • 14.5 案例研究:基于加利福尼亚房价数据集的多元线性回归
  • 14.6 案例研究:无监督学习(第1部分)—降维
  • 14.7 案例研究:无监督学习(第2部分)—k均值聚类
  • 14.8 小结
  • 第15章 深度学习
  • 15.1 简介
  • 15.2 Keras内置数据集
  • 15.3 自定义Anaconda环境
  • 15.4 神经网络
  • 15.5 张量
  • 15.6 用于视觉的卷积神经网络:使用MNIST数据集进行多分类
  • 15.7 用TensorBoard可视化神经网络的训练过程
  • 15.8 ConvnetJS:基于浏览器的深度学习训练和可视化
  • 15.9 针对序列的递归神经网络:使用IMDb数据集进行情感分析
  • 15.10 调整深度学习模型
  • 15.11 在ImageNet上预训练的CNN模型
  • 15.12 小结
  • 第16章 大数据:Hadoop、Spark、NoSQL和IoT
  • 16.1 简介
  • 16.2 关系数据库和结构化查询语言
  • 16.3 NoSQL和NewSQL大数据数据库简述
  • 16.4 案例研究:MongoDB JSON文档数据库
  • 16.5 Hadoop
  • 16.6 Spark
  • 16.7 Spark流:使用pyspark-notebook Docker堆栈计算Twitter主题标签
  • 16.8 物联网和仪表板
  • 16.9 小结
  • 索引
展开全部

评分及书评

评分不足
1个评分

出版方

机械工业出版社有限公司

机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。