互联网
类型
可以朗读
语音朗读
669千字
字数
2021-03-01
发行日期
展开全部
主编推荐语
一本关于python、数据科学和AI的极简入门书。
内容简介
通过学习本书提供的500多个实际示例,你将学会使用交互式IPython解释器和JupyterNotebook并快速掌握Python编码方法。
在学习完第1~5章的Python基础知识以及第6和7章的一些关键内容之后,你将能够处理第11~16章中有关人工智能案例的重要实操内容,包括自然语言处理,用于情感分析的Twitter数据挖掘,使用IBMWatson的认知计算,利用分类和回归进行的有监督机器学习,通过聚类进行的无监督机器学习,基于深度学习和卷积神经网络的计算机视觉,基于递归神经网络的深度学习,基于Hadoop、Spark和NoSQL数据库的大数据处理,物联网等。你还将直接或间接使用基于云的服务,如Twitter、GoogleTranslate、IBMWatson、MicrosoftAzure、OpenMapQuest、PubNub等。
目录
- 版权信息
- 审稿人评论
- 译者序
- 前言
- 作者简介
- 开始阅读本书之前
- 第一部分 Python基础知识快速入门
- 第1章 Python及大数据概述
- 1.1 简介
- 1.2 快速回顾面向对象技术的基础知识
- 1.3 Python
- 1.4 Python库
- 1.5 试用IPython和Jupyter Notebook
- 1.6 云和物联网
- 1.7 大数据有多大
- 1.8 案例研究:大数据移动应用程序
- 1.9 数据科学入门:人工智能—计算机科学与数据科学的交叉学科
- 1.10 小结
- 第2章 Python程序设计概述
- 2.1 简介
- 2.2 变量和赋值语句
- 2.3 算术运算
- 2.4 print函数、单引号和双引号
- 2.5 三引号字符串
- 2.6 从用户处获取输入
- 2.7 决策:if语句和比较运算符
- 2.8 对象和动态类型
- 2.9 数据科学入门:基础的描述性统计
- 2.10 小结
- 第3章 控制语句
- 3.1 简介
- 3.2 控制语句概述
- 3.3 if语句
- 3.4 if...else和if...elif...else语句
- 3.5 while语句
- 3.6 for语句
- 3.7 增强赋值
- 3.8 序列控制迭代和格式化字符串
- 3.9 边界值控制的迭代
- 3.10 内置函数range:深入讨论
- 3.11 使用Decimal类型处理货币金额
- 3.12 break和continue语句
- 3.13 布尔运算符and、or和not
- 3.14 数据科学入门:集中趋势度量—均值、中值和众数
- 3.15 小结
- 第4章 函数
- 4.1 简介
- 4.2 函数定义
- 4.3 多参数函数
- 4.4 随机数生成
- 4.5 案例研究:一个运气游戏
- 4.6 Python标准库
- 4.7 math模块中的函数
- 4.8 在IPython中使用制表符自动补全
- 4.9 默认参数值
- 4.10 关键字参数
- 4.11 不定长参数列表
- 4.12 方法:属于对象的函数
- 4.13 作用域规则
- 4.14 import:深入讨论
- 4.15 向函数传递参数:深入讨论
- 4.16 递归
- 4.17 函数式编程
- 4.18 数据科学入门:离中趋势度量
- 4.19 小结
- 第5章 序列:列表和元组
- 5.1 简介
- 5.2 列表
- 5.3 元组
- 5.4 序列解包
- 5.5 序列切片
- 5.6 使用del声明
- 5.7 将列表传递给函数
- 5.8 列表排序
- 5.9 序列搜索
- 5.10 列表的其他方法
- 5.11 使用列表模拟堆栈
- 5.12 列表推导式
- 5.13 生成器表达式
- 5.14 过滤、映射和归约
- 5.15 其他的序列处理函数
- 5.16 二维列表
- 5.17 数据科学入门:模拟和静态可视化
- 5.18 小结
- 第二部分 Python数据结构、字符串和文件
- 第6章 字典和集合
- 6.1 简介
- 6.2 字典
- 6.3 集合
- 6.4 数据科学入门:动态可视化
- 6.5 小结
- 第7章 使用NumPy进行面向数组的编程
- 7.1 简介
- 7.2 从现有数据创建数组
- 7.3 数组属性
- 7.4 用特定值填充数组
- 7.5 从范围创建数组
- 7.6 列表与数组的性能比较:引入%timeit
- 7.7 数组运算符
- 7.8 NumPy计算方法
- 7.9 通用函数
- 7.10 索引和切片
- 7.11 视图:浅拷贝
- 7.12 视图:深拷贝
- 7.13 重塑和转置
- 7.14 数据科学入门:pandas Series和DataFrame
- 7.15 小结
- 第8章 字符串:深入讨论
- 8.1 简介
- 8.2 格式化字符串
- 8.3 拼接和重复字符串
- 8.4 去除字符串中的空白字符
- 8.5 字符大小写转换
- 8.6 字符串的比较运算符
- 8.7 查找子字符串
- 8.8 替换子字符串
- 8.9 字符串拆分和连接
- 8.10 字符串测试方法
- 8.11 原始字符串
- 8.12 正则表达式介绍
- 8.13 数据科学入门:pandas、正则表达式和数据治理
- 8.14 小结
- 第9章 文件和异常
- 9.1 简介
- 9.2 文件
- 9.3 文本文件处理
- 9.4 更新文本文件
- 9.5 使用JSON进行序列化
- 9.6 关注安全:pickle序列化和反序列化
- 9.7 关于文件的附加说明
- 9.8 处理异常
- 9.9 finally子句
- 9.10 显式地引发一个异常
- 9.11 (选学)堆栈展开和回溯
- 9.12 数据科学入门:使用CSV文件
- 9.13 小结
- 第三部分 Python高级主题
- 第10章 面向对象编程
- 10.1 简介
- 10.2 自定义Account类
- 10.3 属性访问控制
- 10.4 用于数据访问的property
- 10.5 模拟“私有”属性
- 10.6 案例研究:洗牌和分牌模拟
- 10.7 继承:基类和子类
- 10.8 构建继承层次结构:引入多态性
- 10.9 鸭子类型和多态性
- 10.10 运算符重载
- 10.11 异常类层次结构和自定义异常
- 10.12 具名元组
- 10.13 Python 3.7的新数据类简介
- 10.14 使用文档字符串和doctest进行单元测试
- 10.15 命名空间和作用域
- 10.16 数据科学入门:时间序列和简单线性回归
- 10.17 小结
- 第四部分 人工智能、云和大数据案例研究
- 第11章 自然语言处理
- 11.1 简介
- 11.2 TextBlob
- 11.3 使用柱状图和词云可视化词频
- 11.4 使用Textatistic库进行可读性评估
- 11.5 使用spaCy命名实体识别
- 11.6 使用spaCy进行相似性检测
- 11.7 其他NLP库和工具
- 11.8 机器学习和深度学习自然语言应用
- 11.9 自然语言数据集
- 11.10 小结
- 第12章 Twitter数据挖掘
- 12.1 简介
- 12.2 Twitter API概况
- 12.3 创建一个Twitter账户
- 12.4 获取Twitter凭据,创建应用程序
- 12.5 什么是推文
- 12.6 Tweepy
- 12.7 通过Tweepy进行Twitter身份验证
- 12.8 获取一个Twitter账户的相关信息
- 12.9 Tweepy Cursor简介:获得一个账户的关注者和朋友
- 12.10 搜索最新的推文
- 12.11 热门话题发现:Twitter热门话题API
- 12.12 推文分析前的清理或预处理
- 12.13 Twitter流API
- 12.14 推文情感分析
- 12.15 地理编码和映射
- 12.16 存储推文的方法
- 12.17 Twitter和时间序列
- 12.18 小结
- 第13章 IBM Watson和认知计算
- 13.1 简介
- 13.2 IBM云账户和云控制台
- 13.3 Watson服务
- 13.4 额外的服务和工具
- 13.5 Watson开发者云Python SDK
- 13.6 案例研究:旅行者翻译伴侣APP
- 13.7 Watson资源
- 13.8 小结
- 第14章 机器学习:分类、回归和聚类
- 14.1 简介
- 14.2 案例研究:用k近邻算法和Digits数据集进行分类(第1部分)
- 14.3 案例研究:利用k近邻算法和Digits数据集进行分类(第2部分)
- 14.4 案例研究:时间序列和简单线性回归
- 14.5 案例研究:基于加利福尼亚房价数据集的多元线性回归
- 14.6 案例研究:无监督学习(第1部分)—降维
- 14.7 案例研究:无监督学习(第2部分)—k均值聚类
- 14.8 小结
- 第15章 深度学习
- 15.1 简介
- 15.2 Keras内置数据集
- 15.3 自定义Anaconda环境
- 15.4 神经网络
- 15.5 张量
- 15.6 用于视觉的卷积神经网络:使用MNIST数据集进行多分类
- 15.7 用TensorBoard可视化神经网络的训练过程
- 15.8 ConvnetJS:基于浏览器的深度学习训练和可视化
- 15.9 针对序列的递归神经网络:使用IMDb数据集进行情感分析
- 15.10 调整深度学习模型
- 15.11 在ImageNet上预训练的CNN模型
- 15.12 小结
- 第16章 大数据:Hadoop、Spark、NoSQL和IoT
- 16.1 简介
- 16.2 关系数据库和结构化查询语言
- 16.3 NoSQL和NewSQL大数据数据库简述
- 16.4 案例研究:MongoDB JSON文档数据库
- 16.5 Hadoop
- 16.6 Spark
- 16.7 Spark流:使用pyspark-notebook Docker堆栈计算Twitter主题标签
- 16.8 物联网和仪表板
- 16.9 小结
- 索引
展开全部
出版方
机械工业出版社有限公司
机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。