科技
类型
可以朗读
语音朗读
244千字
字数
2022-09-01
发行日期
展开全部
主编推荐语
本书以实际业务场景为例,介绍自然语言处理(NLP)系统开发项目的整个生命周期——从收集数据到部署和监控模型。
内容简介
全书分为四大部分。第一部分概述NLP技术,为全书奠定知识基础。第二部分从实战角度讲解NLP系统的开发要点,内容涉及文本分类、信息提取等。第三部分专注于NLP重点应用的垂直领域:社交媒体、电子商务、医疗行业、金融业等,并辅以Python示例。第四部分将所有知识点融会贯通,并讲解如何利用所学知识部署NLP系统。
目录
- 版权信息
- 版权声明
- O'Reilly Media, Inc.介绍
- 业界评论
- 献词
- 本书赞誉
- 序
- 前言
- 第一部分 基础
- 第1章 自然语言处理概要
- 1.1 真实世界中的自然语言处理
- 1.2 什么是语言
- 1.3 机器学习、深度学习和自然语言处理:概述
- 1.4 自然语言处理方法
- 1.5 自然语言处理演练:对话智能体
- 1.6 小结
- 第2章 自然语言处理流水线
- 2.1 数据获取
- 2.2 文本提取和清洗
- 2.3 预处理
- 2.4 特征工程
- 2.5 建模
- 2.6 评估
- 2.7 建模之后的阶段
- 2.8 使用其他语言
- 2.9 案例研究
- 2.10 小结
- 第3章 文本表示
- 3.1 向量空间模型
- 3.2 基本的向量化方法
- 3.3 分布式表示
- 3.4 词和字符之上的分布式表示
- 3.5 通用文本表示
- 3.6 可视化嵌入
- 3.7 人工特征表示
- 3.8 小结
- 第二部分 核心
- 第4章 文本分类
- 4.1 应用程序
- 4.2 文本分类流水线
- 4.3 一个流水线,多个分类器
- 4.4 在文本分类中使用神经嵌入
- 4.5 用于文本分类的深度学习
- 4.6 解释文本分类模型
- 4.7 无数据或少数据学习和新领域适应
- 4.8 案例研究:企业工单系统
- 4.9 实用建议
- 4.10 小结
- 第5章 信息提取
- 5.1 信息提取应用程序
- 5.2 信息提取任务
- 5.3 信息提取的通用流水线
- 5.4 关键词提取
- 5.5 命名实体识别
- 5.6 命名实体消歧与链接
- 5.7 关系提取
- 5.8 其他高级信息提取任务
- 5.9 案例研究
- 5.10 小结
- 第6章 聊天机器人
- 6.1 聊天机器人的应用
- 6.2 聊天机器人的分类
- 6.3 构建对话系统的流水线
- 6.4 对话系统原理
- 6.5 深入对话系统的组件
- 6.6 其他对话流水线
- 6.7 Rasa NLU
- 6.8 案例研究:食谱推荐
- 6.9 小结
- 第7章 主题简介
- 7.1 搜索和信息检索
- 7.2 主题建模
- 7.3 文本摘要
- 7.4 文本推荐系统
- 7.5 机器翻译
- 7.6 问答系统
- 7.7 小结
- 第三部分 应用
- 第8章 社交媒体
- 8.1 应用
- 8.2 独特的挑战
- 8.3 用于社交平台数据的自然语言处理
- 8.4 模因与虚假新闻
- 8.5 小结
- 第9章 电子商务与零售
- 9.1 电子商务目录
- 9.2 电子商务中的搜索
- 9.3 构建电子商务目录
- 9.4 评论分析
- 9.5 电子商务推荐
- 9.6 小结
- 第10章 医疗、金融和法律
- 10.1 医疗
- 10.2 金融与法律
- 10.3 小结
- 第四部分 综合
- 第11章 端到端自然语言处理系统
- 11.1 重温自然语言处理流水线:部署自然语言处理软件
- 11.2 构建和维护成熟的系统
- 11.3 数据科学过程
- 11.4 让人工智能在组织中取得成功
- 11.5 展望未来
- 11.6 结语
- 关于作者
- 关于封面
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。