主编推荐语
快速掌握HuggingFace工具集,掌握自然语言处理项目的研发流程。
内容简介
本书综合性讲解HuggingFace社区提供的工具集datasets和transformers,书中包括最基础的工具集的用例演示,具体的项目实战,以及预训练模型的底层设计思路和实现原理的介绍。通过本书的学习,读者可以快速掌握HuggingFace工具集的使用方法,掌握自然语言处理项目的一般研发流程,并能研发自己的自然语言处理项目。
本书分为3篇共14章:工具集基础用例演示篇(第1~6章),详细讲解HuggingFace工具集的基本使用目的一般流程;预训练模型底层原理篇(第13、14章),详细阐述了预训练模型的设计思路和计算原理。
本书将使用最简单浅显的语言,带领读者快速了解HuggingFace工具集的使用方法。通过本书实战项目的学习,读者可以掌握一般的自然语言处理项目的研发流程。通过本书预训练模型底层原理的学习,读者能够知其然也知其所以然,做到融会贯通。方法;中文项目实战篇(第7~12章),通过几个实战项目演示使用HuggingFace工具集研发自然语言处理项
本书适合有PyTorch编程基础的读者阅读,也适合作为对自然语言处理感兴趣的读者的参考图书。
目录
- 版权信息
- 作者简介
- 内容简介
- 前言
- 本书主要内容
- 阅读建议
- 本书源代码
- 致谢
- 工具集基础用例演示篇
- 第1章HuggingFace简介
- 第2章使用编码工具
- 2.1 编码工具简介
- 2.2 编码工具工作流示意
- 2.3 使用编码工具
- 2.4 小结
- 第3章使用数据集工具
- 3.1 数据集工具介绍
- 3.2 使用数据集工具
- 3.3 小结
- 第4章使用评价指标工具
- 4.1 评价指标工具介绍
- 4.2 使用评价指标工具
- 4.3 小结
- 第5章使用管道工具
- 5.1 管道工具介绍
- 5.2 使用管道工具
- 5.3 小结
- 第6章使用训练工具
- 6.1 训练工具介绍
- 6.2 使用训练工具
- 6.3 小结
- 中文项目实战篇
- 第7章实战任务1:中文情感分类
- 7.1 任务简介
- 7.2 数据集介绍
- 7.3 模型架构
- 7.4 实现代码
- 7.5 小结
- 第8章实战任务2:中文填空
- 8.1 任务简介
- 8.2 数据集介绍
- 8.3 模型架构
- 8.4 实现代码
- 8.5 小结
- 第9章实战任务3:中文句子关系推断
- 9.1 任务简介
- 9.2 数据集介绍
- 9.3 模型架构
- 9.4 实现代码
- 9.5 小结
- 第10章实战任务4:中文命名实体识别
- 10.1 任务简介
- 10.2 数据集介绍
- 10.3 模型架构
- 10.4 实现代码
- 10.5 小结
- 第11章使用TensorFlow训练
- 11.1 任务简介
- 11.2 数据集介绍
- 11.3 模型架构
- 11.4 实现代码
- 11.5 小结
- 第12章使用自动模型
- 12.1 任务简介
- 12.2 数据集介绍
- 12.3 模型架构
- 12.4 实现代码
- 12.5 深入自动模型源代码
- 12.6 小结
- 预训练模型底层原理篇
- 第13章手动实现Transformer
- 13.1 Transformer架构
- 13.2 注意力
- 13.3 位置编码
- 13.4 MASK
- 13.5 Transformer计算流程
- 13.6 简单翻译任务
- 13.7 两数相加任务
- 13.8 小结
- 第14章手动实现BERT
- 14.1 BERT架构
- 14.2 数据集处理
- 14.3 PyTorch提供的Transformer工具层介绍
- 14.4 手动实现BERT模型
- 14.5 小结
出版方
清华大学出版社
清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。