互联网
类型
可以朗读
语音朗读
407千字
字数
2024-05-01
发行日期
展开全部
主编推荐语
多模态大模型技术全景解析,助你掌握部署、微调和优化。
内容简介
本书详尽地覆盖了多模态大模型的算法原理和应用实战,提供了丰富的微调技术细节和实际案例,适合对多模态大模型有兴趣的技术人员深入学习及应用。
本书分为两篇:
算法原理篇。详细介绍了先进的深度学习模型,包括Transformer、GPT系列、深度生成模型,从基本架构、训练方法到特定应用,包括但不限于Seq2Seq结构、位置编码、注意力机制、残差连接、变分自编码器等。此外,探讨了预训练模型的涌现能力、模型参数和通信数据量的估算,以及分布式训练的各种技术,如数据并行、模型并行和混合精度训练等。
应用实战篇。聚焦于深度学习模型的实际应用,特别是文本和图像生成,以及代码生成的应用实战。通过具体实战项目,如利用Stable Diffusion进行图像生成和Code Llama进行代码生成,提供了微调技术的详细细节,介绍了LangChain等大模型应用框架。
目录
- 版权信息
- 前言
- 第一篇 算法原理
- 第1章 Transformer模型
- 1.1 Seq2Seq结构
- 1.2 Transformer模型介绍
- 1.3 ViT模型介绍
- 1.4 本章总结
- 第2章 GPT系列模型
- 2.1 GPT-1
- 2.2 GPT-2
- 2.3 GPT-3
- 2.4 GPT-3.5
- 2.5 GPT-4
- 2.6 语言模型的未来
- 2.7 GPT系列的其他应用
- 2.8 本章总结
- 第3章 深度生成模型
- 3.1 从自编码器到变分自编码器
- 3.2 生成对抗网络
- 3.3 文本与图像的桥梁:CLIP
- 3.4 稳定扩散模型:Stable Diffusion
- 3.5 本章总结
- 第4章 预训练模型
- 4.1 大模型的涌现能力
- 4.2 模型参数量估算
- 4.3 通信数据量分析
- 4.4 分布式训练
- 4.5 DeepSpeed
- 4.6 模型即服务平台
- 4.7 本章总结
- 第二篇 应用实战
- 第5章 文本生成应用实战:利用ChatPDF与文件对话
- 5.1 大模型的落地应用
- 5.2 GLM系列模型
- 5.3 参数高效微调
- 5.4 大语言模型应用框架:LangChain
- 5.5 ChatGLM金融大模型挑战赛
- 5.6 本章总结
- 第6章 文本生成算法实战:DeepSpeed-Chat
- 6.1 ZeRO++
- 6.2 DeepSpeed-Chat快速开始
- 6.3 DeepSpeed-Chat的RLHF训练
- 6.4 DeepSpeed混合引擎
- 6.5 本章总结
- 第7章 图像生成算法实战:Stable Diffusion微调
- 7.1 LoRA参数高效微调技术
- 7.2 用于Diffusers的LoRA微调
- 7.3 Stable Diffusion WebUI
- 7.4 可控扩散模型:ControlNet
- 7.5 本章总结
- 第8章 代码生成算法实战:Code Llama微调
- 8.1 任务介绍
- 8.2 Llama 2
- 8.3 算法竞赛大语言模型
- 8.4 本章总结
- 第9章 综合应用实战:构建“漫画家”生成多模态漫画
- 9.1 应用介绍
- 9.2 功能实现选型
- 9.3 相关模型部署
- 9.4 后端应用搭建
- 9.5 本章总结
展开全部
出版方
机械工业出版社
机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。