科技
类型
可以朗读
语音朗读
75千字
字数
2023-06-01
发行日期
展开全部
主编推荐语
图解NPU算法、架构与实现,教你从零开始设计一个能用、好用的产品级加速器。
内容简介
本书是一本讲解NPU硬件架构设计与技术实现的著作。作者将自己在CPU、GPU和NPU领域15年的软硬件工作经验融会贯通,将四代NPU架构设计经验融为一体,将端侧和云侧NPU架构合二为一,总结并提炼出本书内容。
本书主要讨论神经网络硬件层面,尤其是芯片设计层面的内容,主要包含神经网络的分析、神经网络加速器的设计以及具体实现技术。
通过阅读本书,你可以深入了解主流的神经网络结构,掌握如何从零开始设计一个能用、好用的产品级加速器。
目录
- 版权信息
- 前言
- 第1章 卷积神经网络
- 1.1 神经网络的结构
- 1.2 GCN
- 1.3 网络的基本块
- 1.4 网络的算子
- 1.5 网络参数量与运算量
- 1.6 加速器编程模型
- 1.7 硬件加速器架构分类
- 第2章 运算子系统的设计
- 2.1 数据流设计
- 2.2 算力与带宽
- 2.2.1 算力与输入带宽
- 2.2.2 算力与输出带宽
- 2.3 卷积乘法阵列
- 2.3.1 Conv算法详解
- 2.3.2 NVDLA的乘法阵列
- 2.3.3 TPU的乘法阵列
- 2.3.4 GPU的乘法阵列
- 2.3.5 华为DaVinci的乘法阵列
- 2.4 卷积运算顺序的选择
- 2.5 池化模块的设计
- 第3章 存储子系统的设计
- 3.1 存储子系统概述
- 3.1.1 存储子系统的组成
- 3.1.2 内部缓存的设计
- 3.2 数据格式的定义
- 3.2.1 特征图的格式
- 3.2.2 权重的格式
- 第4章 架构优化技术
- 4.1 运算精度的选择
- 4.1.1 dynamic fixed point类型
- 4.1.2 bfloat16类型
- 4.2 硬件资源的复用
- 4.2.1 FC
- 4.2.2 de-Conv
- 4.2.3 dilate Conv
- 4.2.4 group Conv
- 4.2.5 3D Conv
- 4.2.6 TC Conv
- 4.2.7 3D Pool
- 4.2.8 Up Sample Pooling
- 4.2.9 多个加速器的级联
- 4.3 Winograd算法和FFT算法
- 4.3.1 Winograd算法解析
- 4.3.2 FFT算法解析
- 4.4 除法变乘法
- 4.5 LUT的使用
- 4.6 宏块并行技术
- 4.7 减少软件配置时间
- 4.8 软件优化技术
- 4.9 一些激进的优化技术
- 第5章 安全与防护
- 5.1 安全技术
- 5.2 安全性评估
- 5.3 防护
- 第6章 神经网络加速器的实现
- 6.1 乘法器的设计
- 6.1.1 整型乘法器的设计
- 6.1.2 浮点运算器的设计
- 6.2 数字电路常见基本块的设计
- 6.3 时序优化
- 6.4 低功耗设计
- 第7章 盘点与展望
- 7.1 AI加速器盘点
- 7.2 Training加速器
- 7.3 展望
- 后记
展开全部
出版方
机械工业出版社
机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。