随着人工智能的蓬勃发展,如何开展绿色AI助力碳中和,并且在模型参数量那么大的情况下如何利用有限资源进行快速推理,要想解决这些问题都离不开高效的模型部署。这些年虽然深度学习模型的研究与开发取得了长足的进步,但将这些模型部署到实际应用中却依然面临着诸多挑战。
本书的诞生源于对市场的观察与需求的反馈。笔者注意到,在许多深度学习资料中,对于模型部署的讨论相对较少,尤其是在针对特定硬件平台的情况下更是如此。因此,笔者决定撰写这本书,以填补市场上对于深度学习模型部署方面知识的空白。
本书的目标是向读者介绍如何有效地将深度学习模型部署到英伟达(NVIDIA)相关的硬件平台上。笔者将从基础概念出发,逐步引导你了解如何在实际项目中部署深度学习模型。无论你是刚刚入门深度学习领域,还是已经在实践中积累了一定经验,相信本书都将为你提供有价值的信息与指导。
本书github地址:https://github.com/Phoenix8215/A-White-Paper-on-Neural-Network-Deployment
若本书对您有所帮助,请在页面右上角点个 Star ⭐ 支持一下,谢谢~~~。
神经网络部署白皮书(以下简称白皮书)仍在全力更新中,目前只更新了大概30%,后面将添加更多进阶内容,以及大量的实战案例。由于笔者平时也有其他科研任务,所以更新的进度可能不会太快。😶🌫️
白皮书的部分内容为韩博提供的资料,这是他的github
主页https://github.com/kalfazed, https://github.com/kalfazed/tensorrt_starter这个是韩博写的一个开源项目,后面也会对这部分代码进行解读。
白皮书主要分为以下几个板块,CUDA,ONNX,TensorRT,C++,实战内容,还有一些不属于以上各类的文章我就放到杂文里边去了。
- CUDA板块:。。。。。。
本开源书仍在持续更新之中,欢迎参与本项目,一同为读者提供更优质的学习内容。
我的邮箱fengzhe8215@outlook.com
,也可以知乎私信我,我的知乎https://www.zhihu.com/people/fengzhe_love
The texts, code, images, photos, and videos in this repository are licensed under CC BY-NC-SA 4.0.