English | ็ฎไฝไธญๆ | เคนเคฟเคจเฅเคฆเฅ | ๆฅๆฌ่ช | ํ๊ตญ์ธ | Pัฬััะบะธะน ัะทัฬะบ
Installation | Documents | Quick Start | API Docs | Release Notes
โก๏ธFastDeploy is an Easy-to-use and High Performance AI model deployment toolkit for Cloud, Mobile and Edge with ๐ฆout-of-the-box and unified experience, ๐end-to-end optimization for over ๐ฅ160+ Text, Vision, Speech and Cross-modal AI models. Including image classification, object detection, OCR, face detection, matting, pp-tracking, NLP, stable diffusion, TTS and other tasks to meet developers' industrial deployment needs for multi-scenario, multi-hardware and multi-platform.
-
โจโจโจ In 2023.01.17 we released YOLOv8 for deployment on FastDeploy series hardware, which includes Paddle YOLOv8 and ultralytics YOLOv8
- You can deploy Paddle YOLOv8 on Intel CPU, NVIDIA GPU, Jetson, Phytium, Kunlunxin, HUAWEI Ascend ,ARM CPU RK3588 and Sophgo TPU. Both Python deployments and C++ deployments are included.
- You can deploy ultralytics YOLOv8 on Intel CPU, NVIDIA GPU, Jetson. Both Python deployments and C++ deployments are included
- Fastdeploy supports quick deployment of multiple models, including YOLOv8, PP-YOLOE+, YOLOv5 and other models
-
Serving deployment combined with VisualDL supports visual deployment. After the VDL service is started in the FastDeploy container, you can modify the model configuration, start/manage the model service, view performance data, and send requests on the VDL interface. For details, see related documents
-
โจ๐ฅโจ Community
- Slack๏ผJoin our Slack community and chat with other community members about ideas
- Wechat๏ผScan the QR code below using WeChat, follow the PaddlePaddle official account and fill out the questionnaire to join the WeChat group, and share the deployment industry implementation pain points with the community developers
X86_64 CPU | |||||||
NVDIA GPU | |||||||
Phytium CPU | |||||||
KunlunXin XPU | |||||||
Huawei Ascend NPU | |||||||
Graphcore IPU | |||||||
Sophgo | |||||||
Intel graphics card | |||||||
Jetson | |||||||
ARM CPU | |||||||
RK3588 etc. | |||||||
RV1126 etc. | |||||||
Amlogic | |||||||
NXP |
- โด๏ธ A Quick Start for Python SDK
- โด๏ธ A Quick Start for C++ SDK
- Installation
- How to Install Prebuilt Library
- How to Build GPU Deployment Environment
- How to Build CPU Deployment Environment
- How to Build IPU Deployment Environment
- How to Build KunlunXin XPU Deployment Environment
- How to Build RV1126 Deployment Environment
- How to Build RKNPU2 Deployment Environment
- How to Build A311D Deployment Environment
- How to build Huawei Ascend Deployment Environment
- How to Build FastDeploy Library on Nvidia Jetson Platform
- How to Build FastDeploy Android C++ SDK
- Quick Start
- Demos on Different Backends
- Serving Deployment
- API Documents
- Performance Tune-up
- FAQ
- More FastDeploy Deploy Modules
- Model list
- ๐ Developer Contributions
A Quick Start for Python SDK(click to fold)
- CUDA >= 11.2 ใcuDNN >= 8.0 ใ Python >= 3.6
- OS: Linux x86_64/macOS/Windows 10
pip install fastdeploy-gpu-python -f https://www.paddlepaddle.org.cn/whl/fastdeploy.html
conda config --add channels conda-forge && conda install cudatoolkit=11.2 cudnn=8.2
pip install fastdeploy-python -f https://www.paddlepaddle.org.cn/whl/fastdeploy.html
- Prepare model and picture
wget https://bj.bcebos.com/paddlehub/fastdeploy/ppyoloe_crn_l_300e_coco.tgz
tar xvf ppyoloe_crn_l_300e_coco.tgz
wget https://gitee.com/paddlepaddle/PaddleDetection/raw/release/2.4/demo/000000014439.jpg
- Test inference results
# For deployment of GPU/TensorRT, please refer to examples/vision/detection/paddledetection/python
import cv2
import fastdeploy.vision as vision
im = cv2.imread("000000014439.jpg")
model = vision.detection.PPYOLOE("ppyoloe_crn_l_300e_coco/model.pdmodel",
"ppyoloe_crn_l_300e_coco/model.pdiparams",
"ppyoloe_crn_l_300e_coco/infer_cfg.yml")
result = model.predict(im)
print(result)
vis_im = vision.vis_detection(im, result, score_threshold=0.5)
cv2.imwrite("vis_image.jpg", vis_im)
A Quick Start for C++ SDK(click to expand)
- Please refer to C++ Prebuilt Libraries Download
- Prepare models and pictures
wget https://bj.bcebos.com/paddlehub/fastdeploy/ppyoloe_crn_l_300e_coco.tgz
tar xvf ppyoloe_crn_l_300e_coco.tgz
wget https://gitee.com/paddlepaddle/PaddleDetection/raw/release/2.4/demo/000000014439.jpg
- Test inference results
// For GPU/TensorRT deployment, please refer to examples/vision/detection/paddledetection/cpp
#include "fastdeploy/vision.h"
int main(int argc, char* argv[]) {
namespace vision = fastdeploy::vision;
auto im = cv::imread("000000014439.jpg");
auto model = vision::detection::PPYOLOE("ppyoloe_crn_l_300e_coco/model.pdmodel",
"ppyoloe_crn_l_300e_coco/model.pdiparams",
"ppyoloe_crn_l_300e_coco/infer_cfg.yml");
vision::DetectionResult res;
model.Predict(&im, &res);
auto vis_im = vision::VisDetection(im, res, 0.5);
cv::imwrite("vis_image.jpg", vis_im);
return 0;
}
For more deployment models, please refer to Vision Model Deployment Examples .
Notes: โ : already supported; โ: to be supported in the future; N/A: Not Available;
Server-side and cloud model list(click to fold)
Task | Model | Linux | Linux | Win | Win | Mac | Mac | Linux | Linux | Linux | Linux | Linux | Linux | Linux |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
--- | --- | X86 CPU | NVIDIA GPU | X86 CPU | NVIDIA GPU | X86 CPU | Arm CPU | AArch64 CPU | Phytium D2000 aarch64 | NVIDIA Jetson | Graphcore IPU | kunlunxin XPU | Huawei Ascend | Serving |
Classification | PaddleClas/ResNet50 | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Classification | TorchVison/ResNet | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Classification | ltralytics/YOLOv5Cls | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Classification | PaddleClas/PP-LCNet | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Classification | PaddleClas/PP-LCNetv2 | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Classification | PaddleClas/EfficientNet | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Classification | PaddleClas/GhostNet | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Classification | PaddleClas/MobileNetV1 | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Classification | PaddleClas/MobileNetV2 | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Classification | PaddleClas/MobileNetV3 | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Classification | PaddleClas/ShuffleNetV2 | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Classification | PaddleClas/SqueeezeNetV1.1 | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Classification | PaddleClas/Inceptionv3 | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Classification | PaddleClas/PP-HGNet | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Detection | ๐ฅ๐ฅPaddleDetection/PP-YOLOE+ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Detection | ๐ฅPaddleDetection/YOLOv8 | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Detection | ๐ฅultralytics/YOLOv8 | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Detection | PaddleDetection/PicoDet | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Detection | PaddleDetection/YOLOX | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Detection | PaddleDetection/YOLOv3 | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Detection | PaddleDetection/PP-YOLO | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Detection | PaddleDetection/PP-YOLOv2 | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Detection | PaddleDetection/Faster-RCNN | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Detection | PaddleDetection/Mask-RCNN | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Detection | Megvii-BaseDetection/YOLOX | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Detection | WongKinYiu/YOLOv7 | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Detection | WongKinYiu/YOLOv7end2end_trt | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Detection | WongKinYiu/YOLOv7end2end_ort | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Detection | meituan/YOLOv6 | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Detection | ultralytics/YOLOv5 | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Detection | WongKinYiu/YOLOR | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Detection | WongKinYiu/ScaledYOLOv4 | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Detection | ppogg/YOLOv5Lite | โ | โ | โ | โ | โ | โ | โ | โ | โ | ? | โ | โ | โ |
Detection | RangiLyu/NanoDetPlus | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Perception | Paddle3D/Smoke | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
KeyPoint | PaddleDetection/TinyPose | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
KeyPoint | PaddleDetection/PicoDet + TinyPose | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
HeadPose | omasaht/headpose | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Tracking | PaddleDetection/PP-Tracking | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
OCR | PaddleOCR/PP-OCRv2 | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
OCR | PaddleOCR/PP-OCRv3 | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Segmentation | PaddleSeg/PP-LiteSeg | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Segmentation | PaddleSeg/PP-HumanSegLite | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Segmentation | PaddleSeg/HRNet | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Segmentation | PaddleSeg/PP-HumanSegServer | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Segmentation | PaddleSeg/Unet | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Segmentation | PaddleSeg/Deeplabv3 | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
FaceDetection | biubug6/RetinaFace | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
FaceDetection | Linzaer/UltraFace | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
FaceDetection | deepcam-cn/YOLOv5Face | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
FaceDetection | insightface/SCRFD | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
FaceAlign | Hsintao/PFLD | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
FaceAlign | Single430/FaceLandmark1000 | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
FaceAlign | jhb86253817/PIPNet | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
FaceRecognition | insightface/ArcFace | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
FaceRecognition | insightface/CosFace | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
FaceRecognition | insightface/PartialFC | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
FaceRecognition | insightface/VPL | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Matting | ZHKKKe/MODNet | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Matting | PeterL1n/RobustVideoMatting | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Matting | PaddleSeg/PP-Matting | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Matting | PaddleSeg/PP-HumanMatting | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Matting | PaddleSeg/ModNet | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Video Super-Resolution | PaddleGAN/BasicVSR | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Video Super-Resolution | PaddleGAN/EDVR | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Video Super-Resolution | PaddleGAN/PP-MSVSR | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Information Extraction | PaddleNLP/UIE | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | |
NLP | PaddleNLP/ERNIE-3.0 | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ | โ |
Speech | PaddleSpeech/PP-TTS | โ | โ | โ | โ | โ | โ | โ | โ | โ | -- | โ | โ | โ |
Mobile and Edge Model List๏ผclick to fold๏ผ
Task | Model | Size(MB) | Linux | Android | Linux | Linux | Linux | Linux | Linux | TBD ... |
---|---|---|---|---|---|---|---|---|---|---|
--- | --- | --- | ARM CPU | ARM CPU | Rockchip NPU RK3588/RK3568/RK3566 |
Rockchip NPU RV1109/RV1126/RK1808 |
Amlogic NPU A311D/S905D/C308X |
NXP NPU i.MX 8M Plus |
TBD... | |
Classification | PaddleClas/ResNet50 | 98 | โ | โ | โ | โ | ||||
Classification | PaddleClas/PP-LCNet | 11.9 | โ | โ | โ | โ | -- | -- | -- | |
Classification | PaddleClas/PP-LCNetv2 | 26.6 | โ | โ | โ | โ | -- | -- | -- | |
Classification | PaddleClas/EfficientNet | 31.4 | โ | โ | โ | โ | -- | -- | -- | |
Classification | PaddleClas/GhostNet | 20.8 | โ | โ | โ | โ | -- | -- | -- | |
Classification | PaddleClas/MobileNetV1 | 17 | โ | โ | โ | โ | -- | -- | -- | |
Classification | PaddleClas/MobileNetV2 | 14.2 | โ | โ | โ | โ | -- | -- | -- | |
Classification | PaddleClas/MobileNetV3 | 22 | โ | โ | โ | โ | โ | โ | -- | |
Classification | PaddleClas/ShuffleNetV2 | 9.2 | โ | โ | โ | โ | -- | -- | -- | |
Classification | PaddleClas/SqueezeNetV1.1 | 5 | โ | โ | โ | โ | -- | -- | -- | |
Classification | PaddleClas/Inceptionv3 | 95.5 | โ | โ | โ | โ | -- | -- | -- | |
Classification | PaddleClas/PP-HGNet | 59 | โ | โ | โ | โ | -- | -- | -- | |
Detection | PaddleDetection/PicoDet_s | 4.9 | โ | โ | โ | โ | โ | โ | -- | |
Detection | YOLOv5 | โ | โ | โ | โ | โ | โ | -- | ||
Face Detection | deepinsight/SCRFD | 2.5 | โ | โ | โ | -- | -- | -- | -- | |
Keypoint Detection | PaddleDetection/PP-TinyPose | 5.5 | โ | โ | โ | โ | โ | โ | -- | |
Segmentation | PaddleSeg/PP-LiteSeg(STDC1) | 32.2 | โ | โ | โ | -- | -- | -- | -- | |
Segmentation | PaddleSeg/PP-HumanSeg-Lite | 0.556 | โ | โ | โ | -- | -- | -- | -- | |
Segmentation | PaddleSeg/HRNet-w18 | 38.7 | โ | โ | โ | -- | -- | -- | -- | |
Segmentation | PaddleSeg/PP-HumanSeg | 107.2 | โ | โ | โ | -- | -- | -- | -- | |
Segmentation | PaddleSeg/Unet | 53.7 | โ | โ | โ | -- | -- | -- | -- | |
Segmentation | PaddleSeg/Deeplabv3 | 150 | โ | โ | โ | |||||
OCR | PaddleOCR/PP-OCRv2 | 2.3+4.4 | โ | โ | โ | -- | -- | -- | -- | |
OCR | PaddleOCR/PP-OCRv3 | 2.4+10.6 | โ | โ | โ | โ | โ | โ | -- |
Web and mini program model list(click to fold)
Task | Model | web_demo |
---|---|---|
--- | --- | Paddle.js |
Detection | FaceDetection | โ |
Detection | ScrewDetection | โ |
Segmentation | PaddleSeg/HumanSeg | โ |
Object Recognition | GestureRecognition | โ |
Object Recognition | ItemIdentification | โ |
OCR | PaddleOCR/PP-OCRv3 | โ |
We sincerely appreciate the open-sourced capabilities in EasyEdge as we adopt it for the SDK generation and download in this project.
FastDeploy is provided under the Apache-2.0.