PaddlePaddle/PaddleSeg

VPD模型+下游任务（视觉感知、图像分割、深度估计）

chenjjcccc opened this issue a year ago · 0 comments

chenjjcccc commented a year ago

问题描述 Please describe your issue

VPD模型+下游任务（视觉感知、图像分割、深度估计）

任务描述

任务背景

VPD是结合Diffusion Models的图文预训练模型，可以广泛的应用于下游任务，如视觉感知、图像分割、深度估计等等，且均取得了不错的效果。可以将VPD接入PaddleSeg中，并应用于下游任务中

数据和模型、代码均已经开源。
根据开源代码进行网络结构、评估指标转换，代码链接。
结合论文复现指南和复现指南-新ppsigs/article-implementation/论文复现指南-新.pdf，进行前反向对齐等操作，达到论文Table.1中的指标。
进行TIPC验证lite train lite infer 链条。
参考PR提交规范提交代码PR到ppseg中。

提交内容：

代码提交到PaddleSeg。可参考（#3321）