您好呀

Question

Closed this issue 9 months ago · 3 comments

非常棒的工作，请问您在训练的时候是采用A100系列还是RTX4090系列进行训练的？您在分布式训练的时候使用了多少张卡？每张卡显存占了多少呀?

Answer 1 · 2024-04-12T06:21:13.000Z

感谢您的关注～我们所有实验均在A100上进行，卡数 = batch size，每个数据集的batch size在论文中有叙述，不同的卡数可能会对最终的训练结果有影响。显存受到分辨率的影响，调小分辨率可以减少显存，但性能可能也会下降。

Answer 2 · 2024-04-12T08:31:14.000Z

#感谢您的回复，还有一个小问题想请问您一下，你baseline具体的结构是怎样子的呢，您方便告知一下嘛？

Answer 3 · 2024-04-13T07:07:59.000Z

baseline的结构为一个融合特征的encoder，temporal decoder以及spatial decoder（也就是没有context mining）