DD-VQA的标签对应问题？

Question

DD-VQA的标签对应问题？

Opened this issue 2 months ago · 0 comments

{ "manitupateid_videoid" {
"question_id":{
"question": "Does the image/ the person's eyes/nose/mouth/eyebrows/ look fake?",
"answer":["answer1", "answer2", "..."]
}
}
}

上述中的videoid，能找到FF++视频数据集中的具体视频（比如命名videoid.mp4），但是具体对应视频帧中的那一帧图像对应的人脸呢？虽然是对应同一个视频帧，但是不同帧之间的人脸还是有很大的差异，上述的question和answer是否能够通用呢？