DD-VQA的标签对应问题?
Opened this issue · 0 comments
zhaopengpeng8866 commented
{ "manitupateid_videoid" {
"question_id":{
"question": "Does the image/ the person's eyes/nose/mouth/eyebrows/ look fake?",
"answer":["answer1", "answer2", "..."]
}
}
}
上述中的videoid,能找到FF++视频数据集中的具体视频(比如命名videoid.mp4),但是具体对应视频帧中的那一帧图像对应的人脸呢?虽然是对应同一个视频帧,但是不同帧之间的人脸还是有很大的差异,上述的question和answer是否能够通用呢?