mightyzau/RegionBLIP

bounding boxz在原图上的可视化带有偏移

Opened this issue · 1 comments

感谢您对Region10M数据的开源,但是我用vis.py进行可视化时,发现bounding box在图上几乎都是带有偏移的结果,与论文第12页Figure 7的展示有差异,
比如下面这个例子:
1)这是我的可视化结果
img
2)这个是论文中的结果
微信图片_20230808105208
请问您是否对原图做了一些crop之类的处理后再去用SAM提取bounding box?或者有其他的原因导致了差异的产生?

@mengqiDyangge 感谢对我们工作的关注,这个问题应该是下载方式导致图片大小不一致的问题。

关于CC3M和CC12M的图片获取方式,我们采用的BLIP2的下载脚本:
https://github.com/salesforce/LAVIS/blob/main/lavis/datasets/download_scripts/DownloadConceptualCaptions/README.md