关于数据集预处理阶段的几个问题

Question

Opened this issue 4 months ago · 1 comments

您好，目前我之修改了数据集和保存.pkl文件的路径，在预处理的时候遇到了以下几个问题原因呢？

dataset/fish_audio_dataset.py
执行load_noise方法时，dur1 = librosa.get_duration(y, sample)行提示get_duration期望0个参数，但实际传递了2个参数。
dataset/unified_dataset.py
执行collate_fn方法时，vf_all = torch.stack([data['video_form_all'] for data in batch])行报了video_form_all键时在数据字典中不存在的错误，是否因为在__getitem__方法中没有相应的代码保存video_form_all相关的数据。
dataset文件夹
就像问题2中提到的，好几个.py文件中调用save_pickle方法的代码都被注释了，实际在数据处理的时候应该取消注释吗？另外，我该怎么添加问题2中保存到save_path_all路径下.pkl文件的代码。

Answer 1 · 2024-05-13T10:15:57.000Z

你好，第一个问题是因为下面是把噪声数据和原采样音频混合的，下面注释掉了，你把注释掉的恢复就行了。
第二个第三个都是因为代码里面把读和存方法写一起了，现在是读已经存好的pickel文件了，你把读的代码注释掉，把存的代码恢复就是一开始对原始视频存成pickel了