关于数据集预处理阶段的几个问题
Opened this issue · 1 comments
rizentan commented
您好,目前我之修改了数据集和保存.pkl文件的路径,在预处理的时候遇到了以下几个问题原因呢?
-
dataset/fish_audio_dataset.py
执行load_noise
方法时,dur1 = librosa.get_duration(y, sample)
行提示get_duration
期望0个参数,但实际传递了2个参数。 -
dataset/unified_dataset.py
执行collate_fn
方法时,vf_all = torch.stack([data['video_form_all'] for data in batch])
行 报了video_form_all
键时在数据字典中不存在的错误,是否因为在__getitem__
方法中没有相应的代码保存video_form_all
相关的数据。 -
dataset文件夹
就像问题2中提到的,好几个.py文件中调用save_pickle
方法的代码都被注释了,实际在数据处理的时候应该取消注释吗?另外,我该怎么添加问题2中保存到save_path_all
路径下.pkl文件的代码。
FishMaster93 commented
你好,第一个问题是因为下面是把噪声数据和原采样音频混合的,下面注释掉了,你把注释掉的恢复就行了。
第二个第三个都是因为代码里面把读和存方法写一起了,现在是读已经存好的pickel文件了,你把读的代码注释掉,把存的代码恢复就是一开始对原始视频存成pickel了