seorim0/DCCRN-with-various-loss-functions

안녕하세요~

Closed this issue · 2 comments

hgh21 commented
안녕하세요~

데이터는 제가 편의상 noisy, clean을 하나의 numpy 파일로 만들어서 썼어요!
대략적으로 코드로 나타내면 아래와 같습니다.

dataset = []
for i in range(data_num):  # data_num = the number of speech data
    dataset.append([noisy_data, clean_data])

그리고 굳이 .npy를 만들 필요없이 wavfile을 바로 불러오셔도 되는데,
그 경우에는 dataloader.py의 getitem(self, idx)를 아래와 같이 수정하여 쓰시면 됩니다.

    def __getitem__(self, idx):
        # read the wav
        inputs = addr2wav(self.noisy_dirs[idx])
        targets = addr2wav(self.clean_dirs[idx])

        # transform to torch from numpy
        inputs = torch.from_numpy(inputs)
        targets = torch.from_numpy(targets)

        # (-1, 1)
        inputs = torch.clamp_(inputs, -1, 1)
        targets = torch.clamp_(targets, -1, 1)

        return inputs, targets

메일로 질문 내용이 남아있어서 답변드려요 :)

hgh21 commented

감사합니다~