/data_collection

Here we can collect, clean, and preprocess data for COVID detection project

Primary LanguageJupyter Notebook

data_collection

Here we can collect, clean, and preprocess data for COVID detection project.

Các bạn có thể upload các datasets sau khi đã zip/tar vào phần releases và tag các folders này với tên nguyên bản, thông tin đã làm gì đi kèm, và year_month_day (ví dụ 2021_05_29).

3 notebooks có tên audio-albumentations-torchaudio-audiomentations.ipynb; Explore Data Analysis 1.ipynb; và Explore Data Analysis 2.ipynb

Mình đưa thêm phần EDA bằng R của bạn Đỗ Quang Đạt lên đây để mọi người tiện theo dõi.

Data Preprocessing

1) Coughvid Crowdsourcing dataset

Đây là phần feature extraction của bạn Đạt trên dataset Coughvid Crowndsourcing dataset:

2) Coswara

Đây là phần segmentation cho dataset Coswara trên những data đã có annotation (25/05/2020 - 12/10/2020).

Directory structure:

coswara
└───annotation
│   └─── 20200525
|   └─── 20200604
│   └─── .
│   └─── .
└───audio
    └─── 20200525
    └─── 20200604
    └─── .
    └─── .

Command for segmentation:

python preprocess/coswara/segment_coswara.py --data coswara/audio --ann coswara/annotation/ --outdir segmented_coswara