pip install torch==2.0.0 torchvision==0.15.1 torchaudio==2.0.1 --index-url https://download.pytorch.org/whl/cu118
pip install -r requirements.txt
Chúng tôi cung cấp một tập lệnh dự đoán có thể chuyển đổi một tệp âm thanh cụ thể hoặc thậm chí là một danh sách các tệp âm thanh. Hãy xem xét các đối số dưới đây, đặc biệt là đối số -f TEST_FILEPATH
và đối số -s HUGGINGFACE_FOLDER
:
sử dụng: inference.py [-h] -f TEST_FILEPATH [-s HUGGINGFACE_FOLDER] [-d DEVICE_ID]
CÁC ĐỐI SỐ DỰ ĐOÁN ASR
tuỳ chọn đối số:
-h, --help Hiển thị trợ giúp này và thoát
-f TEST_FILEPATH, --test_filepath TEST_FILEPATH
Có thể là đường dẫn đến tệp âm thanh của bạn (.wav, .mp3) hoặc một tệp văn bản (.txt) chứa danh sách các đường dẫn tệp âm thanh.
-s HUGGINGFACE_FOLDER, --huggingface_folder HUGGINGFACE_FOLDER
Thư mục bạn lưu trữ mô hình. Lựa chọn giữa "./models/hanzi" và "./models/pinyin". Tùy thuộc vào đường dẫn, hãy tự thiết lập tham số này
-d DEVICE_ID, --device_id DEVICE_ID
Thiết bị bạn muốn kiểm tra mô hình của mình trên nếu CUDA có sẵn. Nếu không, sử dụng CPU. Giá trị mặc định: 0
python inference.py \
-f path/to/your/audio/file.wav(.mp3) \
-s ./models/pinyin
# output example:
>>> transcript: nà shì kāi shuō kǒu lìng
python inference.py \
-f path/to/your/audio/file.wav(.mp3) \
-s ./models/pinyin
python inference.py \
-f path/to/your/new.txt \
-s ./model/hanzi hoặc (./model/pinyin)