5. Inference

Question

5. Inference

Closed this issue a year ago · 11 comments

Mas, ini kenapa ya error bagian display(AUDIO())?

Model: https://huggingface.co/spaces/zomehwh/vits-models/blob/main/pretrained_models/alice/alice.pth (Blue Archive: Tendou Arisu)

Error logs:

[18:58:20] INFO     [18:58:20] Version: 3.14.1                    

---------------------------------------------------------------------------

ValueError                                Traceback (most recent call last)

[<ipython-input-20-26778c592e41>](https://localhost:8080/#) in <cell line: 12>()
     10 get_ipython().system('svc infer {AUDIO}.wav -m {MODEL} -na -t {PITCH}')
     11 # Try comment this line below if you got Runtime Error
---> 12 display(Audio(f"/content/{AUDIO}.out.wav", autoplay=True, rate=22050))

2 frames

[/usr/local/lib/python3.10/dist-packages/IPython/lib/display.py](https://localhost:8080/#) in _validate_and_normalize_with_numpy(data, normalize)
    157         waveobj = wave.open(fp,mode='wb')
    158         waveobj.setnchannels(nchan)
--> 159         waveobj.setframerate(rate)
    160         waveobj.setsampwidth(2)
    161         waveobj.setcomptype('NONE','NONE')

ValueError: could not convert string to float: '/content//content/separated/htdemucs/audio/vocals.out.wav'

Answer 1 · 2023-05-09T19:02:32.000Z

itu form confignya mana kok ilang

Answer 2 · 2023-05-09T19:06:00.000Z

itu form confignya mana kok ilang

Sengaja saya hilangkan soalnya pakai repository model yang berbeda, saya ambil dari https://huggingface.co/spaces/zomehwh/vits-models/tree/main/pretrained_models/alice, nah di repository itu ga ada confignya makanya saya hilangkan takutnya hasilnya ga sesuai.

Apakah pakai model yang berbeda tapi pakai config yg sudah disediakan bisa mas?

Answer 3 · 2023-05-09T19:12:11.000Z

harusnya cari model yang sesuai tutorku, bukan malah codenya yang dirubah. Dan itu beda model ya, model yang kupake ditutor itu "so-vits" sedangkan model yang kamu download itu "vits". "so-vits" itu Voice Convertion sedangkan "vits" itu TTS (Text to Speech). kalo mau pake codeku harus model yg sovits, yang ada config.jsonnya

Answer 4 · 2023-05-09T19:16:30.000Z

btw itu displaynya error karena ga ada yg didisplay (inferencenya gagal)

Answer 5 · 2023-05-09T19:18:18.000Z

harusnya cari model yang sesuai tutorku, bukan malah codenya yang dirubah. Dan itu beda model ya, model yang kupake ditutor itu "so-vits" sedangkan model yang kamu download itu "vits". "so-vits" itu Voice Convertion sedangkan "vits" itu TTS (Text to Speech). kalo mau pake codeku harus model yg sovits, yang ada config.jsonnya

Ohh baru tau saya beda.

Sekarang saya mencoba kembali menggunakan repository yang versi sovits-models tetap error yang sama mas, kira kira salah di mana ya padahal sudah mengikuti tutorialnya?.
Repo: https://huggingface.co/spaces/zomehwh/sovits-models
Model: https://huggingface.co/spaces/zomehwh/sovits-models/blob/main/models/alice/alice.pth
Config: https://huggingface.co/spaces/zomehwh/sovits-models/blob/main/models/alice/config.json
My notebook: https://colab.research.google.com/drive/1IPrayG2xJZuUP6yp9n8s0bFOOmJyZsnH?usp=sharing

Answer 6 · 2023-05-09T19:56:08.000Z

Itu download pake wget kah? Coba arahin cursormu ke file pth di direktori kiri. Brp size filenya

Answer 7 · 2023-05-09T21:47:31.000Z

Itu download pake wget kah? Coba arahin cursormu ke file pth di direktori kiri. Brp size filenya

file path direktori yang mana mas? soalnya banyak

Answer 8 · 2023-05-09T21:54:53.000Z

File pth dlm so vits test

Answer 9 · 2023-05-09T22:03:14.000Z

File pth dlm so vits test

Ga ada tombol properties buat lihat file sizenya, ini lgsg dari web huggingface, untuk config.jsonnya 1.67 kB

Answer 10 · 2023-05-09T23:29:46.000Z

Sepertinya sudah solved mas, kayaknya ini saya salah link di wget buat download config sama modelnya, sebelumnya pakai link front-end, sekarang udah solved setelah saya ganti jadi link download dari model dan confignya, makasih banyak mas 🙏

Answer 11 · 2023-05-10T03:11:29.000Z

Sudah kuduga