/speakerpy

πŸ”Š SpeakerPy - лСгкая ΠΈ мощная Python-Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ° для синтСза Ρ€Π΅Ρ‡ΠΈ! πŸ’¬ Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ ΠΌΠΎΠ΄Π΅Π»ΠΈ Silero TTS для высококачСствСнного Π·Π²ΡƒΠΊΠ°. πŸŽ™οΈ ΠžΠ·Π²ΡƒΡ‡ΠΈΠ²Π°Π΅Ρ‚ числа, английскиС слова ΠΈ Ρ€Π°Π·Π±ΠΈΠ²Π°Π΅Ρ‚ тСкст Π½Π° части. πŸš€ Π Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ ΠΎΡ„Π»Π°ΠΉΠ½, сохраняСт Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ Π² MP3. 🎧 ИдСально ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΈΡ‚ для ΠΎΠ·Π²ΡƒΡ‡ΠΊΠΈ Π°ΡƒΠ΄ΠΈΠΎΠΊΠ½ΠΈΠ³, подкастов ΠΈ мноТСства Π΄Ρ€ΡƒΠ³ΠΈΡ… Π·Π°Π΄Π°Ρ‡! 🌐

Primary LanguagePython

SpeakerPy

SpeakerPy - это Python-Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ° для синтСза Ρ€Π΅Ρ‡ΠΈ, основанная Π½Π° модСлях Silero Text-to-Speech.

logo

Π’ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Π΅ сфСры примСнСния SpeakerPy

SpeakerPy ΠΏΡ€Π΅Π΄Π»Π°Π³Π°Π΅Ρ‚ ряд возмоТностСй для синтСза Ρ€Π΅Ρ‡ΠΈ, Ρ‡Ρ‚ΠΎ Π΄Π΅Π»Π°Π΅Ρ‚ Π΅Π³ΠΎ ΠΏΠΎΠ»Π΅Π·Π½Ρ‹ΠΌ инструмСнтом для Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ ΠΈ сфСр Π΄Π΅ΡΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ. НиТС ΠΏΡ€ΠΈΠ²Π΅Π΄Π΅Π½Ρ‹ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρ‹ областСй, Π³Π΄Π΅ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ использовано ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅ SpeakerPy:

  1. ΠžΠ±Ρ€Π°Π·ΠΎΠ²Π°Π½ΠΈΠ΅: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ для озвучивания ΡƒΡ‡Π΅Π±Π½Ρ‹Ρ… ΠΌΠ°Ρ‚Π΅Ρ€ΠΈΠ°Π»ΠΎΠ², Ρ‚Π°ΠΊΠΈΡ… ΠΊΠ°ΠΊ Π»Π΅ΠΊΡ†ΠΈΠΈ, ΡΡ‚Π°Ρ‚ΡŒΠΈ ΠΈ ΠΊΠ½ΠΈΠ³ΠΈ, Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΌΠΎΠΆΠ΅Ρ‚ студСнтам ΠΈ прСподаватСлям Π»Π΅Π³Ρ‡Π΅ Π²ΠΎΡΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Ρ‚ΡŒ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ ΠΈ ΡΠΊΠΎΠ½ΠΎΠΌΠΈΡ‚ΡŒ врСмя.

  2. Аудиокниги: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ использован для создания Π°ΡƒΠ΄ΠΈΠΎΠΊΠ½ΠΈΠ³ ΠΈΠ· тСкстовых Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚ΠΎΠ², Ρ‡Ρ‚ΠΎ ΠΎΠ±Π»Π΅Π³Ρ‡ΠΈΡ‚ доступ ΠΊ Π»ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΡƒΡ€Π΅ для людСй с ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½Π½Ρ‹ΠΌΠΈ возмоТностями ΠΈ Ρ‚Π΅Ρ…, ΠΊΡ‚ΠΎ ΠΏΡ€Π΅Π΄ΠΏΠΎΡ‡ΠΈΡ‚Π°Π΅Ρ‚ ΡΠ»ΡƒΡˆΠ°Ρ‚ΡŒ, Π° Π½Π΅ Ρ‡ΠΈΡ‚Π°Ρ‚ΡŒ.

  3. ΠŸΠΎΠ΄ΠΊΠ°ΡΡ‚Ρ‹ ΠΈ Ρ€Π°Π΄ΠΈΠΎ: SpeakerPy ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ для создания подкастов ΠΈ Ρ€Π°Π΄ΠΈΠΎΠΏΠ΅Ρ€Π΅Π΄Π°Ρ‡ Π½Π° основС тСкстовых ΠΌΠ°Ρ‚Π΅Ρ€ΠΈΠ°Π»ΠΎΠ², Ρ‚Π°ΠΊΠΈΡ… ΠΊΠ°ΠΊ новости, ΡΡ‚Π°Ρ‚ΡŒΠΈ ΠΈΠ»ΠΈ Π±Π»ΠΎΠ³ΠΈ.

  4. Π”ΠΎΡΡ‚ΡƒΠΏΠ½ΠΎΡΡ‚ΡŒ: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΏΠΎΠ»Π΅Π·Π½Ρ‹ΠΌ для Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΉ ΠΈ Π²Π΅Π±-сайтов с Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ Text-to-Speech, Ρ‡Ρ‚ΠΎ ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΡ‚ ΡΠ΄Π΅Π»Π°Ρ‚ΡŒ ΠΊΠΎΠ½Ρ‚Π΅Π½Ρ‚ доступным для людСй с Π½Π°Ρ€ΡƒΡˆΠ΅Π½ΠΈΡΠΌΠΈ зрСния ΠΈΠ»ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠΌΠΈ ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½Π½Ρ‹ΠΌΠΈ возмоТностями.

  5. ΠžΠ·Π²ΡƒΡ‡ΠΈΠ²Π°Π½ΠΈΠ΅ Π²ΠΈΠ΄Π΅ΠΎ: SpeakerPy ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ для автоматичСского озвучивания Π²ΠΈΠ΄Π΅ΠΎΠΌΠ°Ρ‚Π΅Ρ€ΠΈΠ°Π»ΠΎΠ², Ρ‚Π°ΠΊΠΈΡ… ΠΊΠ°ΠΊ ΠΏΡ€Π΅Π·Π΅Π½Ρ‚Π°Ρ†ΠΈΠΈ, ΠΎΠ±ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠ΅ Π²ΠΈΠ΄Π΅ΠΎ ΠΈΠ»ΠΈ Π΄Π°ΠΆΠ΅ ΠΊΠΎΡ€ΠΏΠΎΡ€Π°Ρ‚ΠΈΠ²Π½Ρ‹Π΅ Ρ€ΠΎΠ»ΠΈΠΊΠΈ.

  6. Π˜Π½ΠΎΡΡ‚Ρ€Π°Π½Π½Ρ‹Π΅ языки: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ использован для озвучивания тСкстов Π½Π° иностранных языках, Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΠ·ΡƒΡ‡Π°ΡŽΡ‰ΠΈΠΌ язык Π»ΡƒΡ‡ΡˆΠ΅ ΠΏΠΎΠ½ΡΡ‚ΡŒ ΠΏΡ€ΠΎΠΈΠ·Π½ΠΎΡˆΠ΅Π½ΠΈΠ΅ ΠΈ ΠΈΠ½Ρ‚ΠΎΠ½Π°Ρ†ΠΈΡŽ.

  7. НавигационныС систСмы: SpeakerPy ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒ Π² Π½Π°Π²ΠΈΠ³Π°Ρ†ΠΈΠΎΠ½Π½Ρ‹Ρ… систСмах ΠΈ голосовых ΠΏΠΎΠΌΠΎΡ‰Π½ΠΈΠΊΠ°Ρ… для автоматичСского озвучивания ΠΌΠ°Ρ€ΡˆΡ€ΡƒΡ‚ΠΎΠ², инструкций ΠΈ Π΄Ρ€ΡƒΠ³ΠΎΠΉ ΠΏΠΎΠ»Π΅Π·Π½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ.

  8. ВСхничСская ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠ°: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΈΠ½Ρ‚Π΅Π³Ρ€ΠΈΡ€ΠΎΠ²Π°Π½ Π² систСмы тСхничСской ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠΈ для автоматичСского озвучивания ΠΎΡ‚Π²Π΅Ρ‚ΠΎΠ² Π½Π° часто Π·Π°Π΄Π°Π²Π°Π΅ΠΌΡ‹Π΅ вопросы ΠΈΠ»ΠΈ инструкций ΠΏΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡŽ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌ.

  9. ΠœΠ°Ρ€ΠΊΠ΅Ρ‚ΠΈΠ½Π³ ΠΈ Ρ€Π΅ΠΊΠ»Π°ΠΌΠ°: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ использован для создания голосовых объявлСний, ΠΏΡ€ΠΎΠΌΠΎ-Ρ€ΠΎΠ»ΠΈΠΊΠΎΠ² ΠΈ ΠΏΡ€Π΅Π·Π΅Π½Ρ‚Π°Ρ†ΠΈΠΉ, Ρ‡Ρ‚ΠΎ ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΡ‚ ΡΡΠΊΠΎΠ½ΠΎΠΌΠΈΡ‚ΡŒ врСмя ΠΈ срСдства Π½Π° ΠΎΠ·Π²ΡƒΡ‡ΠΈΠ²Π°Π½ΠΈΠ΅ ΠΏΡ€ΠΎΡ„Π΅ΡΡΠΈΠΎΠ½Π°Π»ΡŒΠ½Ρ‹ΠΌΠΈ Π΄ΠΈΠΊΡ‚ΠΎΡ€Π°ΠΌΠΈ.

  10. ΠœΠ΅Π΄ΠΈΡ†ΠΈΠ½Π°: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ‚ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒΡΡ для озвучивания мСдицинских тСкстов, инструкций ΠΏΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΡŽ лСкарств ΠΈΠ»ΠΈ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² диагностики, Ρ‡Ρ‚ΠΎ упростит восприятиС ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ для ΠΏΠ°Ρ†ΠΈΠ΅Π½Ρ‚ΠΎΠ² ΠΈ мСдицинских спСциалистов.

  11. Наука ΠΈ исслСдования: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ для озвучивания Π½Π°ΡƒΡ‡Π½Ρ‹Ρ… статСй, Π΄ΠΎΠΊΠ»Π°Π΄ΠΎΠ² ΠΈ ΠΊΠΎΠ½Ρ„Π΅Ρ€Π΅Π½Ρ†ΠΈΠΉ, Ρ‡Ρ‚ΠΎ ΠΎΠ±Π»Π΅Π³Ρ‡ΠΈΡ‚ доступ ΠΊ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ для ΡƒΡ‡Π΅Π½Ρ‹Ρ… ΠΈ исслСдоватСлСй.

  12. ΠšΠ°ΡΡ‚ΠΎΠΌΠΈΠ·Π°Ρ†ΠΈΡ голосовых ассистСнтов: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ использован для кастомизации голоса Π²ΠΈΡ€Ρ‚ΡƒΠ°Π»ΡŒΠ½Ρ‹Ρ… ассистСнтов, Ρ‚Π°ΠΊΠΈΡ… ΠΊΠ°ΠΊ Siri, Google Assistant ΠΈΠ»ΠΈ Alexa, Ρ‡Ρ‚ΠΎ ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΡ‚ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»ΡΠΌ Π²Ρ‹Π±ΠΈΡ€Π°Ρ‚ΡŒ голосовыС ΠΎΠΏΡ†ΠΈΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΈΠΌ большС нравятся.

  13. Π—Π°ΠΌΠ΅Π½Π° голоса: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ для смСны голоса Π² ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΡ… аудиозаписях, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€ для Π°Π½ΠΎΠ½ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ подкастов ΠΈΠ»ΠΈ ΠΈΠ½Ρ‚Π΅Ρ€Π²ΡŒΡŽ.

  14. ВСкстовыС Ρ€Π΅Π΄Π°ΠΊΡ‚ΠΎΡ€Ρ‹: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΈΠ½Ρ‚Π΅Π³Ρ€ΠΈΡ€ΠΎΠ²Π°Π½ Π² тСкстовыС Ρ€Π΅Π΄Π°ΠΊΡ‚ΠΎΡ€Ρ‹ для прСдоставлСния Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ Text-to-Speech, Ρ‡Ρ‚ΠΎ ΠΏΠΎΠΌΠΎΠΆΠ΅Ρ‚ Π°Π²Ρ‚ΠΎΡ€Π°ΠΌ ΠΈ Ρ€Π΅Π΄Π°ΠΊΡ‚ΠΎΡ€Π°ΠΌ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΡΡ‚ΡŒ свои тСксты Π½Π° ошибки ΠΈ стилистичСскиС нСточности.

Π­Ρ‚ΠΈ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρ‹ лишь Ρ‡Π°ΡΡ‚ΡŒ возмоТностСй примСнСния SpeakerPy. Благодаря своСй гибкости ΠΈ ΠΌΠΎΡ‰Π½Ρ‹ΠΌ функциям, SpeakerPy ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ Π°Π΄Π°ΠΏΡ‚ΠΈΡ€ΠΎΠ²Π°Π½ для использования Π² самых Ρ€Π°Π·Π½ΠΎΠΎΠ±Ρ€Π°Π·Π½Ρ‹Ρ… сфСрах ΠΈ отраслях, Π³Π΄Π΅ трСбуСтся ΡΠΈΠ½Ρ‚Π΅Π·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Ρ€Π΅Ρ‡ΡŒ ΠΈΠ· тСкста. ΠžΡ‚ ΠΌΠ°Ρ€ΠΊΠ΅Ρ‚ΠΈΠ½Π³Π° ΠΈ Ρ€Π΅ΠΊΠ»Π°ΠΌΡ‹ Π΄ΠΎ ΠΌΠ΅Π΄ΠΈΡ†ΠΈΠ½Ρ‹ ΠΈ Π½Π°ΡƒΠΊΠΈ, SpeakerPy ΠΌΠΎΠΆΠ΅Ρ‚ ΡΡ‚Π°Ρ‚ΡŒ ΠΏΠΎΠ»Π΅Π·Π½Ρ‹ΠΌ инструмСнтом для Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊΠΎΠ², спСциалистов ΠΏΠΎ ΠΊΠΎΠ½Ρ‚Π΅Π½Ρ‚Ρƒ ΠΈ ΠΊΠΎΠ½Π΅Ρ‡Π½Ρ‹Ρ… ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Π΅ΠΉ.

Π’ Ρ†Π΅Π»ΠΎΠΌ, возмоТности использования SpeakerPy ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½Ρ‹ лишь Ρ„Π°Π½Ρ‚Π°Π·ΠΈΠ΅ΠΉ ΠΈ потрСбностями ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½Ρ‹Ρ… ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Π΅ΠΉ ΠΈΠ»ΠΈ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΎΠ². Благодаря своСй ΡƒΠ½ΠΈΠ²Π΅Ρ€ΡΠ°Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ ΠΈ простотС использования, SpeakerPy ΠΌΠΎΠΆΠ΅Ρ‚ Π½Π°ΠΉΡ‚ΠΈ своС мСсто Π² самых Ρ€Π°Π·Π½Ρ‹Ρ… областях ΠΈ ΠΏΠΎΠΌΠΎΡ‡ΡŒ Ρ€Π΅ΡˆΠ°Ρ‚ΡŒ самыС Ρ€Π°Π·Π½ΠΎΠΎΠ±Ρ€Π°Π·Π½Ρ‹Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ.

ΠžΡΠΎΠ±Π΅Π½Π½ΠΎΡΡ‚ΠΈ ΠΈ прСимущСства SpeakerPy

  • Вранскрипция чисСл ΠΈ английских слов: SpeakerPy способСн ΠΎΠ·Π²ΡƒΡ‡ΠΈΠ²Π°Ρ‚ΡŒ числа ΠΈ английскиС слова Ρ‡Π΅Ρ€Π΅Π· Ρ‚Ρ€Π°Π½ΡΠΊΡ€ΠΈΠΏΡ†ΠΈΡŽ.
  • Π‘ΠΈΠ½Ρ‚Π΅Π· Π±ΠΎΠ»ΡŒΡˆΠΈΡ… объСмов тСкста: SpeakerPy ΠΌΠΎΠΆΠ΅Ρ‚ ΡΠΈΠ½Ρ‚Π΅Π·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ большиС ΠΎΠ±ΡŠΠ΅ΠΌΡ‹ тСкста Π±Π΅Π· ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌ.
  • ΠšΠΎΡ€Ρ€Π΅ΠΊΡ‚Π½ΠΎΠ΅ Π΄Π΅Π»Π΅Π½ΠΈΠ΅ тСкста Π½Π° куски: благодаря использованию Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠΈ nltk, SpeakerPy ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚Π½ΠΎ Π΄Π΅Π»ΠΈΡ‚ большиС тСксты Π½Π° прСдлоТСния.
  • ΠšΠ΅ΡˆΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ синтСзированного тСкста: SpeakerPy синтСзируСт ΠΈ Ρ…Ρ€Π°Π½ΠΈΡ‚ тСкст ΠΏΠΎ кускам, Ρ‡Ρ‚ΠΎ позволяСт ΠΊΠ΅ΡˆΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΡƒΠΆΠ΅ Ρ€Π°Π½Π΅Π΅ синтСзированный тСкст ΠΈ ΠΈΠ·Π±Π΅ΠΆΠ°Ρ‚ΡŒ ΠΏΠΎΠ²Ρ‚ΠΎΡ€Π½ΠΎΠ³ΠΎ синтСзирования.
  • Π Π°Π±ΠΎΡ‚Π° Π² Π°Π²Ρ‚ΠΎΠ½ΠΎΠΌΠ½ΠΎΠΌ Ρ€Π΅ΠΆΠΈΠΌΠ΅: SpeakerPy синтСзируСт Π·Π²ΡƒΠΊ локально, Π±Π΅Π· ΠΏΠΎΠ΄ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΡ ΠΊ ΠΈΠ½Ρ‚Π΅Ρ€Π½Π΅Ρ‚Ρƒ, Ρ‡Ρ‚ΠΎ позволяСт ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π΅Π³ΠΎ Π² Π°Π²Ρ‚ΠΎΠ½ΠΎΠΌΠ½ΠΎΠΌ Ρ€Π΅ΠΆΠΈΠΌΠ΅.
  • Π‘ΠΎΡ…Ρ€Π°Π½Π΅Π½ΠΈΠ΅ синтСзированного тСкста Π² MP3: SpeakerPy прСдоставляСт Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ ΡΠΎΡ…Ρ€Π°Π½ΡΡ‚ΡŒ синтСзированный тСкст Π² Ρ„ΠΎΡ€ΠΌΠ°Ρ‚Π΅ MP3.

Установка

БистСмныС трСбования

  • 2 Π“Π‘ ΠžΠ—Π£

Установка Ρ‡Π΅Ρ€Π΅Π· pip

SpeakerPy ΠΌΠΎΠΆΠ½ΠΎ ΡƒΡΡ‚Π°Π½ΠΎΠ²ΠΈΡ‚ΡŒ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ pip:

pip install speakerpy

Установка ΠΈ запуск Ρ‡Π΅Ρ€Π΅Π· Docker

Π‘ΠΊΠ°Ρ‡Π°Ρ‚ΡŒ ΠΎΠ±Ρ€Π°Π·

docker pull xable/speakerpy

Π‘ΠΎΠ±Ρ€Π°Ρ‚ΡŒ ΠΎΠ±Ρ€Π°Π·(вСсит 8.27GB):

make docker-build

Π—Π°ΠΏΡƒΡΡ‚ΠΈΡ‚ΡŒ ΠΎΠ±Ρ€Π°Π·:

make docker-run

ИспользованиС CLI

β•°β”€βž€  python -m speakerpy --help
usage: __main__.py [-h] -l {ru,en} -f FILE -t {mp3,speak} [-sr SAMPLE_RATE] [-s SPEED] [-n NAME_TEXT] [-a AUDIO_DIR]

πŸŽ™οΈ SpeakerPy: CLI для синтСза Ρ€Π΅Ρ‡ΠΈ с использованиСм SpeakerPy πŸŽ™οΈ

options:
  -h, --help            show this help message and exit
  -l {ru,en}, --language {ru,en} 
                        Π―Π·Ρ‹ΠΊ синтСза (ru | en)
  -f FILE, --file FILE  ΠŸΡƒΡ‚ΡŒ ΠΊ Ρ„Π°ΠΉΠ»Ρƒ с тСкстом для озвучивания
  -t {mp3,speak}, --type_out {mp3,speak}
                        Каким ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ вывСсти синтСзированный тСкст (mp3 | speak)
  -sr SAMPLE_RATE, --sample_rate SAMPLE_RATE
                        Частота дискрСтизации (ΠΏΠΎ ΡƒΠΌΠΎΠ»Ρ‡Π°Π½ΠΈΡŽ: 48000)
  -s SPEED, --speed SPEED
                        Π‘ΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ чтСния (ΠΏΠΎ ΡƒΠΌΠΎΠ»Ρ‡Π°Π½ΠΈΡŽ: 1.0)
  -n NAME_TEXT, --name_text NAME_TEXT
                        Имя для тСкста, с Ρ‚Π°ΠΊΠΈΠΌ ΠΈΠΌΠ΅Π½Π΅ΠΌ сохранится ΠΈΡ‚ΠΎΠ³ΠΎΠ²Ρ‹ΠΉ mp3 Ρ„Π°ΠΉΠ» (ΠΏΠΎ ΡƒΠΌΠΎΠ»Ρ‡Π°Π½ΠΈΡŽ: имя Ρ„Π°ΠΉΠ»Π° с тСкстом)
  -a AUDIO_DIR, --audio_dir AUDIO_DIR
                        Папка для сохранСния Π³ΠΎΡ‚ΠΎΠ²Ρ‹Ρ… Π°ΡƒΠ΄ΠΈΠΎ Ρ„Π°ΠΉΠ»ΠΎΠ² (ΠΏΠΎ ΡƒΠΌΠΎΠ»Ρ‡Π°Π½ΠΈΡŽ: тСкущая ΠΏΠ°ΠΏΠΊΠ°)

ΠŸΡ€ΠΈΠΌΠ΅Ρ€Ρ‹ использования:
  python -m speakerpy -l ru -t speak -f ./books/example.txt -s 1.2;
  python -m speakerpy -l ru -t mp3 -f ./books/example.txt;
  python -m speakerpy -l en -t speak -f ./books/example.txt;
  python -m speakerpy -l en -t mp3 -f ./books/example.txt;

ΠžΡΠ½ΠΎΠ²Π½Ρ‹Π΅ ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚Ρ‹

ΠŸΡ€ΠΎΠ΅ΠΊΡ‚ состоит ΠΈΠ· Π΄Π²ΡƒΡ… основных ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚ΠΎΠ²: Lib Speak ΠΈ Lib SL Text.

Lib Speak

Lib Speak Π²ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚ классы Speaker ΠΈ SpeakerBase для синтСза Ρ€Π΅Ρ‡ΠΈ с использованиСм ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Silero. ΠžΡΠ½ΠΎΠ²Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ класса Speaker:

  1. speak: произнСсСниС тСкста.
  2. to_mp3: конвСртация тСкста Π² Π°ΡƒΠ΄ΠΈΠΎΡ„Π°ΠΉΠ» MP3.

ΠŸΡ€ΠΈΠΌΠ΅Ρ€ использования Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ speak

from lib_speak import Speaker
from lib_sl_text import SeleroText

text = SeleroText("ΠŸΡ€ΠΈΠΌΠ΅Ρ€ тСкста для синтСза Ρ€Π΅Ρ‡ΠΈ")
speaker = Speaker(model_id="ru_v3", language="ru", speaker="aidar", device="cpu")
speaker.speak(text=text, sample_rate=48000, speed=1.0)

ΠŸΡ€ΠΈΠΌΠ΅Ρ€ использования Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ to_mp3

from lib_speak import Speaker
from lib_sl_text import SeleroText

text = SeleroText("ΠŸΡ€ΠΈΠΌΠ΅Ρ€ тСкста для синтСза Ρ€Π΅Ρ‡ΠΈ")
speaker = Speaker(model_id="ru_v3", language="ru", speaker="aidar", device="cpu")
speaker.to_mp3(text=text, name_text="ВСкст", sample_rate=48000, audio_dir=pathlib.Path(__file__).parent.parent / "mp3", speed=1.0)

Lib SL Text

Lib SL Text содСрТит класс SeleroText для ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ тСкста ΠΏΠ΅Ρ€Π΅Π΄ синтСзом Ρ€Π΅Ρ‡ΠΈ. Основной ΠΌΠ΅Ρ‚ΠΎΠ΄ класса SeleroText:

  1. chunk: Ρ€Π°Π·Π΄Π΅Π»Π΅Π½ΠΈΠ΅ тСкста Π½Π° Π±Π»ΠΎΠΊΠΈ.

ИспользованиС класса SeleroText

text = SeleroText("ΠŸΡ€ΠΈΠ²Π΅Ρ‚, ΠΌΠΈΡ€!", to_language="ru")

Π Π°Π·Π΄Π΅Π»Π΅Π½ΠΈΠ΅ тСкста Π½Π° куски с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° chunk():

for chunk in text.chunk():
    print(chunk)

РСсурсы ΠΈ ссылки