Please use this identifier to cite or link to this item:
http://srd.pgasa.dp.ua:8080/xmlui/handle/123456789/16637| Title: | Порівняння трансформерів і GAN у системах TTS |
| Authors: | Федорук, Н. С. Плахтій, Євген Георгійович |
| Keywords: | синтез мовлення |
| Issue Date: | 17-Apr-2025 |
| Publisher: | Український державний університет науки і технологій ННІ "Придніпровська державна академія будівництва та архітектури" |
| Citation: | Федорук Н. С. Порівняння трансформерів і GAN у системах TTS / Н. С. Федорук, Є. Г. Плахтій // Матеріали VІ наук.-практ. конф. студ., аспірантів і молодих вчених (Дніпро, 17 квіт. 2025 р.) : зб. тез. – Дніпро, 2025. – С. 261-263. |
| Abstract: | UK: Синтез мовлення (TTS, text-to-speech) – технологія, що переводить текст у штучно згенерований голос, наближений до природного. Сучасні TTS використовуються в голосових асистентах (Siri, Alexa, Google Assistant) та доступних технологіях для користувачів із вадами зору. Завдяки розвитку глибокого навчання з’явилися два основні підходи: трансформери та генеративні змагальні мережі (GAN). Трансформери, спочатку успішні в NLP, зараз використовують для моделювання послідовностей символів або фонем з довготерміновими залежностями. GAN, що здобули популярність у генерації зображень, тепер адаптовані для аудіо – генератор створює сигнал, а дискримінатор перевіряє його реалістичність. Обидва підходи важливі для досягнення натурального і виразного синтезованого мовлення, хоча кожен має свої сильні та слабкі сторони. |
| URI: | http://srd.pgasa.dp.ua:8080/xmlui/handle/123456789/16637 |
| Appears in Collections: | Наукові статті |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| Fedoruk.pdf | 404,86 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.