00 DSpace/Manakin Repository

Порівняння трансформерів і GAN у системах TTS

Показати скорочений опис матеріалу

dc.contributor.author Федорук, Н. С.
dc.contributor.author Плахтій, Євген Георгійович
dc.date.accessioned 2026-01-13T12:27:46Z
dc.date.available 2026-01-13T12:27:46Z
dc.date.issued 2025-04-17
dc.identifier.citation Федорук Н. С. Порівняння трансформерів і GAN у системах TTS / Н. С. Федорук, Є. Г. Плахтій // Матеріали VІ наук.-практ. конф. студ., аспірантів і молодих вчених (Дніпро, 17 квіт. 2025 р.) : зб. тез. – Дніпро, 2025. – С. 261-263. uk_UA
dc.identifier.uri http://srd.pgasa.dp.ua:8080/xmlui/handle/123456789/16637
dc.description.abstract UK: Синтез мовлення (TTS, text-to-speech) – технологія, що переводить текст у штучно згенерований голос, наближений до природного. Сучасні TTS використовуються в голосових асистентах (Siri, Alexa, Google Assistant) та доступних технологіях для користувачів із вадами зору. Завдяки розвитку глибокого навчання з’явилися два основні підходи: трансформери та генеративні змагальні мережі (GAN). Трансформери, спочатку успішні в NLP, зараз використовують для моделювання послідовностей символів або фонем з довготерміновими залежностями. GAN, що здобули популярність у генерації зображень, тепер адаптовані для аудіо – генератор створює сигнал, а дискримінатор перевіряє його реалістичність. Обидва підходи важливі для досягнення натурального і виразного синтезованого мовлення, хоча кожен має свої сильні та слабкі сторони. uk_UA
dc.language.iso uk uk_UA
dc.publisher Український державний університет науки і технологій uk_UA
dc.publisher ННІ "Придніпровська державна академія будівництва та архітектури"
dc.subject синтез мовлення uk_UA
dc.title Порівняння трансформерів і GAN у системах TTS uk_UA
dc.type Article uk_UA


Долучені файли

Даний матеріал зустрічається у наступних фондах

Показати скорочений опис матеріалу