catalog / TECHNICAL SCIENCES / Systems and artificial intelligence
скачать файл: 
- title:
- Людовик Тетяна Владленівна. Інформаційна технологія синтезу індивідуалізованого мовлення за текстом
- Альтернативное название:
- Людовик Татьяна Владленовна. Информационная технология синтеза индивидуализированной речи по тексту
- university:
- НАН України ; МОН України; Міжнародний науково-навчальний центр інформаційних технологій та систем. — К
- The year of defence:
- 2006
- brief description:
- Людовик Тетяна Владленівна. Інформаційна технологія синтезу індивідуалізованого мовлення за текстом : Дис... канд. техн. наук: 05.13.23 / НАН України ; МОН України; Міжнародний науково-навчальний центр інформаційних технологій та систем. — К., 2006. — 176арк. : табл. — Бібліогр.: арк. 137-151
Людовик Т.В. Інформаційна технологія синтезу індивідуалізованого мовлення за текстом. Рукопис.
Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.23 системи та засоби штучного інтелекту. Міжнародний науково-навчальний центр інформаційних технологій та систем, Київ, 2006.
Дисертаційне дослідження присвячене розробленню та реалізації інформаційної технології автоматичного озвучення довільних текстів українською мовою з відображенням особливостей голосу та вимови окремих людей. Обґрунтовано принципи та етапи розроблення індивідуальних мовленнєвих баз даних. Проведено акустико-фонетичне дослідження мовленнєвих корпусів, встановлено загальні мовленнєві закономірності на сегментному та просодичному рівнях та виведено загальні моделі вимови, а саме, моделі транскрибування, синтагматичного членування, паузації, тривалостей фонем та інтонування. Розроблено автоматизовані засоби індивідуалізації загальних моделей вимови. Визначено архітектуру системи синтезу індивідуалізованого мовлення за текстом та розроблено відповідну програмну модель. Наведено результати тестування розбірливості та природності синтезованого мовлення.
В рамках дисертаційної роботи розроблено інформаційну технологію синтезу індивідуалізованого мовлення, яка забезпечує якісне озвучення довільних текстів природною мовою з відтворенням голосу та вимови різних дикторів. Основні наукові та практичні результати дисертаційної роботи:
1. Розроблено загальні принципи створення індивідуальних мовленнєвих баз даних: а) принцип фонемності, відповідно до якого в якості елементів МБД і елементів конкатенації під час синтезу мовлення обрано фонеми у сегментному контексті; б) принцип відображення у мовленнєвому матеріалі, на базі якого розробляється МБД, різних функціональних стилів мовлення; в) принцип використання в анотації МБД об’єктивних характеристик мовленнєвих сигналів їх тривалості та поточних значень ЧОТ.
2. Визначено етапи розроблення МБД і відповідно до них розроблено шість експериментальних МБД чоловічих та жіночих голосів.
3. Запропоновано використовувати анотації МБД у двох режимах: а) для попереднього настроювання лінгвістичного процесора на вимову окремого диктора; б) під час синтезу мовлення для аналізу вхідного тексту, створення його індивідуалізованого опису та вибирання з МБД мовленнєвих відрізків, що відповідають цьому описові. Таке використання анотації МБД спрощує процедури пошуку та вибирання потрібних елементів з МБД під час синтезу і, таким чином, дозволяє не звертатись до акустичних файлів.
4. Розроблено комплекс формальних загальних сегментних та просодичних моделей вимови українського мовлення: модель фонемного транскрибування вхідних орфографічних текстів, модель синтагматичного членування тексту, модель паузації, модель тривалостей фонем та модель інтонування.
5. Розроблено процедури індивідуалізації загальних моделей вимови шляхом автоматизованого та автоматичного аналізу інформації, що міститься в індивідуальних МБД. Використання індивідуалізованих моделей вимови у системі синтезу мовлення дозволяє отримувати розбірливе та наближене до природного синтезоване мовлення, оскільки в ньому відтворюються особливості вимови та стилю читання. Водночас, реалізовано можливість генерування мовлення нейтрального стилю із дотриманням орфоепічних норм.
6. Розроблено архітектуру системи синтезу українського мовлення, основними компонентами якої є мовленнєва база даних, лінгвістичний процесор, модуль вибирання елементів з мовленнєвої бази даних та акустичний процесор. Природність синтезованого мовлення забезпечується застосуванням конкатенативного методу, який дозволяє відтворювати особливості голосу та вимови окремої людини завдяки використанню природних мовленнєвих сигналів.
7. Створено програмну експериментальну систему синтезу індивідуалізованого українського мовлення за текстом, в якій реалізовано запропоновану технологію. Розроблено методику тестування розбірливості та природності синтезованого мовлення. Експертами підтверджено прийнятність нової технології.
8. В цілому розроблено технологію синтезу мовлення за текстом, яка дозволяє швидко, в автоматизованому режимі, настроювати систему синтезу мовлення на голоси та вимову різних людей, а також автоматично отримувати розбірливе та наближене до природного синтезоване мовлення.
- Стоимость доставки:
- 125.00 грн