catalog / TECHNICAL SCIENCES / Automated control systems and progressive information technologies
скачать файл: 
- title:
- Прокопенко Костянтин Ігорович. Розробка методів аналізу, розпізнавання та стиснення нестаціонарних звукових сигналів
- Альтернативное название:
- Прокопенко Константин Игоревич. Разработка методов анализа, распознавания и сжатия нестационарных звуковых сигналов
- university:
- Національний авіаційний ун- т. — К
- The year of defence:
- 2006
- brief description:
- Прокопенко Костянтин Ігорович. Розробка методів аналізу, розпізнавання та стиснення нестаціонарних звукових сигналів : Дис... канд. техн. наук: 05.13.06 / Національний авіаційний ун- т. — К., 2006. — 138арк. — Бібліогр.: арк. 121-128.
Прокопенко К.І. «Розробка методів аналізу, розпізнавання та стиснення нестаціонарних звукових сигналів». - Рукопис.Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.06 автоматизовані системи управління та прогресивні інформаційні технології. Національний авіаційний університет, Київ, 2005.
Дисертацію присвячено розробці методів та алгоритмів сегментації, розпізнавання та стиснення нестаціонарних звукових сигналів для забезпечення більш ефективного застосування каналів зв'язку, засобів документування мовних сигналів а також систем моніторингу шумового забруднення навколишнього середовища. Проведено аналіз існуючих методів стиснення нестаціонарних звукових сигналів. Запропоновано модель нестаціонарного звукового сигналу, запропоновані параметричний та непараметричний алгоритми сегментації звукових сигналів, розроблені алгоритми розпізнавання мовних сигналів та стиснення нестаціонарних звукових сигналів. Розроблено програмний комплекс, в основу якого покладено запропоновані в роботі обчислювальні схеми та алгоритмі.
У дисертації теоретично узагальнено і розв’язано наукове завдання, яке має важливе значення для побудови інформаційних систем і полягає у розробці нових ефективних методів обробки сигналів звукового діапазону.
Найбільш істотні наукові і практичні результати дисертаційної роботи:
1. Запропонована математична модель НЗС є адекватною до реальних об’єктів (мовні повідомлення в каналах зв’язку, звукові сигнали в системах охорони та шумового моніторингу, допплерівські метеорадіолокаційні сигнали) і створює аналітичну базу для побудови ефективних методів та синтезу алгоритмів аналізу та обробки НЗС. Експериментальні дослідження розподілів логарифмів спектральних потужностей НЗС на фрагментах локальної стаціонарності підтверджує обґрунтованість їх апроксимації гаусівським розподілом в моделі ЕЗС.
2. Параметричний та непараметричний ранговий методи сегментації, що розроблені в дисертації, є ефективними для вирішення класу задач, пов’язаних з виявленням моментів розладки. Аналітичні вирази для порогу прийняття рішення, що отримані під час дослідження, дозволяють розрахувати імовірність похибок першого роду.
3. Алгоритм розпізнавання звуків мови, що розроблений в дисертації, забезпечує високу імовірність (не меншу за 90%) правильного розпізнавання при коливаннях частоти основного тону в межах 100-200 Гц. Це дозволяє використовувати його для розробки голосового інтерфейсу.
4. Задача розпізнавання окремих команд та інших складних акустичних подій найбільш ефективно вирішується методом аналізу сонограми. Такий результат досягається, в першу чергу, завдяки урахуванню динаміки зміни частотних характеристик із плином часу, а також завдяки механізмам нормалізації та сегментації реалізації звукового повідомлення.
5. Проаналізовано основні підходи, які використовуються при вирішенні задач стиснення НЗС. Розроблено нові методи стиснення звукових сигналів:
- модифікація методу логарифмічної дельта-модуляції дозволяє стиснення цифрової реалізації НЗС із частотою дискретизації 44 кГц розрядністю 16 біт у 5 разів без істотних втрат якості (не більше 15% похибки за критерієм середньоквадратичного відхилення);
- метод стиснення, заснований на бінарному розбитті інтервалів аналізу і представленні мовного сигналу на підінтервалах розбиття за ортогональними базисами дозволяє стиснення цифрової реалізації НЗС із частотою дискретизації 44 кГц розрядністю 16 біт у 12 разів без істотних втрат якості (не більше 15% похибки за критерієм середньоквадратичного відхилення);
- найбільш ефективним за критерієм середньоквадратичного відхилення є метод представлення мовного сигналу в базисі власних функції кореляційного оператора (базис Карунена-Лоева), проте він вимагає значної кількості складних обчислень, що ускладнює процес побудови програмних та апаратних засобів стиснення НЗС.
6. Розроблений апаратно-програмний комплекс SoftModel дозволяє виконувати наступні операції з НЗС:
- експериментальні дослідження сигналів звукового діапазону та їх статистичних характеристик;
- визначення ділянок локальної стаціонарності та моментів розладки;
- ідентифікація ЕЗС на ділянках локальної стаціонарності;
- розпізнавання акустичних подій шляхом аналізу сонограми;
- стиснення звукових сигналів методами, що запропоновані в дисертаційній роботі.
Комплекс може бути використаний для проведення порівняльного аналізу ефективності методів стиснення, дослідження реальних сигналів і методів їх обробки, а також для проведення лабораторних робіт під час навчального процесу.
- Стоимость доставки:
- 125.00 грн