catalog / TECHNICAL SCIENCES / Computer science, computing and automation
скачать файл:
- title:
- Ковтун В'ячеслав Васильович. Інформаційно-вимірювальна система для автоматичного розпізнавання голосу
- Альтернативное название:
- Ковтун Вячеслав Васильевич. Информационно-измерительная система для автоматического распознавания голоса
- university:
- Вінницький національний технічний ун-т. - Вінниця
- The year of defence:
- 2006
- brief description:
- Ковтун В'ячеслав Васильович. Інформаційно-вимірювальна система для автоматичного розпізнавання голосу : дис... канд. техн. наук: 05.11.16 / Вінницький національний технічний ун-т. - Вінниця, 2006.
Ковтун В.В. Інформаційно-вимірювальна система для автоматичного розпізнавання голосу. Рукопис.
Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.11.16 інформаційно-вимірювальні системи. Вінницький національний технічний університет, Вінниця, 2006.
Дисертацію присвячено розв’язанню задачі підвищення ефективності інформаційно-вимірювальних систем для розпізнавання голосу.
Поставленої мети вдалося досягти за рахунок удосконалення математичної моделі слухової системи людини, що дозволило сформулювати новий спосіб представлення індивідуальних ознак для розпізнавання голосу та зменшити імовірності виникнення похибок першого та другого роду при його розпізнаванні за цими ознаками. Розроблено метод ущільнення мовних сигналів з адаптивним періодом дискретизації. Запропоновано метод підвищення інформативності частоти основного тону для розпізнавання голосу, в якому, на відміну від існуючих, за ознаку для розпізнавання використано значення коефіцієнтів вейвлет-перетворення на відрізках мовного сигналу, де спостерігаються екстремуми кореляційних функцій частоти основного тону. Розроблено універсальний метод оцінювання ефективності ІВС для розпізнавання голосу на основі інтегрального функціонально-статистичного критерію.
На основі запропонованих моделей та методів сформовано алгоритмічні та програмні засоби, які використано в розробленій ІВС для розпізнавання голосу.
У дисертаційній роботі вирішено актуальну наукову задачу підвищення ефективності ІВС для розпізнавання голосу, що забезпечується аналізом впливу апаратної частини, адекватністю математичних моделей процесу сприйняття мовного сигналу людиною, ефективністю методів виділення з мовного сигналу ознак, за якими можна розпізнати голос, та методами класифікації голосів за цими ознаками.
Основні наукові та практичні результати дисертаційної роботи такі.
Вперше запропоновано універсальний метод оцінювання ефективності ІВС для розпізнавання голосу на основі інтегрального функціонально-статистичного критерію, який на відміну від існуючих, використовує для порівняльної оцінки потенційну ІВС для розпізнавання голосу, що дозволяє проводити оцінювання ефективності ІВС для розпізнавання голосу та оптимізувати її структуру на етапі проектування і заощадити кошти тощо.
Модифіковано математичну модель слухової системи людини, яка на відміну від існуючих, описує механізм оброблення слуховою системою індивідуальних ознак мовних сигналів, що дозволяє підвищити інформативність спектральних ознак та основного тону для розпізнавання голосу.
Вперше розроблено метод, алгоритм та пристрій ущільнення мовного сигналу, які на відміну від існуючих, використовують адаптивний період дискретизації, залежний від лінійності мовного сигналу, що дозволяє ущільнити wav-файл із заданою похибкою відтворення та збереженням його індивідуальних особливостей в 3-5 разів і зробити це на 45% швидше ніж алгоритм лінійного прогнозу.
Вперше запропоновано інформативну ознаку для розпізнавання голосів, яка на відміну від існуючих, використовує значення коефіцієнтів вейвлет-перетворення мовного сигналу на відрізках, де спостерігаються екстремуми кореляційних функцій частоти основного тону, що дозволяє комплексно враховувати вплив геометрії артикуляторного тракту та голосового джерела на індивідуальність голосу та досягти достовірності розпізнавання голосів 98% (імовірність виникнення похибок першого роду 1,1%, імовірність виникнення похибок другого роду 1,9%).
Проведено тестування створеної ІВС за англомовною базою YOHO, сформованою фірмою ITT на замовлення держдепартаменту США. Система показала достовірність розпізнавання 98% (імовірність виникнення похибки першого роду 0,36%, імовірність виникнення похибки другого роду 1,62%).
- Стоимость доставки:
- 150.00 грн