Ковтун В'ячеслав Васильович. Інформаційно-вимірювальна система для автоматичного розпізнавання голосу




  • скачать файл:
  • Название:
  • Ковтун В'ячеслав Васильович. Інформаційно-вимірювальна система для автоматичного розпізнавання голосу
  • Альтернативное название:
  • Ковтун Вячеслав Васильевич. Информационно-измерительная система для автоматического распознавания голоса
  • Кол-во страниц:
  • 200
  • ВУЗ:
  • Вінницький національний технічний ун-т. - Вінниця
  • Год защиты:
  • 2006
  • Краткое описание:
  • Ковтун В'ячеслав Васильович. Інформаційно-вимірювальна система для автоматичного розпізнавання голосу : дис... канд. техн. наук: 05.11.16 / Вінницький національний технічний ун-т. - Вінниця, 2006.








    Ковтун В.В. Інформаційно-вимірювальна система для автоматичного розпізнавання голосу. Рукопис.
    Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.11.16 інформаційно-вимірювальні системи. Вінницький національний технічний університет, Вінниця, 2006.
    Дисертацію присвячено розв’язанню задачі підвищення ефективності інформаційно-вимірювальних систем для розпізнавання голосу.
    Поставленої мети вдалося досягти за рахунок удосконалення математичної моделі слухової системи людини, що дозволило сформулювати новий спосіб представлення індивідуальних ознак для розпізнавання голосу та зменшити імовірності виникнення похибок першого та другого роду при його розпізнаванні за цими ознаками. Розроблено метод ущільнення мовних сигналів з адаптивним періодом дискретизації. Запропоновано метод підвищення інформативності частоти основного тону для розпізнавання голосу, в якому, на відміну від існуючих, за ознаку для розпізнавання використано значення коефіцієнтів вейвлет-перетворення на відрізках мовного сигналу, де спостерігаються екстремуми кореляційних функцій частоти основного тону. Розроблено універсальний метод оцінювання ефективності ІВС для розпізнавання голосу на основі інтегрального функціонально-статистичного критерію.
    На основі запропонованих моделей та методів сформовано алгоритмічні та програмні засоби, які використано в розробленій ІВС для розпізнавання голосу.












    У дисертаційній роботі вирішено актуальну наукову задачу підвищення ефективності ІВС для розпізнавання голосу, що забезпечується аналізом впливу апаратної частини, адекватністю математичних моделей процесу сприйняття мовного сигналу людиною, ефективністю методів виділення з мовного сигналу ознак, за якими можна розпізнати голос, та методами класифікації голосів за цими ознаками.
    Основні наукові та практичні результати дисертаційної роботи такі.


    Вперше запропоновано універсальний метод оцінювання ефективності ІВС для розпізнавання голосу на основі інтегрального функціонально-статистичного критерію, який на відміну від існуючих, використовує для порівняльної оцінки потенційну ІВС для розпізнавання голосу, що дозволяє проводити оцінювання ефективності ІВС для розпізнавання голосу та оптимізувати її структуру на етапі проектування і заощадити кошти тощо.
    Модифіковано математичну модель слухової системи людини, яка на відміну від існуючих, описує механізм оброблення слуховою системою індивідуальних ознак мовних сигналів, що дозволяє підвищити інформативність спектральних ознак та основного тону для розпізнавання голосу.
    Вперше розроблено метод, алгоритм та пристрій ущільнення мовного сигналу, які на відміну від існуючих, використовують адаптивний період дискретизації, залежний від лінійності мовного сигналу, що дозволяє ущільнити wav-файл із заданою похибкою відтворення та збереженням його індивідуальних особливостей в 3-5 разів і зробити це на 45% швидше ніж алгоритм лінійного прогнозу.
    Вперше запропоновано інформативну ознаку для розпізнавання голосів, яка на відміну від існуючих, використовує значення коефіцієнтів вейвлет-перетворення мовного сигналу на відрізках, де спостерігаються екстремуми кореляційних функцій частоти основного тону, що дозволяє комплексно враховувати вплив геометрії артикуляторного тракту та голосового джерела на індивідуальність голосу та досягти достовірності розпізнавання голосів 98% (імовірність виникнення похибок першого роду 1,1%, імовірність виникнення похибок другого роду 1,9%).
    Проведено тестування створеної ІВС за англомовною базою YOHO, сформованою фірмою ITT на замовлення держдепартаменту США. Система показала достовірність розпізнавання 98% (імовірність виникнення похибки першого роду 0,36%, імовірність виникнення похибки другого роду 1,62%).
  • Список литературы:
  • -
  • Стоимость доставки:
  • 150.00 грн


ПОИСК ДИССЕРТАЦИИ, АВТОРЕФЕРАТА ИЛИ СТАТЬИ


Доставка любой диссертации из России и Украины


ПОСЛЕДНИЕ СТАТЬИ И АВТОРЕФЕРАТЫ

ГБУР ЛЮСЯ ВОЛОДИМИРІВНА АДМІНІСТРАТИВНА ВІДПОВІДАЛЬНІСТЬ ЗА ПРАВОПОРУШЕННЯ У СФЕРІ ВИКОРИСТАННЯ ТА ОХОРОНИ ВОДНИХ РЕСУРСІВ УКРАЇНИ
МИШУНЕНКОВА ОЛЬГА ВЛАДИМИРОВНА Взаимосвязь теоретической и практической подготовки бакалавров по направлению «Туризм и рекреация» в Республике Польша»
Ржевский Валентин Сергеевич Комплексное применение низкочастотного переменного электростатического поля и широкополосной электромагнитной терапии в реабилитации больных с гнойно-воспалительными заболеваниями челюстно-лицевой области
Орехов Генрих Васильевич НАУЧНОЕ ОБОСНОВАНИЕ И ТЕХНИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ЭФФЕКТА ВЗАИМОДЕЙСТВИЯ КОАКСИАЛЬНЫХ ЦИРКУЛЯЦИОННЫХ ТЕЧЕНИЙ
СОЛЯНИК Анатолий Иванович МЕТОДОЛОГИЯ И ПРИНЦИПЫ УПРАВЛЕНИЯ ПРОЦЕССАМИ САНАТОРНО-КУРОРТНОЙ РЕАБИЛИТАЦИИ НА ОСНОВЕ СИСТЕМЫ МЕНЕДЖМЕНТА КАЧЕСТВА