ВИДІЛЕННЯ РУКОПИСНОГО ТЕКСТУ НА ЗОБРАЖЕННЯХ БЛАНКІВ ПОШТОВОЇ ДОКУМЕНТАЦІЇ ДЛЯ ОПТИМІЗАЦІЇ ТЕХНОЛОГІЧНИХ ПРОЦЕСІВ ОБРОБЛЕННЯ ПОШТИ



Название:
ВИДІЛЕННЯ РУКОПИСНОГО ТЕКСТУ НА ЗОБРАЖЕННЯХ БЛАНКІВ ПОШТОВОЇ ДОКУМЕНТАЦІЇ ДЛЯ ОПТИМІЗАЦІЇ ТЕХНОЛОГІЧНИХ ПРОЦЕСІВ ОБРОБЛЕННЯ ПОШТИ
Тип: Автореферат
Краткое содержание:

ОСНОВНИЙ ЗМІСТ РОБОТИ


 


У вступі обґрунтована актуальність теми досліджень, наукова новизна, практичне значення отриманих результатів, дано інші необхідні характеристики роботи.


В першому розділі проведено аналіз технологічних процесів оброблення поштової документації, інструкції з обліку поштових відправлень та поштової документації, поштових переказів, періодичних видань, виплат пенсій та грошової допомоги.


Встановлено, що бланки поштових документів мають низку особливостей, які ускладнюють впровадження систем автоматизації в технологічні процеси опрацювання пошти та поштової документації. По-перше, з метою спрощення споживання послуг поштового зв’язку, не висуваються жорсткі вимоги до того якого кольору чорнилами заповнюються бланк поштового документа, у свою чергу самі бланки можуть бути надруковані або чорними типографським фарбами, або довільними кольоровими. По-друге, бланки поштових документів можуть мати специфічну структуру, наприклад, з метою запобігання внесенню змін сума переказу прописом вказується в спеціальному розлініяному полі. Така специфічна структура практично виключає використання відомих методів виділення текстів у документах.


Проведений аналіз методів та алгоритмів попереднього оброблення, нормалізації та сегментації показав, що загальної теорії оброблення цифрових зображень текстових документів не існує. Більшість досліджень у цій області зосереджені на вирішенні специфічних прикладних задач у певній предметній області. Методи та алгоритми попереднього оброблення, нормалізації та сегментації, мають обмежені можливості та призначені для вирішенні специфічних прикладних задач.


Практично всі методи, які використовуються у системах оптичного розпізнавання символів, мають апріорні (емпіричні) параметри, що вимагає попереднього налаштував застосувань щодо сегментації та розпізнавання текстових символів з урахуванням особливостей предметної області. Налаштування алгоритмів, сегментації ускладнюється відсутністю об’єктивних методів оцінювання якості сегментації.


На сьогодні не існує методів виділення тексту та сегментації зображень специфічних бланків поштових документів (наприклад з розлініяних полів бланків поштового переказу) для подальшого використання в системах автоматизації оброблення поштової кореспонденції.


Отже актуальною проблемою є розроблення нових методів виділення тексту у специфічних бланках поштових документів з незначною обчислювальною складністю.


Для досягнення поставленої мети необхідно вирішити такі завдання:


-          Розробити метод класифікації зображень бланків поштових документів за колірним контентом;


-          Розробити ефективний метод видалення завад у цифрових зображеннях бланків поштових документів;


-          Розробити ефективний метод виділення рукописного тексту у цифрових зображень бланків поштових документів;


В другому розділі розроблено метод класифікації цифрових зображень поштових документів, на прикладі поштових переказів, для системи їх автоматизованого розпізнавання та оброблення. Метод ґрунтується на аналізі власних значень ковариаційної матриці, що розрахована для компонент простору кольорів RGB.


Бланки поштового документу можуть заповнюватись або чорними або кольоровими чорнилами. Для того щоб суттєво спростити обчислювальну складність подальшого оброблення поштового документу, особливо це стосується виділення тексту, необхідно встановити до якого з наведених нижче типів відноситься заповнений документ:


1)           чорно-білий фон, рукописний текст чорним кольором;


2)           чорно-білий фон, рукописний текст – кольоровий;


3)           бланк з кольоровим фоном, рукописний текст – чорний або кольоровий.


При скануванні бланків поштового документу, незалежно від типу сканеру та його розподільчої здатності, отримане зображення містить спотворення кольорів (навіть у випадку чорно білого бланку) інтенсивність яких найбільша на границях регіонів з різною яскравістю. При збільшені розподільної здатності сканера кількість спотворень лише збільшується.


На підґрунті аналізу отриманих зі сканера зображень бланків поштового переказу показано, що власні значення ковариаційної матриці відображають колірний контент зображення поштового документу. Тому запропонований метод класифікації зображень поштових документів за колірним контентом полягає у наступному:


1.       Розрухувати елементи ковариаційної матриці для компонент простору  та нормувати їх;


2.       Обчислити власні значення ковариаційної матриці, округлити їх до третьої значущої цифри після коми та впорядкувати у порядку спадання: ;


3.       Проаналізувати множину власних значень:


-         Якщо, то колірний контент зображення заповненого бланку поштового документу – переважно у градаціях сірого, а зображення відноситься до першого класу;


-         Якщо , то колірний контент зображення поштового документу – бланк у градаціях сірого, напис кольоровий і зображення відноситься до другого класу;


-         Якщо всі власні значення відмінні від нуля, то колірний контент – кольоровий бланк, напис чорний або кольоровий і зображення належить третьому класу.


На підґрунті запропонованого методу було розроблене застосування щодо класифікації цифрових зображень поштових документів яка суттєвого зменшує обчислювальну складність подальшого оброблення.


В третьому розділі на підґрунті виконаних теоретичних та експериментальних досліджень взаємозв’язку колірного контенту зображення бланків поштових документів з власними значеннями та власними векторами ковариаційної матриці, розрахованої для всього зображення, запропоновано координатний простір кольорів у якому власні вектори впорядковані у відповідності зі спаданням власних значень, що забезпечує поділ таких кластерів як друковані реквізити бланку поштового документу та рукописний текст на окремі підпростори.


Аналіз впливу колірного контенту зображень бланків поштових документів виконано при таких припущеннях. 

 


Обновить код

Заказать выполнение авторской работы:

Поля, отмеченные * обязательны для заполнения:


Заказчик:


ПОИСК ДИССЕРТАЦИИ, АВТОРЕФЕРАТА ИЛИ СТАТЬИ


Доставка любой диссертации из России и Украины