Бесплатное скачивание авторефератов |
СКИДКА НА ДОСТАВКУ РАБОТ! |
Увеличение числа диссертаций в базе |
Снижение цен на доставку работ 2002-2008 годов |
Доставка любых диссертаций из России и Украины |
Каталог / ТЕХНИЧЕСКИЕ НАУКИ / Элементы и устройства вычислительной техники и систем управления
МІНІСТЕРСТВО OСВІТИ І НАУКИ, МОЛОДІ ТА СПОРТУ УКРАЇНИ
ОДЕСЬКА НАЦІОНАЛЬНА АКАДЕМІЯ ЗВ'ЯЗКУ ім. О.С.ПОПОВА
На правах рукопису
Гладких Валерій Миколайович
УДК 656.8.001
ВИДІЛЕННЯ РУКОПИСНОГО ТЕКСТУ НА ЗОБРАЖЕННЯХ
БЛАНКІВ ПОШТОВОЇ ДОКУМЕНТАЦІЇ ДЛЯ ОПТИМІЗАЦІЇ
ТЕХНОЛОГІЧНИХ ПРОЦЕСІВ ОБРОБЛЕННЯ ПОШТИ
спеціальність 05.12.02 – телекомунікаційні системи та мережі
Дисертація на здобуття
наукового ступеня кандидата технічних наук
Науковий керівник
Загребнюк Віктор Іванович,
кандидат технічних наук, доцент
ОДЕСА 2012
ЗМІСТ
ВСТУП ..................................................................................................................... 4
РОЗДІЛ 1. ПРОБЛЕМИ ТА МЕТОДИ АВТОМАТИЗОВАНОГО
ОБРОБЛЕННЯ ЦИФРОВИХ ЗОБРАЖЕНЬ ПОШТОВИХ ДОКУМЕНТІВ .. 11
1.1 Аналіз технологічних процесів оброблення та обліку поштових
відправлень ..................................................................................................... 11
1.2 Проблеми та методи попереднього оброблення цифрових зображень
текстових документів .................................................................................... 15
1.3 Проблеми та методи сегментації цифрових зображень
текстових документів .................................................................................... 21
Висновки до розділу 1 та постановка задачі дисертаційної роботи ........ 25
РОЗДІЛ 2. АВТОМАТИЧНА КЛАСИФІКАЦІЯ ЦИФРОВИХ ЗОБРАЖЕНЬ
ПОШТОВИХ ДОКУМЕНТІВ ЗА КОЛІРНИМ КОНТЕНТОМ ....................... 28
2.1 Метод класифікації зображень поштових документів ........................ 29
2.2 Експериментальне дослідження класифікації зображень бланків
поштових документів .................................................................................... 39
Висновки до розділу 2 .................................................................................. 45
РОЗДІЛ 3. КООРДИНАТНИЙ КОЛІРНИЙ ПРОСТІР ДЛЯ ВИДІЛЕННЯ
ТЕКСТУ НА ЗОБРАЖЕННІ ПОШТОВИХ ДОКУМЕНТІВ ............................ 47
3.1 Аналіз колірного контенту зображень бланків поштових
документів ...................................................................................................... 47
3.2 Простір для кластеризації бланків поштових документів .................. 62
3.3 Експериментальне дослідження властивостей простору kU ............ 73
Висновки до розділу 3 ................................................................................... 85
3
РОЗДІЛ 4. БІНАРИЗАЦІЯ ЗОБРАЖЕНЬ ПОШТОВИХ ДОКУМЕНТІВ
У ПРОСТОРІ ВЛАСНИХ ВЕКТОРІВ КОВАРИАЦІЙНОЇ МАТРИЦІ .......... 86
4.1 Модифікований ентропійний метод бінаризації зображень
поштових документів .................................................................................... 86
4.2 Експериментальне дослідження модифікованого ентропійного
методу для бінаризації зображення поштового документу ..................... 96
4.3 Морфологічна фільтрація бінарного зображення поштового
документу ..................................................................................................... 107
Висновки до розділу 4 ................................................................................. 121
РОЗДІЛ 5. СЕГМЕНТАЦІЯ ТЕКСТУ ПОШТОВОГО ДОКУМЕНТУ ........ 122
5.1 Експертна система виділення контурів символів тексту
поштового документу ................................................................................. 122
5.2 Експериментальне дослідження виділення контурів і символів ...... 134
5.3 Сегментація тексту поштового переказу: виділення рядків
тексту та слів ................................................................................................ 139
5.4 Програмний комплекс сегментації тексту поштових переказів ....... 147
Висновки до розділу 5 ................................................................................. 149
ВИСНОВКИ ......................................................................................................... 150
СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ ........................................................... 153
ВСТУП
Актуальність теми та стан питання. Поштовий зв’язок відіграє
важливу у управлінні державою, задоволенні потреб населення і народного
господарства в інформаційному та товарному обмінах, а також розширенні
міжнародних зв’язків України.
Десять, п'ятнадцять років тому Українське державне підприємство
поштового зв’язку (УДППЗ) Укрпошта було практично підприємством-монополістом у сфері надання послуг поштового зв’язку. На сьогодні
УДППЗ Укрпошта функціонує у конкурентному середовищі, яке складають
не тільки приватні підприємства поштового зв’язку, а також і підприємства
електронної комерції, підприємства, що надають послуги електронних
грошових переказів тощо.
Підвищення конкурентно-спроможності (УДППЗ) Укрпошта – це одне
з найважливіших завдань сьогодення. Основні напрями підвищення
конкурентоспроможності поштового зв’язку Укрпошти визначенні у:
Комплексній програмі створення Єдиної національної системи зв'язку
України (Постанова Кабінету Міністрів України від 23 вересня 1993 р.
№ 790); Програмі реструктуризації Українського об’єднання поштового
зв’язку «Укрпошта» (Постанова Кабінету Міністрів України від 4 січня
1998 р. № 1); Державній цільовій економічній програмі розвитку поштового
зв’язку на 2009 – 2013 роки (Постанова Кабінету Міністрів України від
1 липня 2009 р. № 672).
Серед низки заходів передбачених цими документами слід виділити
завдання підвищення рентабельності УДППЗ Укрпошта, що досягається
зменшенням витрат на оброблення та доставляння пошти за рахунок
оптимізації технологічних процесів поштового зв’язку.
5
За даними Державної служби статистики України в 2011 році в Україні
було здійснено 126,4 млн. відправлень грошових переказів і пенсійних
виплат [1]. Якісне надання послуг та дотримання нормативів доставляння
поштових відправлень на сьогодні неможливе без широкого впровадження
інформаційних технологій та систем електронного документообігу.
Особливість технологічних процесів поштового зв’язку – це значна
частка ручної праці у технологічних процесах приймання, обліку та
оброблення поштової документації, а також у технологічних процесах
оброблення поштових відправлень.
Побудова такої системи можлива лише за умови наявності у її складі
систем оптичного автоматизованого оброблення поштових документів, таких
як, наприклад, бланки поштових переказів.
Одним із шляхів оптимізації технологічних процесів поштового зв’язку
є створення ефективних методів та алгоритмів автоматичного аналізу
цифрових зображень поштової документації, що забезпечують якісну
обробку великих обсягів даних.
Виділення рукописного тексту (сегментація) є, як правило, першим і,
можливо, самим важливим і складним етапом в роботі систем аналізу
зображень поштових документів. Усі наступні етапи аналізу зображень
безпосередньо залежать від якості сегментації.
Вирішенню задачі аналізу, сегментації та розпізнавання
структурованих документів присвячена велика кількість наукових праць як
вітчизняних так і закордонних науковців. У наукових публікаціях
досліджуються методи та принципи розпізнавання різноманітних
структурованих документів у вузькоспеціалізованій предметній області. Що
стосується таких документів як наприклад поштовий переказ, що має
специфічну структуру, то дослідження щодо сегментації та його
розпізнавання практично відсутні. Тому є необхідність розробки методів
аналізу, сегментації та розпізнавання, придатних для побудови сучасних
6
автоматизованих систем оброблення поштових документів, які можуть бути
використані при впровадженні спеціалізованих комплексів в поштовій галузі.
Тема дисертаційної роботи, яка присвячена розробленню методів та
компонент системи оптичного розпізнавання зображень бланків поштових
документів є актуальною, важливою та доцільною. Дисертаційна робота
сприятиме впровадженню ефективних систем електронного документообігу,
автоматизації і оптимізації технологічних процесів оброблення поштових
відправлень та підвищенню рентабельності.
Зв’язок роботи з науковими програмами, планами, темами. Тема
дисертаційної роботи безпосередньо пов’язана з виконанням програми
розвитку галузі телекомунікацій України, та зокрема Державної цільової
економічної програми розвитку поштового зв'язку на 2009-2013 роки
затвердженої Кабінетом Міністрів України (постанова від 1 липня 2009 р.
№672).
Обраний напрямок досліджень безпосередньо пов’язаний з напрямками
науково-дослідних робіт, що проводились протягом 2007-2012 років в
Одеській національній академії зв'язку ім. О.С.Попова (ОНАЗ), а саме:
«Методи та технології контекстного пошуку цифрових кольорових
зображень і автоматизовані системи розпізнавання бланків поштових
переказів» (номер державної реєстрації № 0111u010296) та «Методи та
технології стиснення цифрових кольорових зображень та автоматизованого
розпізнавання зображень поштових переказів» (номер державної реєстрації
№ 0112u006939). В цих науково-дослідних роботах здобувач був виконавцем.
Мета і завдання дослідження. Метою дисертаційної роботи є
розроблення методів виділення рукописного тексту, а також компонент
системи оптичного розпізнавання зображень бланків поштової документації
на прикладі зображення бланку поштового переказу для оптимізації
технологічних процесів опрацювання пошти.
Для досягнення поставленої мети вирішуються такі завдання:
7
1. Проведення порівняльного аналізу методів попереднього
оброблення та сегментації цифрових зображень текстових документів;
2. Визначення основних компонент системи сегментації цифрових
зображень бланків поштової документації та виділення рукописного тексту;
3. Розроблення методу класифікації зображень бланків поштової
документації за колірним контентом;
4. Розроблення методу видалення завад на зображеннях бланків
поштової документації;
5. Розроблення методу сегментації зображень бланків поштової
документації на прикладі поштового переказу з метою виділення
рукописного тексту.
Об’єктом досліджень є технологічні процеси обліку та оброблення
поштової документації.
Предметом досліджень є алгоритми та методи виділення рукописного
тексту (сегментації) на цифровому зображенні структурованих бланків
поштової документації.
Методи досліджень базуються на основних положеннях теорії
поштового зв’язку, лінійної алгебри, теорії алгоритмів, математичної
морфології, математичної статистики, математичного моделювання та
комп’ютерного експерименту.
Наукова новизна одержаних результатів. Вперше запропоновано
метод класифікації зображень бланків поштової документації за колірним
контентом, а саме поділ зображень бланків на три класи: реквізити та текст
виконані чорним кольором на білому фоні; реквізити бланку надруковані
чорною фарбою, рукописний текст кольоровий; реквізити бланку та
рукописний текст кольорові.
1. Метод Карунена-Лоєва поширено на випадок сегментації цифрових
зображень бланків поштової документації, а саме: запропоновано адаптивний
колірний простір, що дозволяє розділити зображення бланку поштового
8
документу на окремі базисні компоненти, такі як друковані реквізити та
рукописний текст.
2. Удосконалено ентропійний метод бінаризації: запропоновано метод
вибору початкового наближення, а оптимальне значення порогу знаходиться
методом половинного ділення, що суттєво зменшує обчислювальну
складність алгоритму бінаризації.
3. Вперше запропоновано несиметричний структурний елемент
морфологічних операцій, що забезпечує ефективне видалення завад та
мінімізує спотворення символів тексту.
4. Запропоновано метод та алгоритм сегментації тексту поштових
документів, який ґрунтується на аналізові взаємного розташування областей
у які вписано символи тексту виділення рядків та слів тексту.
Вірогідність наукових результатів, висновків та рекомендацій,
викладених в дисертаційній роботі, обґрунтована результатами
комп’ютерних експериментальних досліджень.
Практичне значення одержаних результатів.
1. Розроблено застосування для автоматичної класифікації та
бінаризації зображень бланків поштової документації, яке має незначну
обчислювальну складність.
2. Розроблено експертну систему виділення та сегментації
рукописного тексту поштових документів на прикладі поштового переказу,
що дозволяє правильно виділити контури символів, самі символи та
встановити координати області у якій розташовано рядки тексту, слова та
символ.
3. Розроблено програмний комплекс з автоматизації та оптимізації
оброблення поштових документів, який складається з наступних
компонентів: модуль сканування бланків поштових документів з заданою
розподільною здатністю; модуль класифікації; модуль бінаризації; модуль
сегментації рукописного тексту поштового документу; модуль взаємодії з
зовнішніми застосуваннями.
9
4. Результати дисертаційної роботи були використані при виконанні
науково-дослідних робот в Одеській національній академії зв'язку ім.
О.С.Попова (ОНАЗ) «Методи та технології контекстного пошуку цифрових
кольорових зображень і автоматизовані системи розпізнавання бланків
поштових переказів» (номер державної реєстрації № 0111u010296) та
«Методи та технології стиснення цифрових кольорових зображень та
автоматизованого розпізнавання зображень поштових переказів» (номер
державної реєстрації № 0112u006939).
5. Окремі положення дисертаційної роботи, а саме: метод класифікації
зображень бланків поштового переказу за колірним контентом та метод
сегментації тексту поштового переказу, впровадженні в нових фінансових та
технологічних послугах УДППЗ «Укрпошта», а саме в технологічних
процесах оброблення та контролю внутрішніх та міжнародних поштових
переказів.
6. Матеріали дисертаційної роботи впровадженні в навчальний процес
Навчально-наукового інституту Комп’ютерних технологій, автоматизації та
логістики, а саме у дисципліни «Розпізнавальні системи поштового зв’язку»
та «Розпізнавальні системи».
Особистий внесок здобувача. В дисертаційній роботі особисто
автором проведені такі дослідження та одержані такі результати: проведено
порівняльний аналіз методів сегментації розпізнавання структурованих
документів; розроблено метод класифікації зображень поштових документів
для системи їх автоматизованого оброблення та розпізнавання [2, 9];
запропоновано колірний простір для сегментації цифрових зображень
бланків поштових документів [3, 11]; запропонована модифікація
ентропійного методу бінаризації бланків поштових документів у якому
оптимальне значення порогу знаходиться методом половинного ділення у
адаптивному колірному просторі з використанням базисної компоненти що
містить рукописний текст [4, 10]; запропоновано метод виділення
кольорового тексту на цифровому зображенні бланка поштового документа з
10
кольоровим контентом, що не залежить від того, якими чорнилами заповнено
документ та якими типографськими фарбами надруковано бланк документу
[5]; запропоновано метод видалення завад на цифровому зображенні бланка
поштового документа несиметричним структурним елементом [6];
розроблена експертна система виділення символів, слів та окремих рядків
тексту поштового документа [7]; розроблено програмний комплекс для
автоматизації та оптимізації оброблення поштових документів [8].
Апробація роботи. Основні теоретичні та практичні результати
доповідались на Міжнародній науково-технічній конференції «Перспективи
розвитку сучасних інформаційних і комунікаційних технологій»,
Азербайджан, 22 – 24 вересня 2011, Міжнародному науковому конгресі з
розвитку інформаційно-комунікаційних технологій та розбудови
інформаційного суспільства в Україні (Київ 16.11.11-17.11.11), який
проводився Державним агентством з питань науки, інновацій та
інформатизації України та Українським науковим центром розвитку
інформаційних технологій, третій Міжнародній науково-практичній
конференції "Інформаційні технології та комп'ютерна інженерія" (ІТКІ-2012),
м. Вінниця 29-31 травня 2012 року.
Публікації. Основні результати дисертаційної роботи опубліковані в
10 наукових працях (9 робот одноосібно). Серед них 7 статей у наукових
журналах та збірниках наукових праць - фахових видань України, а також 3
матеріалах і тезах доповідей на науково-технічних конференціях і форумах.
Структура та обсяг дисертації. Робота складається зі вступу,
чотирьох розділів, висновку, переліку використаної літератури та додатків.
Загальний обсяг роботи складає 165 сторінок друкарського тексту, який у
тому числі містить 153 сторінки основного тексту, 80 рисунків та 3 таблиці,
список використаних джерел з 124 найменувань.
ВИСНОВКИ
Сукупність наукових розробок, сформульованих і обґрунтованих у
дисертаційній роботі, складає вирішення завдання побудови системи
виділення рукописного тексту на цифровому зображенні бланків поштових
документів для оптимізації технологічних процесів опрацювання пошти в
об'єктах поштового зв'язку.
В дисертаційній роботі отримані такі теоретичні та науково-практичні
результати:
1. Вперше запропоновано метод класифікації зображень бланків
поштових документів за колірним контентом на підґрунті аналізу власних
значень ковариаційної матриці, що дозволяє автоматично класифікувати
зображення бланків на три класи: реквізити та текст виконані чорним
кольором та білому фоні; реквізити бланку надруковані чорною фарбою,
рукописний текст кольоровий; реквізити бланку та рукописний текст
кольорові. Метод забезпечує безпомилкову класифікацію та не залежить від
інтенсивності спотворень, типу сканеру та розподільної здатності.
Запропонований метод класифікації зображень поштового документу
за колірним контентом суттєвого зменшує обчислювальну складність
подальшого оброблення поштової документації, а розроблене застосування
може бути використане, як складова процедури попереднього оброблення у
системі автоматичного розпізнавання та оброблення поштових документів.
2. На підґрунті виконаних теоретичних та експериментальних
досліджень взаємозв’язку колірного контенту зображення бланків поштових
документів з власними значеннями та власними векторами ковариаційної
матриці, розрахованої для всього зображення, запропоновано адаптивний
координатний простір кольорів базисні вектори якого – це власні вектори
151
впорядковані у відповідності зі спаданням власних значень. Показано що у
запропонованому просторі перший базисний вектор, що відповідає
максимальному власному значенню, – це ахроматична компонента, а другий
та третій базисні вектори – це хроматичні компоненти. На хроматичні
базисні вектори окремо проектуються кольорові реквізити бланку поштового
документу та рукописний текст.
3. Для кожного з трьох класів зображень поштових документів
розроблено метод сегментації. Показано, що для виділення рукописного
тексту достатню використовувати лише проекцію зображення на той
базисний вектор адаптивного простору, що містить рукописний текст. В
залежності від того до якого з класів належить зображення бланку поштового
документу рукописний текстом міститься у проекції або на другий або на
третій базисні вектори.
4. Показано, що для виділення рукописного тексту поштового
документу достатньо використовувати методи одновимірної кластеризації,
що у подальшому суттєво зменшує обчислювальну складність сегментації
зображення поштового документу.
5. Удосконалено ентропійний метод бінаризації зображення поштового
документу. Запропоновано метод вибору початкового наближення, а
оптимальне значення порогу знаходиться методом половинного ділення, що
суттєво зменшує обчислювальну складність алгоритму бінаризації.
6. На підґрунті виконаних теоретичних та експериментальних
досліджень показано, що застосування морфологічних операцій для
видалення завад з симетричним структурним елементом не забезпечує
необхідну якість фільтрації при двох ітераціях, а при збільшенні кількості
ітерацій виникають небажані спотворення символів тексту поштового
документу, тому вперше запропоновано несиметричний структурний елемент
який забезпечує на множені досліджених бінарних зображень поштових
документів видалення практично всіх завад без видимих спотворень нарису
символів.
152
7. Запропоновано метод сегментації тексту на прикладі поштового
переказу, який ґрунтується на аналізові взаємного розташування областей у
які вписано символи тексту, виділення рядків та слів тексту. Метод
реалізований у виді експертної системи. Він надійно виділяє рядки, слова та
символи тексту написаного від руки друкованими літерами.
8. У результаті виконаних досліджень було розроблено застосування,
які у комплексі виконують сегментацію тексту поштових документів, а саме
виділяють рядки та слова тексту на цифровому зображенні бланку поштового
документа. Ці застосування були інтегровані у програмний комплекс, який
складається з наступних модулів:
− модуль сканування бланків поштових документів з заданою
розподільною здатністю;
− модуль класифікації;
− модуль бінаризації;
− модуль сегментації рукописного тексту поштового документу;
− модуль взаємодії з зовнішніми застосуваннями.
Алгоритми та методи сформульовані обґрунтовані та реалізовані у
дисертаційній роботі, вирішують завдання побудови системи виділення
рукописного тексту на цифровому зображенні бланка поштового документа.
Це надасть можливість на базі традиційного (існуючого) і нового обладнання
підвищити ефективність та оптимізувати технологічні процеси обліку та
оброблення поштових документів в об'єктах поштового зв'язку, що є
актуальною проблемою сьогодення.
СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ
1. Офіційний сайт державної статистики [електронний ресурс]
http://www.ukrstat.gov.ua/
2. Гладких В.М. Класифікація цифрових зображень поштового
переказу за колірним контентом / В.М. Гладких // Наукові записки
українського науково-дослідного інституту зв’язку. – 2011, №2(18) –
C. 79-84.
3. Гладких В.М. Вибір простору для сегментації цифрових зображень
бланків поштових переказів / В.М. Гладких // Проблеми телекомунікацій. –
2011, № 3 (5) – С. 111 – 119.
4. Гладких В.М. Сегментація зображень поштових переказів з
кольоровим текстом / В.М. Гладких // Комп’ютерно-інтегровані технології:
освіта, наука, виробництво. – 2011, №7 – C. 11-16.
5. Гладких В.М. Виділення тексту у цифровому зображенні бланку
поштового переказу з кольоровим контентом / В.М. Гладких // Наукові
записки українського науково-дослідного інституту зв’язку. – 2011, №4(20). –
С. 55-60.
6. Гладких В.М. Морфологічна фільтрація бінарних зображень
поштового переказу / В.М. Гладких // Наукові записки українського науково-дослідного інституту зв’язку. – 2012, №1(21). – С. 66-71.
7. Гладких В.М. Експертна система виділення контурів символів
тексту поштового переказу / В.М. Гладких // Вісник Державного універси-тету інформаційно-комунікаційних технологій. – 2012, №3(10). – С. 77-81.
8. Гладких В.М. Сегментація тексту поштового переказу / В.М.
Гладких // Наукові записки українського науково-дослідного інституту
зв’язку. – 2012, №2(22). – С. 24-28.
154
9. Загребнюк В.І. Автоматическая классификация цифровых
изображений почтового перевода / В.І. Загребнюк, В.М. Гладких // Матеріали
Міжнародній науково-технічній конференції «Перспективи розвитку
сучасних інформаційних і комунікаційних технологій», Азербайджан, 22 – 24
вересня 2011 р. – Баку: Scientific works. – 2011. – №2. – С. 472-482.
10. Гладких В.М. Сегментація зображень документів з кольоровим
текстом / В.М. Гладких // Міжнародний науковий конгрес з розвитку
інформаційно-комунікаційних технологій та розбудови інформаційного
суспільства в Україні. – Київ, 16 – 17 листопада 2011 р. – С. 26-27.
11. Гладких В.М. Вибір простору для сегментації цифрових зображень
бланків поштових переказів / В.М. Гладких // Матеріали третьої міжнародної
науково-практичної конференції "Інформаційні технології та комп'ютерна
інженерія" (ІТКІ-2012). – Вінниця, 29-31 травня 2012 р. – С. 32-33.
12. Українське державне підприємство поштового зв’язку
«Укрпошта» (УДППЗ «Укрпошта») [електронний ресурс]
http://www.ukrposhta.com/
13. El-Sheikh. Computer recognition of Arabic cursive scripts Pattern
Recognit / El-Sheikh, R.M. Guindi. – 1988, vol. 21, № 4. – P. 293–302.
14. Mori S. Research on machine recognition of handprinted characters/ S.
Mori, K. Yamamoto, and M. Yasuda // IEEE Trans. Pattern Anal. Machine Intell.,
vol. PAMI-6, pp. 386–404, Apr. 1984.
15. Bozinovic R.M. Off-line cursive script word recognition / R.M.
Bozinovic, S.N. Srihari // IEEE Trans. Pattern Anal. Machine Intell. – 1989,
vol. 11. – P. 68–83.
16. Tian Q. Survey: Omnifont printed character recognition / Q. Tian et al
// Visual Commun. Image Process: Image Process. 1991 – P. 260–268.
17. Belaid A. A syntactic approach for handwritten mathematical formula
recognition / A. Belaid, J.P. Haton // IEEE Trans. Pattern Anal. Machine Intell. –
1984, vol. PAMI-6. – P. 105–111.
155
18. Shridhar M. High accuracy syntactic recognition algorithm for
handwritten numerals / M. Shridhar, A. Badreldin // IEEE Trans. Syst., Man,
Cybern. – 1985, vol. SMC-15. – P. 152–158.
19. Mori S. Historical review of OCR research and development / S. Mori,
C.Y. Suen, K. Yamamoto // Proc. IEEE. – 1992, vol. 80. – P. 1029–1057.
20. Suen C.Y. The state of the art in on-line handwriting recognition /
C.Y. Suen, C.C. Tappert, T. Wakahara // IEEE Trans. Pattern Anal. Machine Intell.
– 1990, vol. 12. – P. 787–808.
21. Serra J. Morphological filtering: An overview / J. Serra // Signal
Process. – 1994, vol. 38. – № 1. – P. 3–11.
22. Sonka M. Image Processing, Analysis and Machine Vision, 2nd ed.
Pacific Grove, CA: Brooks / M. Sonka, V. Hlavac, R. Boyle //Cole, 1999.
23. Legault R. Optimal local weighted averaging methods in contour
smoothing / R. Legault, C.Y. Suen // IEEE Trans. Pattern Anal. Machine Intell. –
1997, vol. 18. – P. 690–706.
24. Leu J.G. Edge sharpening through ramp width reduction / J.G. Leu //
Image Vis. Comput. – 2000, vol. 18. – № 6–7. – P. 501–514.
25. Mo S. Adaptive, quadratic preprocessing of document images for
binarization / S. Mo, V.J. Mathews // IEEE Trans. Image Processing. – 1998,
vol. 7. – P. 992–999.
26. Polesel A. Adaptive unsharp masking for contrast enhancement /
A. Polesel, G. Ramponi, V. Matthews // In Proc. Int. Conf. Image Process. – 1997,
vol. 1. – P. 267–271.
27. Zhou-Ping Yin. Xiong High Probability Impulse Noise-Removing
Algorithm Based on Mathematical Morphology / Zhou-Ping Yin, You-Lun // IEEE
Signal Processing Letters. – 2007, vol. 14, Issue: 1. – P. 31-34.
28. Peters R.A. A new algorithm for image noise reduction using
mathematical morphology/ R.A. Peters // IEEE Transactions on Image Processing.
– 1995, vol. 4, Issue: 5. – P. 554 – 568.
156
29. Mukhopadhyay S. An edge preserving noise smoothing technique using
multiscale morphology / S. Mukhopadhyay, B. Chanda // Signal Processing. –
2002, vol. 82, Issue 4. – P. 527–544.
30. Atici A. A heuristic method for Arabic character recognition / A. Atici,
F. Yarman-Vural // Signal Process. – 1997, vol. 62. – p. 87–99,.
31. Reinhardt J.M. Comparison between the morphological skeleton and
morphological shape decomposition / J.M. Reinhardt, W.E. Higgins // IEEE Trans.
Pattern Anal. Machine Intell. – 1996, vol. 18. –P. 951–957.
32. Yang J. Boundary detection using mathematical morphology / J. Yang,
X.B. Li // Pattern Recognit. Lett. – 1995, vol. 16, № 12. – P. 1287–1296.
33. Dudarin A. Alphanumerical character recognition based on
morphological analysis / A. Dudarin // IECON 2010 – 36th Annual Conference on
IEEE Industrial Electronics Society. – 2010. – Р. 1058 – 1063.
34. Khayyat M. Arabic Handwritten Text Line Extraction by Applying an
Adaptive Mask to Morphological Dilation / M. Khayyat, L. Lam, C.Y. Suen, Fei
Yin, Cheng-Lin Liu // Document Analysis Systems (DAS), 2012 10th IAPR
International Workshop on. – 2012. – Р. 100 – 104.
35. Baird H.S. Document image defect models / H.S. Baird // In Proc. Int.
Workshop Syntactical Structural Pattern Recognit. – 1990. – P. 38–47.
36. Kunango T. Nonlinear local and global document degradation models
T. Kunango, R. Haralick, I. Phillips // Int. J. Imaging Syst. Technol. – 1994,
vol. 5, № 4. – P. 274–282.
37. Downtown C. Preprocessing and presorting of envelope images for
automatic sorting using OCR / C. Downtown, C.G. Leedham // Pattern Recognit. –
1990, vol.23, № 3–4. – P. 347–362.
38. Guerfaii W. Normalizing and restoring on-line handwriting /
W. Guerfaii, R. Plamondon // Pattern Recognit. – 1993, vol. 26, № 3. – P. 418–431.
39. Yu B. A robust and fast skew detection algorithm for generic
documents / B. Yu, A. K. Jain // Pattern Recognit. – 1996, vol. 29.
157
40. Kanai J. Projection profile based skew estimation algorithm for JPIG
compressed images / J. Kanai, A.D. Bagdanov // Int. J. Document Anal. Recognit.
– 1998, vol. 1, № 1. – P. 43–51.
41. Chen M. A robust skew detection algorithm for gray-scale document
image / M. Chen, X. Ding // In Proc. 5th Int. Conf. Document Anal. Recognit. –
1999, Bangalore, India. – P. 617–620.
42. Khairuddin O. Skew Detection and Correction of Jawi Images Using
Gradient Direction / Omar Khairuddin, Ramli Abd. Rahman, Mahmod Ramlan,
Sulaiman Md. Nasir // Jurnal Teknologi. – 2002, vol. 37. – P. 117–126.
43. Madhvanath S. Chaincode contour processing for handwrittenword
recognition / S. Madhvanath, G. Kim, V. Govindaraju // IEEE Pattern. Anal.
Machine Intell. – 1999, vol. 21. – P. 928–932.
44. Bozinovic R.M. Off-line cursive script word recognition / R.M.
Bozinovic, S.N. Srihari // IEEE Trans. Pattern Anal. Machine Intell. – 1989,
vol. 11. – P. 68–83.
45. Аль-Рашайдех X. Метод распознавания арабско-индийских цифр /
X. Аль-Рашайдех, C.B. Кулешов // Изв. вузов. Приборостроение. – 2007. –
№ 12(50). – C. 8 – 12.
46. Rajib G. Skew Detection and Correction of Online Bangla Handwritten
Word / Ghosh Rajib, Mandal Gouranga // IJCSI International Journal of Computer
Science Issues. – 2012, vol. 9, Issue 4, № 2.
47. Cote M. Reading of cursive scripts using a reading model and
perceptual concepts, the PERCEPTO system / M. Cote et al. // Int. J. Document
Anal. Recognit. – 1998, vol. 1, № 1. – P. 3–17.
48. Yarman-Vural R. A new scheme for off-line handwritten connected
digit recognition / R. Yarman-Vural // Knowledge-Based Intelligent Electronic
Systems, 1998. Proceedings KES '98. Second International Conference on. – 1998,
vol. 2. – P. 329 – 335.
158
49. Yanikoglu B.A. Recognizing off-line cursive handwriting / B.A.
Yanikoglu, P. Sandon // In Proc. Int. Conf. Comput. Vision Pattern Recognit.,
Seattle, WA. – 1994. – P. 397–403.
50. Arica N. One dimensional representation of two dimensional
information forHMM based handwritten recognition / N. Arica, F.T. Yarman-Vural // Pattern Recognit. Lett. – 2000, vol. 21, № 6–7. – P. 583–592.
51. Legault R. Optimal local weighted averaging methods in contour
smoothing / R. Legault, C.Y. Suen // IEEE Trans. Pattern Anal. Machine Intell. –
1997, vol. 18. – P. 690–706.
52. Madhvanath S. Chaincode contour processing for handwritten word
recognition / S. Madhvanath, G. Kim, Venu Govindaraju // IEEE transactions on
pattern analysis and machine intelligence. – 1999, vol. 21, № 9. – Р. 928-932.
53. Su Bolan. Binarization of historical document images using the local
maximum and minimum / Bolan Su, Shijian Lu // Proceeding DAS '10
Proceedings of the 9th IAPR International Workshop on Document Analysis
Systems, NY, USA. – 2010. – Р. 159-166.
54. Bukhari S. Adaptive Binarization of Unconstrained Hand-Held
Camera-Captured Document Images / S. Bukhari, F. Shafait, T.M. Breuel //
Journal of Universal Computer Science. – 2009, vol. 15, № 18. – P. 3343-3363.
55. Jain A., Fundamentals of Digital Image Processing Image Processing /
Jain A.// Prentice Hall, Englewood Cliffs, NJ, 1989.
56. Saula J. Adaptive document image binarization / J. Saula, M.
Pietikainen // Pattern Recognit. – 2000, vol. 33, № 2. – P. 225–236.
57. Trier О.D. Goal directed evaluation of binarization methods / О.D.
Trier, A.K. Jain // IEEE Trans. Pattern Anal. Machine Intell. – 1995, vol. 17. –
P. 1191–1201.
58. Ntirogiannis K. An Objective Evaluation Methodology for Document
Image Binarization Techniques / K. Ntirogiannis, B. Gatos, I. Pratikakis //
Document Analysis Systems, 2008. DAS '08. The Eighth IAPR International
Workshop on. – 2008. – Р. 217 – 224.
159
59. Lam L. Thinning methodologies – A comprehensive survey / L. Lam,
S.W. Lee, C.Y. Suen // IEEE Trans. Pattern Anal. Machine Intell. – 1992, vol. 14.
– P. 869–885.
60. Baruch O. Line thinning by line following / O. Baruch // Pattern
Recognit. Lett. – 1989, vol. 8, № 4. – P. 271–276.
61. Yarman-Vural F.T. A segmentation and feature extraction algorithm for
Ottoman cursive script / F.T. Yarman-Vural, A. Atici // In Proc. 3rd Turkish Symp.
Artif. Intell. Neural Networks. – 1994.
62. Haralick R.M. Image segmentation techniques / R.M. Haralick, L.G.
Shapiro. – CVGIP, 29. – 1985. – Р. 100-132.
63. Zhang Y. Advances in Image And Video Segmentation / Zhang Y. –
USA: IRM Press, 2006.
64. Бакут П.А. Сегментация изображений: методы выделения границ
областей / П.А. Бакут, Г.С. Колмогоров // Зарубежная радиоэлектроника. –
1987. – №10. – С. 25-47.
65. Haralick R. Image segmentation techniques, Computer Vision,
Graphics and Image Processing (CVGIP), 29 / R. Haralick, L. Shapiro. – 1985. –
P. 100-132.
66. Spirkovska L. A summary of image segmentation techniques, NASA
technical memorandum 104022 / Spirkovska L. – 1993.
67. Fu K.S. A survey on image segmentation / K.S. Fu, J.K. Mui // Pattern
Recognition, №13. – Р. 3-16.
68. Yarman-Vural F.T. An overview of character recognition focused on
off-line handwriting / F.T. Yarman-Vural // IEEE Transactions on Systems, Man,
and Cybernetics, Part C: Applications and Reviews, v. 31, Issue: 2. – 2001. –
P. 216-233.
69. Shigarov A. O. Simple algorithm page layout analysis / A. O. Shigarov,
R. K. Fedorov // Pattern Recognition and Image Analysis. - 2011, vol 21, Issue 2. –
P. 324-327.
160
70. Jain A.K. Page segmentation using texture analysis / A.K. Jain, K. Karu
// Pattern Recognit. – 1996, vol. 29. – P. 743–770.
71. Tang Y. A new approach to document analysis based on modified
fractal signature / Y. Tang et al // In Proc. 3rd Int. Conf. Document Anal.
Recognit., Montreal, QC, Canada. – 1995. – P. 567–570.
72. Doermann D. Page decomposition and related research / D. Doermann
// In Proc. Symp. Document Image Understanding Technol., Bowie, MD. – 1995. –
P. 39–55.
73. Jain A.K. Document representation and its application to page
decomposition / A.K. Jain, B. Yu // IEEE Trans. Pattern Anal. Machine Intell. –
1998, vol. 20. – P. 294–308.
74. Baird H.S. Background structure in document images, in Document
Image Analysis/ H.S. Baird, H. Bunke, P. Wang, Eds. World Scientific, Singapore
. – 1994. – P. 17–34.
75. Breuel T.M. Two geometric algorithms for layout analysis /
T.M. Breuel // In Document Analysis Systems, Princeton, NY. – 2002. – P. 188–199.
76. Nagy G. A prototype document image analysis system for technical
journals / G. Nagy, S. Seth, M. Viswanathan // Computer. – 1992, vol. 7, № 25. –
P. 10–22.
77. Cesarini F. Structured document segmentation and representation by
the modified X–Y tree / F. Cesarini, M. Gori, S. Mariani, G. Soda // In Proc. 5th
Int. Conf. Document Anal. Recognit., Bangalore, India. – 1999. – P. 563–566.
78. Ha J. Document page decomposition by bounding-box projection
technique / J. Ha, R. Haralick, I. Philips // In Proc. 3rd Int. Conf. Document Anal.
Recognit., Montreal, QC, Canada. – 1995. – P. 119–122.
79. Kise K. Page segmentation based on thinning of background / K. Kise,
O. Yanagida, S. Takamatsu // In Proc 13th Int. Conf. Pattern Recognit., Vienna,
Austria. – 1996. – P. 788–792.
161
80. O’Gorman L. The document spectrum for page layout analysis / L.
O’Gorman // IEEE Trans. Pattern Anal. Machine Intell. – 1993, vol. 15. –
P. 162–173.
81. Kise K. Segmentation of page images using the area Voronoi diagram /
K. Kise, A. Sato, M. Iwata // Computer Vision and Image Understanding. – 1998,
vol. 70, № 3. – P. 370–382.
82. Запрягаев С.А. Сегментация рукописных и машинописных текстов
методом диаграмм Вороного / С.А. Запрягаев, А.И. Сорокин // Вестник ВГУ,
Серия: Системный анализ и информационные технологи. – 2010. – № 1.
83. Liu J. Adaptive document segmentation and geometric relation
labeling: Algorithms and experimental results / J. Liu, Y. Tang, Q. He, C. Suen //
In Proc 13th Int. Conf. Pattern Recognit., Vienna, Austria. – 1996. – P. 763–767.
84. Shafait F. Performance Evaluation and Benchmarking of Six-Page
Segmentation Algorithms / F. Shafait, D. Keysers, T.M. Breuel // IEEE
Transactions on Pattern Analysis and Machine Intelligence. – 2008, v. 30, Issue: 6.
– P. 368–379.
85. Tsujimoto S. Major components of a complete text reading system /
S. Tsujimoto, H. Asada // Proc. IEEE. – 1992, vol. 80. – P. 1133.
86. Wang J. Segmentation of merged characters by neural networks and
shortest path / J. Wang, J. Jean // Pattern Recognit. – 1994, vol. 27, № 5. – P. 649.
87. Lecolinet E. A grapheme based segmentation technique for cursive script
recognition / E. Lecolinet, J.-P. Crettez // In Proc. 1st Int. Conf. Document Anal.
Recognit., Saint-Malo, France. – 1991. – P. 740–744.
88. Casey R.G. Recursive segmentation and classification of composite
patterns / R.G. Casey, G. Nagy // In Proc. 6th Int. Conf. Pattern Recognit.,
München, Germany. – 1982. – P. 1023–1031.
89. Burges C.J.C. Recognition of handwritten cursive postal words using
neural networks / C.J.C. Burges, J.I. Be, C.R. Nohl // In Proc. U. S. Postal Service
5th Adv. Technol. Conf. – 1992. – P. 117–129.
162
90. Castro-Bleda M.J. Improving Offline Handwritten Text Recognition
with Hybrid HMM/ANN Models / M.J. Castro-Bleda, J. Gorbe-Moya, F. Zamora-Martinez // Pattern Analysis and Machine Intelligence, IEEE Transactions on. –
2011, v. 33, Issue 4. – Р. 767 – 779.
91. Saba T. Сursive script segmentation with neural confidence / T. Saba,
A. Rehman, G. Sulong // International Journal of Innovative Computing,
Information and Control. – 2011, vol. 7, № 8. – Р. 4955-4964.
92. Gilloux E. Hidden Markov models in handwriting recognition /
E. Gilloux // In Fundamentals in Handwriting Recognition. ser. NATO ASI F, S.
Impedovo, Ed. New York: Springer-Verlag. – 1994, vol. 124.
93. Cannon M. Quality assessment and restoration of typewritten document
images / M. Cannon, J. Hockberg, P. Kelly // Int. J. Document Anal. Recognit. –
1999, vol. 2, № 2/3. – P. 80–89.
94. Simon J.C. Off-line cursive word recognition / J.C. Simon. – Proc.
IEEE. – 1992, vol. 80. – P. 1150.
95. Lecolinet E. A new model for context driven word recognition /
E. Lecolinet // In Proc. SDAIR. – 1993. – P. 135–139.
96. Улкинсон Дж. Х. Алгебраическая проблема собственных значений
/ Улкинсон Дж. Х. – М.: Наука, 1970. – 564 с.
97. Вержбицкий В.М. Численные методы (Линейная алгебра и
нелинейные уравнения) / Вержбицкий В.М. – М.: «Издательский дом
«ОНИКС 21век», 2005. – 102 с.
98. Cheng H.D. Color image segmentation: Advances and prospects / H.D.
Cheng, X.H. Jiang, Y. Sun, Jing Li Wang // Pattern Recognition. – 2001, vol.34. –
P. 2259–2281.
99. Vezhnevets V. A Survey on Pixel-Based Skin Color Detection
Techniques / V. Vezhnevets, V. Sazonov, Alla Andreeva // Proc. Graphicon-2003.
Moscow, Russia. – 2003. – P. 85–92.
163
100. Kakumanua P. A survey of skin-color modeling and detection methods
/ P. Kakumanua, S. Makrogiannisa, N. Bourbakis // Pattern Recognition. – 2007,
vol.40, № 3.– P. 1106–1122
101. Yang Ming-Hsuan. Detecting faces in images: a survey / Ming-Hsuan
Yang, D.J. Kriegman, N. Ahuja // Pattern Analysis and Machine Intelligence. –
2002, vol. 24, № 1. – P. 34-58.
102. Dengsheng Zhang. Segmentation of Moving Objects in Image
Sequence: A Review / Zhang Dengsheng, Lu Guojun // Circuits, Systems and
Signal Process. – 2001, vol. 20, № 2. – P. 143-183.
103. Liang Jian. Camera-based analysis of text and documents: a survey /
Jian Liang, David Doermann, Huiping Li // International Journal on Document
Analysis and Recognition. – 2005, vol. 7, № 2-3. – P. 84-104.
104. Sridharana M. Color Learning and Illumination Invariance on Mobile
Robots: A Survey / Mohan Sridharana, Peter Stoneb // Robotics and Autonomous
Systems. – 2009, vol. 57, № 6-7. – P .629–644.
105. Changyong Li. A Method for Color Classification of Fruits Based on
Machine Vision / Li Changyong, Cao Qixin, Guo Wseas Feng // Transactions on
Systems. – 2009, vol. 8, № 2. – P. 312–321.
106. Lezoray O. Cooperation of Color Pixel Classification Schemes and
Color Watershed: A Study for Microscopic Images / Olivier Lezoray, Hubert
Cardot // IEEE Transactions on Image Processing. – 2002, vol. 11, № 7. – P.783–
789.
107. Vavilin A. Automatic Detection and Recognition of Traffic Signs using
Geometric Structure Analysis / Andrey Vavilin, Kang Hyun Jo. // SICE-ICASE
International Joint Conference 2006. – 2006. – P. 1451–1456.
108. Badekas E. Text Binarization in Color Documents / Efthimios Badekas,
Nikos Nikolaou, Nikos Papamarkos // International Journal of Imaging Systems
and Technology. – 2006, vol. 16. – № 6. – P. 262-274.
164
109. Gao J. An Adaptive Algorithm for Text Detection from Natural Scenes
/ Gao Jiang, Yang Jie // Computer Vision and Pattern Recognition, Proceedings of
the 2001 IEEE Computer Society Conference CVPR. – 2001, vol. 2. – P. 84-89.
110. Mancas-Thillou C. Color Text Extraction from Camera-based Images –
the Impact of the Choice of the Clustering Distance / Celine Mancas-Thillou,
Bernard Gosselin // Document Analysis and Recognition, Proceedings. Eighth
International Conference. – 2005, vol. 1. – P. 312-316.
111. Mancas-Thillou C. Spatial and color spaces combination for natural
scene text extraction / C. Mancas-Thillou, B. Gosselin // Image Processing, IEEE
International Conference on 8-11 Oct. – 2006. – P. 985-988.
112. Gao J. An Adaptive Algorithm for Text Detection from Natural Scenes
/ Jiang Gao, Jie Yang // Computer Vision and Pattern Recognition, Proceedings of
the 2001 IEEE Computer Society Conference. – 2001, vol. 2. – P. 84-89.
113. Mancas-Thillou C. Color Text Extraction from Camera-based Images –
the Impact of the Choice of the Clustering Distance / C. Mancas-Thillou,
B. Gosselin // Document Analysis and Recognition, Proceedings.Eighth
International Conference 29 Aug. – 1 Sept. – 2005, vol. 1. – P. 312-316.
114. Kapur J. N. A new method for gray-level picture thresholding using the
entropy of the histogram / J. N. Kapur, P. K. Sahoo, А. К. С. Wong //Computer
Vision, Graphics, Image Processing. – 1985, vol. 29. – P. 273-285.
115. Ping-Sung Liao. A Fast Algorithm for Multilevel Thresholding / Ping-Sung Liao, Tse-Sheng Chen, Pau-Choo Chung // Journal of Information Science
and Engineering. – 2001, vol. 17. – P. 713-727.
116. Ohta Y. Color Information for Image Segmentation / Y. Ohta,
T. Kanade, T. Sakai // Computer Graphics and Image Processing. – 1980, vol. 13.
– P. 222 – 241.
117. Otsu N. A threshold selection method from gray-level histogram /
N. Otsu // IEEE Trans Syst Man Cybernetics 8. – 1979. – Р. 62-66.
118. Farhoodi R. Text segmentation from images with textured and colored
background / Roshanak Farhoodi, Shohreh Kasaei Sharif. – http://www.yasni.com/
165
ext.php?url=http%3A%2F%2Fipl.ce.sharif.edu%2FPapers%2FGcc_Text_04.pdf&
name=Roshanak+Farhoodi&cat=document&showads=1.
119. Karatzas D. Two approaches for text segmentation in web images / D.
Karatzas, A. Antonacopoulos. – http://www.primaresearch.org/ICDAR2003/Papers/
0023_669_antonacopoulos_a.pdf.
120. Fabrizio J. Text segmentation in natural scenes using toggle-mapping //
J. Fabrizio, B. Marcotegui, M. Cord. – http://cmm.ensmp.fr/~marcoteg/cv/
publi_pdf/jonathan/fabrizio_marcotegui_cord_icip09.pdf.
121. Цифровая обработка изображений в информационных системах /
[Грузман И.С., Киричук В.С., Косых В.П., Перетягин Г.И., Спектор А.А.] –
Новосибисрк: Изд-во НГТУ, 2002. – 352 c.
122. Duda R. O. Use of the Hough Transformation to Detect Lines and
Curves in Pictures / Duda, P. E. Hart // Communications of the ACM. – 1972, vol.
15. - №1. – P. 11-15.
123. Гонсалес Р. Цифровая обработка изображений / Р. Гонсалес, Р.
Вудс. – М.: Техносфера, 2005. – 1072 с.
124. Писаренко В.Г. Распознавание навигационных знаков
беспилотным летательным аппаратом / Писаренко В.Г., Писаренко Ю.В.,
Коваленко А.П. – Режим доступа: http://www.nbuv.gov.ua/portal/
natural/ii/2010_3/AI_ 2010_Pisarenko_Kovalenko.pdf.