Каталог / ТЕХНИЧЕСКИЕ НАУКИ / Информационно-измерительные и управляющие системы
- Название:
- ІНФОРМАЦІЙНА ТЕХНОЛОГІЯ ОБМІНУ ДАНИМИ МІЖ СИСТЕМОЮ ЕЛЕКТРОННОГО ДОКУМЕНТООБІГУ ТА БАЗОЮ ДАНИХ ІНФОРМАЦІЙНОЇ СИСТЕМИ
- Альтернативное название:
- ИНФОРМАЦИОННАЯ ТЕХНОЛОГИЯ ОБМЕНА ДАННЫМИ МЕЖДУ СИСТЕМОЙ ЭЛЕКТРОННОГО ДОКУМЕНТООБОРОТА И БАЗОЙ ДАННЫХ ИНФОРМАЦИОННОЙ СИСТЕМЫ
- ВУЗ:
- ОДЕСЬКИЙ НАЦІОНАЛЬНИЙ ПОЛІТЕХНІЧНИЙ УНІВЕРСИТЕТ
- Краткое описание:
- МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ
ОДЕСЬКИЙ НАЦІОНАЛЬНИЙ ПОЛІТЕХНІЧНИЙ УНІВЕРСИТЕТ
На правах рукопису
МАРУЛІН Станіслав Юрійович
УДК 004.912
ІНФОРМАЦІЙНА ТЕХНОЛОГІЯ ОБМІНУ ДАНИМИ МІЖ СИСТЕМОЮ
ЕЛЕКТРОННОГО ДОКУМЕНТООБІГУ ТА БАЗОЮ ДАНИХ
ІНФОРМАЦІЙНОЇ СИСТЕМИ
05.13.06 – Інформаційні технології
Дисертації на здобуття наукового ступеня
кандидата технічних наук
Науковий керівник
Блажко Олександр Анатолійович
кандидат технічних наук, доцент
Одеса – 2013
ЗМІСТ
ПЕРЕЛІК УМОВНИХ ПОЗНАЧЕНЬ........................................................................ 4
ВСТУП ......................................................................................................................... 5
РОЗДІЛ 1 ОГЛЯД МЕТОДІВ ВЕДЕННЯ БАЗ ДАНИХ З ВИКОРИСТАННЯМ
ЕЛЕКТРОННИХ ДОКУМЕНТІВ............................................................................ 11
1.1 Становлення систем електронного документообігу........................................ 11
1.2 Формати представлення ЕД ............................................................................... 15
1.3 Способи представлення інформації в ЕД ......................................................... 17
1.4 Моделі представлення ЕД.................................................................................. 18
1.5 Методи структурування ЕД ............................................................................... 22
1.6 Автоматизація процесу створення ПЗ доступу до БД..................................... 34
1.7 Концептуальні поняття та визначення.............................................................. 42
1.8 Висновки .............................................................................................................. 44
РОЗДІЛ 2 ЗАДАЧА КЛАСИФІКАЦІЇ ЕЛЕКТРОНИХ ДОКУМЕНТІВ
ТАБЛИЧНОЇ СТРУКТУРИ...................................................................................... 47
2.1 Об’єктна метамодель електронного документу табличної структури .......... 47
2.2 Програмна модель доступу до ЕД XLS формату ............................................. 49
2.3 Програмна модель доступу до ЕД DOC формату............................................ 50
2.4 Автоматизоване створення ОМЕД-моделі ....................................................... 51
2.5 Структурно-семантична класифікація ЕД, представлених у вигляді ОМЕД-моделі.......................................................................................................................... 63
2.6 Висновки .............................................................................................................. 80
РОЗДІЛ 3 ВЕДЕННЯ БД НА ОСНОВІ XML/ED-ШАБЛОНІВ ЕД...................... 81
3.1 Документно-орієнтований XML/ED-шаблон ЕД зв’язку ЕД з таблицями БД
КІС .............................................................................................................................. 81
3.2 Методика автоматизованого створення XML/ED-шаблонів ЕД..................... 84
3.3 Методика визначення кількості операцій автоматизованого створення
XML/ED-шаблону...................................................................................................... 88
3.4 Ієрархічна модель доступу до ЕД та ЕФ........................................................... 89
3.5 Методика вибору методу ведення БД на основі ЕД...................................... 103
3
3.6 Висновки ............................................................................................................ 107
РОЗДІЛ 4 ДОКУМЕНТНО-ОРІЄНТОВАНА ІНФОРМАЦІЙНА ТЕХНОЛОГІЯ
ВЕДЕННЯ БД З XML/ED-ШАБЛОНІВ ................................................................ 109
4.1 Технологія ведення БД на основі ЭД.............................................................. 109
4.2 Опис структур даних......................................................................................... 112
4.3 Опис програмних модулів................................................................................ 115
4.4 Опис роботи генератора екранних форм доступу до БД - UIGenarate ....... 121
4.5 Особливості реалізації...................................................................................... 126
4.6 Оцінка ефективності впровадження інформаційної технології................... 127
4.7 Оцінка продуктивності та визначення границь використання ІТ................ 130
ВИСНОВКИ............................................................................................................. 147
Список використаних джерел................................................................................ 149
Додаток А ОПИС ПРОГРАМНОГО КОМПЛЕКСУ “E-DEKANAT”................. 165
A.1 Опис підсистеми генерації дерева ієрархії TreeNavigate ............................. 165
A.2 Опис підсистеми генерації дерева ієрархії TreeNavigate ............................. 168
A.3 Опис підсистеми управління ЕД та XML/ED-шаблонів FileManagement .. 171
А.4 Структура БД “E-Dekanat” .............................................................................. 179
А.5 Приклад створення та заповнення структури tree_node .............................. 180
А.6 Приклад створення та заповнення структури doc_hierarchy....................... 182
А.7 Приклад створення та заповнення структури doc_templates ....................... 183
А.8 Приклад роботи модулів ПЗ “E-Dekanat”...................................................... 185
Додаток Б ОПИС ПРОГРАМНОГО МОДУЛЮ ГЕНЕРАЦІЇ ДОКУМЕНТНО-ОРІЄНТОВАНИХ ЕКРАНИХ ФОРМ .................................................................. 188
Б.1 Приклад XML/ED-шаблону ЕД........................................................................ 188
Б.2 Приклад автоматизованого створення XML/ED-шаблонів........................... 192
Б.3 Приклад документно-орієнтованих ЕФ.......................................................... 198
Б.4 Зв'язок модулів UIGenerate та TreeGenerate .................................................. 201
Б.5 Програмний код генератора ЕФ...................................................................... 202
Додаток B АКТИ ВПРОВАДЖЕННЯ РЕЗУЛЬТАТІВ ДИСЕРТАЦІЙНОЇ
РОБОТИ ................................................................................................................... 210
ПЕРЕЛІК УМОВНИХ ПОЗНАЧЕНЬ
ЕДО – електронний документообіг
ПКД – паперова копія документу
СЕД – система електронного документообігу
ЕД – електронний документ
БД – база даних
ГЗ – генератор звітів
ІТ – інформаційні технології
ІС – інформаційна система
ІО – інформаційна область
ЕФ – екранна форма
ПЗ – програмне забезпечення
ВСТУП
Актуальність теми. Електронний документообіг (ЕДО) наразі є
невід’ємним елементом інформаційної структури будь-якої організації. Наряду
з цим, існують корпоративні інформаційні системи (КІС) підтримки ЕДО, які
поєднують три ключові ланки: первинні паперові документи, електронні
документи (ЕД), які дублюють інформацію паперових та інформацію таблиць
бази даних (БД). Системи ЕДО дозволяють підвищити якість та ефективність
управління, що безпосередньо пов’язане з поняттям актуальності даних,
циркулюючих у системі. Забезпечити актуалізацію інформації можна завдяки
своєчасним, правильним та налагодженим способам обміну даними між БД КІС
та ЕД. Тобто необхідно вирішувати задачу поєднання слабоструктурованого
інформаційного простору ЕД із жорстко детермінованою реляційною
структурою таблиць БД КІС. Таку задачу називають задачею поєднання
гетерогенних або різнорідних схем даних – schema matching (SM).
В літературі описані різноманітні підходи до узгодження різних схем
даних, що засновані на структурі, семантиці та синтаксисі даних ЕД. Але
недоліком всіх зазначених робіт є односпрямованість на поєднання схем даних
чітко структурованих таблиць гетерогенних БД і жодним чином не вказується
можливість та способи поєднання слабких структур ЕД та строгих реляційних
таблиць БД. Також слід зазначити, що існує ряд програмних засобів які
вирішують задачу добування (Extract), перетворення (Transform) та
завантаження (Load) даних в КІС – ETL технології. Такі технології не
вирішують всі проблеми обміну даними між ЕД та БД КІС та мають такі
недоліки як: високі витрати на придбання, налаштування і супроводження
програмного забезпечення (ПЗ); необхідність втручання спеціаліста високої
кваліфікації для налаштування однозначних інформаційних потоків між ЕД та
БД КІС; спрямованість на конкретні формати та форми представлення
інформації в ЕД; відсутність урахування того, що операторам притаманно
змінювати, можливо і несвідомо, структуру ЕД; відсутність методів
6
автоматизованої генерацій інтерфейсу доступу до даних таблиць БД у вигляді
документно-орієнтованих екранних форм та проміжних детермінованих XML
структур та частин електронного документу – ED структур.
Всі перераховані недоліки призводять до виникнення неоднозначності
інформаційних зв’язків між ЕД та відповідних таблиць БД КІС, що знижує
продуктивність обміну даними між ЕД та БД та значно підвищує кількість
операцій встановлення відповідних зв’язків за рахунок втручання відповідного
спеціаліста (адміністратора). Тому створення інформаційної технології (ІТ), яка
включає удосконалені моделі та методи представлення і класифікації ЕД
табличної структури, модифіковані методи породжуючого програмування
XML/ED-шаблонів та документно-орієнтованих екранних форм доступу до БД є
актуальною науково-практичною задачею, що дозволить скоротити кількість
операцій визначення та встановлення однозначних інформаційних зв’язків між
ЕД та таблицями БД КІС та підвищити продуктивність обміну даними.
Зв'язок роботи з науковими програмами, планами, темами.
Дисертаційна робота виконувалась відповідно до плану науково-дослідної роботи кафедри системного програмного забезпечення Одеського
національного політехнічного університету (ОНПУ) №643-73 “Дослідження й
розробка інформаційної технології кількісного обґрунтування прийняття
рішень” (2011-2012) та у рамках гранту ректора ОНПУ “Теоретичні та
реляційні засади організації та супроводження інформаційної системи
«Електронний університет»” № 2-145 (2011 р.).
Мета і завдання дослідження. Метою дисертаційної роботи є
підвищення продуктивності процесу обміну даними між системою
електронного документообігу (СЕД) та БД КІС за рахунок розробки методів,
моделей та автоматизованих засобів структурування ЕД та встановлення
однозначних зв’язків між даними ЕД та відповідних таблиць БД.
Досягнення поставленої мети здійснюється шляхом розв’язання таких
задач:
– аналіз методів та технологій автоматизованого обміну даних;
7
– розробка об’єктної метамоделі ЕД табличної структури;
– створення методу структурно-семантичної класифікації об’єктної
метамоделі ЕД табличної структури з пріоритетністю структурної складової
метамоделі;
– розробка XML/ED-шаблону обміну даними між ЕД до БД КІС на
основі аналізу структур БД, словника предметної області та вмісту ЕД;
– розробка методу автоматизованого створення XML/ED-шаблонів ЕД та
документно-орієнтованих екранних форм обміну даними між ЕД та таблицями
БД КІС на базі модифікованого алгоритму породжуючого програмування;
– створення методики вибору раціонального способу ведення БД на
основі XML/ED-шаблону ЕД або документо-орієнтованої екранної форми;
– розробка інформаційної технології обміну даними між системою ЕДО і
БД КІС та апробація роботи у трьох предметних областях.
Об'єктом дослідження є процес обміну даними між системою
електронного документообігу та базою даних інформаційної системи.
Предметом дослідження є моделі, методи структурування електронних
документів та документно-орієнтовані моделі, методи ведення баз даних
інформаційної системи.
Методи дослідження. Наведені в дисертаційній роботі результати
розробки XML/ED-шаблону базуються на теорії класифікації та кластерного
аналізу текстів в системах інформаційного пошуку. Для вирішення задачі
створення модифікованої об’єктної моделі ЕД використані методи теорії
множин. Для вирішення задачі автоматизованої генерації документно-орієнтованих екранних форм була використана теорія породжуючого
програмування (generative programming).
Наукова новизна отриманих результатів. Наукова новизна результатів
дисертаційної роботи полягає у тому, що:
– Отримала подальший розвиток об’єктна модель ЕД – об’єктна
метамодель ЕД (ОМЕД), яка на відміну від існуючої моделі, представляє у
якості об’єкта ЕД інформаційну область, отриману засобами графічного
8
оформлення або об’єднанням певних елементів, що дозволяє вибудувати
залежність одного елементу ЕД від іншого і відновити структуру ЕД.
– Отримав подальшого розвитку метод структурно-семантичної
класифікації ЕД для створення XML/ED-шаблону зв’язку БД КІС з ЕД, в якому,
на відміну від відомих класифікаторі, в в основу покладено вирішальне
правило, що враховується коефіцієнт структурної складності ЕД, підвищуючи
пріоритетність структурних складових ЕД над семантичними і дозволяє
знизити вірогідність помилок розпізнавання.
– Вперше запропоновано документно-орієнтований XML/ED-шаблон, як
спеціальну інформаційну структуру, що формально описує зв’язок слабко
структурованих елементів ЕД та жорстко детермінованих реляційних таблиць
БД і дозволяє встановити однозначні інформаційні потоки між ними за
допомогою SQL-запитів.
– Отримав подальшого розвитку метод обробника шаблонів регулярних
структур в технології породжуючого програмування, який, на відміну від
відомих методів, виконує аналіз XML/ED-шаблонів ЕД в автоматизованому
режимі, що дозволяє генерувати окремі екранні форми, функціонально достатні
для виконання основних операцій ведення БД на основі вмісту ЕД.
Практичне значення отриманих результатів. На основі
запропонованих в дисертаційній роботі моделей та методів вперше створена
документно-орієнтована ІТ обміну даними між ЕД та БД КІС, що включає
етапи первинної автоматизованої класифікації множини ЕД, створення
шаблону обміну даними на основі SQL-запитів і дозволяє підвищити
продуктивність обміну інформації між двома ключовими ланками КІС – БД та
ЕД. ІТ була реалізована у вигляді програмної системи “E-Dekanat”, яка
використовується для автоматизації навчального процесу Одеського
національного політехнічного університету (ОНПУ). Запропонований підхід
ведення БД на основі ЕД дозволив скоротити час на внесення даних до КІС “E-Dekanat” з початкових ЕД на 59,79%, в залежності від рівня навченості
користувача і кількості операторів, та на 86,75% зменшити час обміну даними
9
при завантажені у 1975 ЕД сімох типів (з 249 до 32,99 годин). Методика
автоматизованого створення XML/ED-шаблонів дозволила скоротити кількість
операцій встановлення зв’язків між ЕД та таблицями БД 7,73 рази (з 232 до 30
операцій).
Розроблена ІТ впроваджена в програмний комплекс визначення рейтингу
громадських організацій “PAnketa” під патронатом одеської обласної
організації інвалідів (ОООІ), що дозволило скоротити кількість операцій
створення XML/ED-шаблонів обміну даними між електронними анкетами та
централізованою БД ОООІ у 9,47 раз (з 322 до 34 операцій) та скоротити час
обміну даними у 11,5 рази (з 2515,91 до 218,81 годин) при завантажені у 13125
ЕД – 175 анкета зі складною табличною трирівневою структурою з
множинними вкладками.
Розроблена ІТ впроваджена в інформаційну систему головного
фінансового управління м. Нова Каховка (фін. установа), що дозволило
скоротити кількість операцій створення XML/ED-шаблонів обміну даними між
електронними звітними формами підлеглих організацій та БД КІС під
управлінням СУБД MS Access у 10,17 раз (з 295 до 29 операцій) та скоротити
час обміну даними у 60,87 рази (з 485,77 до 7,98 годин) при завантажені у 458
ЕД 7-ми типів.
Наукові результати, отримані в дисертаційній роботі, використані в
навчальному процесі на кафедрі системного програмного забезпечення ОНПУ в
дисципліні “Формальні методи програмної інженерії” та “Теорія зберігання та
обробки даних”.
Особистий внесок здобувача. Методику автоматизованого створення
модифікованої об’єктної моделі електронного документу представлено в роботі
[5]. В роботі [14, 16] розглянуто метод структурно-синтаксичного аналізу ЕД з
табличними структурами. Розроблена шаблонна модель ЕД формату XLS/DOC
[15, 19]. Методика породжуючого програмування XML/XLS-шаблонів ЕД з
доступом к БД описана в роботі [18]. В роботі [17] запропонована методика
автоматизованого створення документно-орієнтованих екранних форм.
10
Запропонована інформаційна технологія переносу вмісту ЕД форматів DOC та
XLS до БД ІС [1, 2, 7, 10, 11, 12, 13]. Автоматизацію процесу заповнення БД на
основі ЕД різних форматів описано в роботі [3, 6, 9]. В роботі [4] представлена
методика скорочення трудомісткості переносу вмісту паперових копій
документів в базу даних. Виконано аналіз табличної структури ЕД формату
XLS, з метою виявлення регулярних структур даних[8].
Апробація результатів дисертації. Наукові результати та основні
положення дисертаційної роботи доповідались та обговорювались на
міжнародних конференціях: “Інформаційні технології в освіті та управлінні”
(Нова Каховка 2007, 2010), “Сучасні проблеми і досягнення в галузі
радіотехніки, телекомунікацій та інформаційних технологій” (Запоріжжя 2008),
“Сучасні проблеми та шляхи їх вирішення в науці, транспорті, виробництві та
освіті 2008” (Одеса 2008), “Сучасні інформаційні та електронні технології”
(Одеса 2009, 2010), “Розвиток наукових досліджень 2009” (Полтава 2009),
“Computer Science and Engineering – 2010” (Львів 2010), “Проблеми
програмування” (Київ 2010), “Technology and Applications (IDAACS)” (Прага
2011), “Информационные технологи и автоматизация – 2012” (Одеса 2012),
“Інформаційні управляючі системи та технології” (Одеса 2012).
Публікації. За результатами досліджень опубліковано 19 наукових праць
у тому числі 6 у фахових виданнях України, 12 – у збірниках наукових праць
конференції та 1 в зарубіжному збірнику.
- Список литературы:
- ВИСНОВКИ
У дисертаційній роботі розв’язана актуальна задача автоматизації
процесу обміну даними між ЕД з табличною структурою та БД КІС з метою
підвищення продуктивності цього процесу та зменшення часу на ручні операції
вводу та зменшення вірогідності помилок. При цьому отримані такі основні
результати:
1. Порівняльний аналіз форматів представлення ЕД, які
використовуються в виробничих процесах, та аналіз їх структури показав, що
найбільш поширенішими форматом ЕД є формат ЕД з табличною структурою.
Аналіз існуючих способів ведення БД визначив, що вони не враховують
можливість взаємного відображення даних у ЕД з табличною структурою.
2. Розроблена об’єктна метамодель ЕД – ОМЕД-модель дозволила
привести до єдиного формату ЕД табличної структури та забезпечити єдину
технологію їх обробки. Побудова ОМЕД-моделі дозволила виявити структурну
складову ЕД, яка полягає у визначені залежності батьківського та дочірнього
вузла ОМЕД-моделі, що зменшило показники помилок 1-ого та 2-ого роду
методу структурно-семантичної класифікації до 4,41% та 1,29%, відповідно.
3. Вдосконалено метод породжуючого програмування – оброблювача
даних регулярних структур, що дозволив автоматизувати механізм генерації
ЕФ та XML/ED- шаблонів ЕД, скоротивши кількість ручних операцій у 9,129
рази (з 849 операції до 93 операції) для 20 ЕД різної структурної складності
трьох предметних областей. Метод також дозволив в автоматичному режимі
генерувати окремі документно-орієнтовані екрані форми зв’язку ЕД з БД КІС
на основі SQL-запитів, функціонально достатніх для виконання основних
операцій ведення БД, і тим самим виключити етап створення нових програмних
модулів засобами мов програмування.
4. На основі методики вибору раціонального документно-орієнтованого
способу ведення БД вдалось визначити, що ЕД, у якому переважають рядкові
дані, раціонально обробляти за допомогою відповідної ЕФ доступу до БД, а ЕД,
148
у яких переважають числові типи, раціонально обробляти за допомогою
XML/ED-шаблонів.
5. Створено документно-орієнтовану інформаційну технологію ведення
БД, яка скоротила час вводу даних з ЕД до БД КІС на 59% з урахуванням рівня
навченості та кількості операторів. Підвищення показників продуктивності
були отримані у 3-х предметних областях: при обробці 1975 ЕД КІС “E-Dekanat” – на 86,75% (з 249 до 32,99 годин), при обробці 13125 ЕД КІС ОООІ –
у 11,5 рази (з 2515,91 до 218,81 годин), при обробці 458 ЕД КІС фін. установи –
у 60,87 рази (з 485,77 до 7,98 годин).
6. Встановлені границі ефективного використання ІТ, які визначають
кількість ЕД, при якій відбувається збільшення показників продуктивності: для
3-х предметних областей ця кількість становить відповідно 10, 3, 3 ЕД з
найвищім рівнем структурної складності та відповідно 5, 1, 10 3 ЕД з
найнижчим рівнем структурної складності. Тобто, ефект настає при обробці
понад 5 ЕД.
7. Запропонована інформаційна технологія дозволила виключити операції
вводу даних, що дублюються, коли оператор вимушений створювати ЕД з
певним вмістом та дублювати його у БД КІС, та скоротити час на створення ЕД
у 2 рази.
8. Встановлено, що вірогідність виникнення помилок та час вводу
інформації до КІС має експоненціальну залежність від швидкості потрапляння
інформації до оператору з показником -0,15> λ>-0.2, а залежність швидкості
переносу інформації з ЕД до БД КІС визначається степеневою функцією виду
y=95⋅x-0,257 з рівнем достовірності R=0.994.
9. Розроблена ІТ у вигляді програмної системи – “E-Dekanat” була
протестована та пройшла апробацію у навчальному процесі інституту
комп’ютерних систем ОНПУ. Додатково компоненти та модулі цієї системи
були використані та апробовані в одеській обласній організації інвалідів та у
головному фінансовому управлінні м. Нова Каховка. Основні положення
дисертаційного дослідження використані в навчальному процесі ОНПУ.
СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ
1. Кунгурцев А. Б. Алгоритмы сравнения однофразних текстов в
технологии переноса содержимого электронных документов в реляционную БД
[Текст] / А. Б. Кунгурцев, А. А. Блажко, С. Ю. Марулин, Т.Д. Альсаффади //
Вестник Херсонского национального технического университета. – 2007. – №
4(27). – С. 308–311.
2. Блажко А. А. Система автоматизированного переноса содержимого
электронных документов в БД ИС [Текст] / А. А. Блажко, С. Ю. Марулин, Ю.
А. Дунько. // Проблеми програмування. – 2010. № 2–3. – C. 401–207.
3. Блажко А.А. Автоматизация процесса заполнения базы данных на
основе электронных документов разных форматов [Текст] / А. А. Блажко, С. Ю.
Марулин, Ю. А. Дунько // Вестник Херсонского национального технического
университета. – 2010. – № 2(38). – С. 212-216.
4. Марулин С. Ю. Методика сокращения трудоемкости процесса
переноса содержимого бумажных копий документов в базу даннях
информационной системы [Текст] / С. Ю. Марулин // Науково-технічний
журнал «Электротехнические и компьютерные системы». – № 5(81), 2012. – С.
215-220
5. Марулін С. Ю. Методика автоматизованого створення ОМД-дерева
електронних документів XLS-формату з табличною структурою представлення
інформації [Текст] / С. Ю. Марулін, О. А. Блажко, І. В. Ковбасюк // Вестник
Херсонского национального технического университета. – № 1(44), 2012. – С.
169-174
6. Крисилов В. А. Документно-ориентированная автоматизация процесса
заполнения базы данных информационной системы [Текст] / В. А. Крисилов, С.
Ю. Марулин // Науково-технічний журнал «Радіоелектронні і комп’ютерні
системи». – № 5(57), 2012. –С. 78-82.
7. Alexander A. Blazhko. Data Exchange Technology Between Electronic
documents and Relation Databases [Text] / A. Blazhko Alexander, Marulin Stanislav,
150
Kalashnikova Victoria // Procs of 6th IEEE International Conference on Intelligent
Data Acquisition and Advanced Computing Systems: Technology and Applications
(IDAACS), September 15–17, 2011, Prague,Czech Republic. – P. 624–628.
8. Марулин С. Ю. Технология переноса содержимого XLS-документов с
учебным планом в базу данных информационной системы [Текст] / С. Ю.
Марулин, А. А. Евстратьев, А. А. Блажко // Інформатика-2007: Інформаційні
процеси і технології: перша Всеукраїнська студентська наук. - техн. конф., 25-27 квітня 2007 р.: матеріали конференції – Севастополь: СевНТУ, 2007. – С. 57-58.
9. Блажко А. А. Методика пакетной обработки документов [Текст] / А. А
Блажко, А. В. Яковенко, С. Ю. Марулин // Сучасні проблеми і досягнення в
галузі радіотехніки, телекомунікацій та інформаційних технологій: IV
Міжнародна науково-практична конференція, 24-26 вересня 2008 р.: збірник тез
доповідей – Запоріжжя: ЗНТУ, 2008. – C. 205-206.
10. Блажко А. А. Технология заполнения реляционной базы данных на
основе обработки содержимого электронных документов [Текст] / А. А.
Блажко, А. В., Яковенко, С. Ю. Марулин // Холодильна техніка і технологія:
науково-технічний журнал №2 (112), 2008. – Одеса: ОДАХ, 2008. – С. 73— 76.
11. Марулин С. Ю. Ведение реляционных БД с использованием
документов формата XLS [Текст] / С. Ю. Марулин, А. А. Блажко, А. А.
Евстратьев // Современные проблемы и пути их решения науке, транспорте,
производстве и образовании 2008: сб. науч. тр. – Одесса, 2008. – Т.2. – С. 48-50.
12. Марулин С. Ю. Автоматизація процесу обміну даними між файлами
XLS-формату та базою даних інформаційної системи [Текст] / С. Ю. Марулин,
А. А. Блажко // Современные информационные и электронные технологии:
Десятая международная научно-практическая конференция, 18-22 мая 2009 г.:
труды – Одесса: ОНПУ, 2009. – Т.1. – С. 59.
13. Блажко О. А. Алгоритм переносу вмісту електронних документів
DOC-формату до бази даних інформаційної системи [Текст] / О. А. Блажко, С.
Ю. Марулін, Ю. С. Дунько // Розвиток наукових досліджень 2009: п’ята
151
міжнародна науково-практична конференція, 23-25 листопада 2009 р.:
матеріали конференції – Полтава: Изд-во “ІнтерГрафіка”, 2009. – Т.8. – С. 104—
107.
14. Дунько Ю. С. Структурно-синтаксический анализ электронных
документов с табличными структурами [Текст] / Ю. С. Дунько, С. Ю. Марулин
// Информационные управляющие системы и компьютерный моніторинг: I
всеукраинская научно-техническая конференция студентов, аспирантов и
молодых учених, 19-21 мая 2010 г.: матеріали конференції – Донецк: ДонНТУ,
2010. – С. 105-109.
15. Марулин С. Ю., Методика переноса содержимого электронных
документов формата MSOffice DOC в реляционную базу данных [Текст] / С. Ю.
Марулин, Ю. А. Дунько, А. А. Блажко // Современные информационные и
электронные технологии: Одиннадцатая международная научно-практическая
конференция, 25-28 мая 2010 г.: труды – Одесса: ОНПУ, 2010. – Т.1. – С. 117.
16. Дунько Ю. С. Розробка класифікатора електронних документів з
табличною структурою [Текст] / Ю. С. Дунько, С. Ю. Марулин // CSE-2010: ІV
Міжнародна конференція молодих вчених, 25-27 листопада 2010 г. : матеріали
конференції – Львів: НУ"Львівська політехніка", 2010. – С. 24-25.
17. Марулин С. Ю. Методика автоматизированного создания документно-ориентированных экранных форм [Текст] / С. Ю. Марулин, Б. Абдиоглу //
Современные информационные и электронные технологии: Тринадцатая
международная научно-практическая конференция, 4-8 июня 2012 г.: труды –
Одесса: ОНПУ, 2012. – Т.1. – С. 47.
18. Марулин С.Ю. Методика порождающего программировании
XML/XLS-шаблонов электронных документов с доступом к базе данных
[Текст] / С. Ю. Марулин, И. Сауд, И. В. Ковбасюк // Информационные
технологи и автоматизация – 2012: Пятая всеукраинская научно-практическая
конференция,10 – 11 октября, 2012 г.: сборник докладов – Одеса: ОНАПТ,
2012. – С. 49-50.
152
19. Марулин С. Ю. Методика автоматизированного создания XML-шаблонов электронных документов XLS-формата с учетом модели
реляционной базы данных [Текст] / С.Ю. Марулин, А. А. Блажко, И. В.
Ковбасюк // Інформаційні управляючі системи та технології: Науково-практична конференція, 17-18 жовтня 2012 р.: тези доповідей – Одеса: ІУСТ,
2012. – С. 98-99.
20. Леонтьев А. К. Образование приказной системы управления в
Русском государстве / А. К. Леонтьев. – М., 1961.
21. Ерошкин Н. П. История государственных учреждений
дореволюционной России / Н. П. Ерошкин. – М.: Высш. шк., 1983. – С. 36–37.
22. Митяев К. Г. История и организация делопроизводства в СССР / К. Г.
Митяев. –М., 1959. – С. 32–41.
23. Сборник законодательных актов по делопроизводству, 1917–1970. –
М., 1973.
24. История делопроизводства в СССР: Учеб. пособие / Под ред. Я. З.
Лившица, В. А. Цикулина. – М., 1974.
25. Единая государственная система делопроизводства: (Основ.
положения). – М.:Главархив СССР, 1975.
26. Организация работы с документами. – М.: Инфра, 1998. – С. 50–57.
27. Про Національну програму інформатизації: Постанова Кабінету
Міністрів України від 31 серп. 1998 р. № 1352.
28. Об электронных документах и электронном документообороте
[Электронный ресурс]: Закон Украины от 22.05.2003 г. № 851_IV. – Режим
доступа: http://www.rada.gov.ua. – Загл. с экрана.
29. Про діловодство [Электронний ресурс]: Проект закону України:
Варіант 12 від 14.08.2003 р. – Режим доступу: http://www.rada.gov.ua. –
Заголовок з екрану.
30. ДСТУ 2394_94. Інформація та документація. Комплектування фонду,
бібліографічний опис, аналіз документів. Терміни та визначення. – Чинний від
01.01.1995. – К.: Держстандарт України, 1994. – 89 с.
153
31. Асеев Г. Г. Электронный документооборот: Учеб. / Г. Г. Асеев. – Х.:
ХГАК, 2000.
32. Коноплева И.А., / под ред. И.А. Коноплевой. — М.: Проспект, 2011.
— 328 с.; Ferilli, S. 2011.
33. Automatic Digital Document Processing and Management: Problems,
Algorithms and Techniques, Advances in Pattern Recognition, ISBN 978-0-85729-197-4.~Springer-Verlag London Limited, 2011.
34. Соколов Сергей Александрович HTML и CSS в примерах, типовых
решениях и задачах. Профессиональная работа. – М.: «Вильямс», 2007. – С.
416.
35. Сергеев Александр Петрович HTML и XML. Профессиональная
работа. – М.: «Диалектика», 2004. – С. 880.
36. Statistics in Education and the Science (With application to research).
Laurentina Paler-Calmorin, Melchor A. Calmorin, RBS, First Edition 1997, ISBN
971-23-2232-7.
37. Klass, Gary M. 2008. Creating Good Charts." Chapter 3 in Just Plain Data
Analysis: Finding, Presenting, and Interpreting Social Science Data.
38. Coll, R. A., Coll, J. H. & Thakur, G. (1994),“Graphs and tables: A four-factor experiment”, Communications of the ACM 37(3), pp. 77-86.
39. Carter, L. F. (1947), “An experiment on the design of tables and graphs
used for presenting numerical data”, Journal of Applied Psychology 31, pp. 640-650.
40. Kurosu, M., and Kashimura, K. (1995). Apparent Usability vs. Inherent
Usability: experimental analysis on the determinants of the apparent usability.
Conference companion on Human factors in computing systems, Denver, USA, pp.
292-293.
41. Hiltz, S. R. & Johnson, K. (1990), “User satisfaction with computer
mediated communication systems”, Management Science 30(6), pp. 739-764.
42. David Meyer. OOXML ratification faces delay after objection / David
Meyer – 2008. – 840c.
154
43. Дэвид Хантер. XML. Работа с XML / Дэвид Хантер, Джефф Рафтер,
Джо Фаусетт, Эрик Влист, 4-е издание – М.: «Диалектика», 2009. – 1344с.
44. Фримен Э. Изучаем HTML / Фримен Э. Фримен Э. – П.: «Питер»,
2010. – 656с.
45. Cong Yu ; Zhihong Yao; Mapping DICOM to OpenDocument format.
Proc. SPIE 7264, Medical Imaging 2009: Advanced PACS-based Imaging
Informatics and Therapeutic Applications, 72640Y (March 13, 2009);
doi:10.1117/12.811354.
46. Carpenter, Arthur L. and Dennis G. Fisher, 2011, “Reading and Writing
RTF Documents as Data: Automatic Completion of CONSORT Flow Diagrams”,
presented at the Western Users of SAS Software Conference, WUSS.
http://www.wuss.org/proceedings11/Papers_Carpenter_A_74920.pdf.
47. Microsoft Office for the Older and Wiser: Get Up and Running with Office
2010 and Office 2007, Sean McManus, John Wiley / University of the Third Age
(U3A), 978-0470711965, 308, full colour.
48. Klyahzkin, E. Shchepin, K. Zingerman. Hierarchical analysis of multi-column texts, Pattern Recognition and Image Analysis, Vol.5, No.1, 1995,
Interperiodica,pp. 1-12.
49. В. М. Кляцкин, К. М. Зингерман, В. В. Лазарев, Е. В. Щепин,
“Структурные методы распознавания сложноорганизованных исторических
табличных форм”, Круг идей: модели и технологии исторической
информатики, Труды III конференции Ассоциации «История и компьютер»,
1996, 109–132.
50. V. Kliatskine, G. Thorvaldsen, K. Zingerman, V. Lazarev, E. Shchepin, “A
structural method for the recognition of complex historical tables”, History &
Computing, 9, no. 3, Edinburg University Press, 1997, 58–77.
51. Shigarov A.O. A method for table detection in metafiles [Текст] /Shigarov
A.O., Bychkov I.V., Khmel’nov A.E., Ruzhnikov G.M. // Pattern Recognition and
Image Analysis. – 2009. – Vol. 19, No 4. P. 693–697.
155
52. Bychkov I.V. A method for table detection in metafiles [Текст] / Bychkov
I.V., Hmelnov A.E., Ruzhnikov G.M., Shigarov A.O. // In Proc. 9th Int. Conf. on
Pattern Recognition and Image Analysis: New Information Technologies. – Nizhni
Novgorod, 2008. – Vol. 1. – P. 66–69.
53. Microsoft Developer Network. – Режим доступа:
http://msdn.microsoft.com. – Загл. с экрана.
54. R. Koo, ‘модель для электронных документов’, Бюллетень ACM
SIGOIS, 10 (1), 23-33 (1989).
55. М. В. Губин. Модели и методы представления текстового документа в
системах информационного поиска; Автореф. дисс. канд. техн . наук .– М ., 2004.
56. Шигаров Алексей Олегович. Технология извлечения табличной
информации из электронных документов разных форматов: дис. ... канд. тех.
наук : 05.25.05 / Шигаров Алексей Олегович. . – Иркутск, 2009. – 143 с. –
Бібліогр. : с. 121–133.
57. Ng H.T., Lim C.Y., Li Teng Koo J. Learning to recognize tables in free text
// In Proc. 37th Annual Meeting of the Association for Computational Linguistics.
USA. 1999. P. 443-450.
58. Embley D.W., Tao C., Liddle S. Automating the extraction of data from
HTML tables with unknown structure // Data & Knowledge Engineering. Elsevier
Science Publishers. 2005. Vol. 54, No 1. P. 3-28.
59. 4. Chen H.-H., Tsai S.-C., Tsai J.-H. Mining tables from large scale HTML
texts // In Proc. 18th International Conference on Computational Linguistics.
Saarbrucken, Germany. 2000. P. 166-172
60. Полевой Дмитрий Валерьевич. Разработка моделей, методов и средств
обработки табличных документов в информационных системах : диссертация
на соискание ученой степени кандидата технических наук : 05.13.18 Москва,
2007 130 с. РГБ ОД, 61:07-5/2927
61. Fuhr, N., Hartmann, S., Knorz, G., Lustig, G., Schwantner, M., Tzeras, K.,
AIR/X – a rulebased multistage indexing system for large subject fields. In
156
Proceedings of RIAO-91, 3rd International Conference “Recherche d’Information
Assistee par Ordinateur” (Barcelona, ES, 1991), pp. 606–623., 1991
62. Cohen, W. W., Hirsch, H., Joins that generalize: text classification using
Whirl.In Proceedings of KDD-98, 4th International Conference on Knowledge
Discovery and Data Mining (New York, US, 1998), pp. 169–173., 1998], [Cohen, W.
W, Singer, Y., Context-sensitive learning methods for text categorization. ACM
Transactions on Information Systems 17, 2, 141–173., 1999
63. Li, Y. H., Jain, A. K., Classification of text documents. The Computer
Journal 41, 8, 537–546., 1998
64. Дрейпер Н., Смит Г. Прикладной регрессионный анализ: в 2 кн. Кн. 1 /
Пер. с англ. – 2-е изд., перераб. И доп. – М.: Финансы и статистика, 1986. – 336 с.
65. T. Joachims “A probabilistic analysis of the rocchio algorithm with TFIDF
for text categorization.”, In Proc. of the ICML'97, 143-151, 1997.
66. Shapire R.E./ Singer Y., Singhal A. Boosting and Rocchio applied to text
filtering // Proceedings of SIGIRS-98 / 21st ACM International Conferece on
Research and Development in Information Retrieval. – New York: ACM Press, 1998.
– P. 215-223.
67. D. T. Pham and E. Oztemel, Control chart pattern recognition using
combinations of multi-layered perceptrons and learning-vector quantisation neural
networks, Proc. IMechE, Part E, Journal of Process Mechanical Engineering, 207,
pp.113-118, 1994.
68. Y. Solano and H. Ikeda, A comparative study of eight learning algorithms
for arti_cial neural networks based on a real application, IEICE Transactions on
Fundamentals of Electronics Communications and Computer Sciences, E81A,
pp.355-357, 1998.
69. Larkey, L. S., Croft, W. B., Combining classifiers in text categorization. In
Proceedings of SIGIR-96, 19th ACM International Conference on Research and
Developmentin Information Retrieval (Zurich, CH, 1996), pp. 289–297., 1996
70. Yang, Y., Expert network: effective and efficient learning from human
decisions in text categorisation and retrieval. In Proceedings of SIGIR-94, 17th ACM
157
International Conference on Research and Development in Information Retrieval
(Dublin, IE, 1994),pp. 13–22., 1994
71. Важное об электронном документообороте, бизнес-процессах и
взаимодействии. DIRECTUM – Journal.ru // http://www.directum-journal.ru/special.aspx?ContentID=1649468.
72. Introduction to Oracle Reports. – Режим доступа:
http://docs.oracle.com/cd/E15523_01/bi.1111/b32121/pbr_intro001.htm – Загл. с
экрана.
73. Julie Woods McNamera. Crystal Reports Professional 6.0. // DBMS
Magazine. – Vol. 11. – №1. – 1998. – P. 27–30.
74. Профессиональное программирование в Microsoft Office Access 2003,
Элисон Балтер; -1296 с., с ил.; 2006, 1 кв.; Вильямс.
75. Наталья Рязанцева, Дмитрий Рязанцев. 1С: Бухгалтерия 8.0. Секреты
работы. Издательство БХВ-Петербург. ISBN 5-94157-785-0 2006 г.
76. Буч Г., Рамбо Дж., Джекобсон А. Язык UML. Руководство
пользователя. / Пер. с англ. М.: ДМК, 2000.
77. P. Pinheiro da Silva and N. Paton. User Interface Modelling with UML. In
Proceedings of the 10th European-Japanese Conference on Information Modelling
and Knowledge Representation, Saariselk¨a, Finland, May 2000. IOS Press.
78. Буч Г. Объектно-ориентированный анализ и проектирование с
примерами приложений на C++. 2-е изд./Пер. с англ. М.: Изд-во БИНОМ; СПб.:
«Невский диалект»,2000.
79. Pinheiro da Silva, P., 2000. User interface declarative models and
development environments: A survey. In Interactive Systems - Design, Specification,
and Verification: 7th International Workshop, DSV-IS 2000, Limerick, Ireland, June
2000. Revised Papers, Springer Berlin / Heidelberg, Lecture Notes in Computer
Science vol. 1946, pp. 207–226.
80. F. Moussa, C. Kolski, M. Riahi, A Model Based Approach to Semi-Automated User Interface Generation for Process Control Interactive Applications.
Interacting with Computers 12, 3 (2000) 245–279.
158
81. F. Moussa, M. Moalla, Toward a user centered system design
methodology: Application to the graphical interfaces design, AMSE Periodicals
Advanced in modelling and analysis 35 (1) (1995) 1–10.
82. F. Moussa, C. Kolski, Vers une formalisation d’une de´marche de
conception de synoptiques industriels:application au syste`me ERGO-CONCEPTOR,
Proceedings Colloque ERGO-IA Ergonomie et Informatique Avance´e, 7–9 October,
Biarritz, France, 1992.
83. Silva, A.R., Saraiva, J., Silva, R., Martins, C. (2007). XIS - UML profile
for extreme modeling interactive systems. In Proceedings of the 4th International
Workshop on Model-based Methodologies for Pervasive and Embedded Software
(MOMPES 2007). IEEE, March.
84. Pastor, O., Molina, J. (2007). Model-driven Architecture in Practice – A
software production environment based on Conceptual Modeling. Springer-Verlag.
85. Pastor, O., Insfrán, Pelechano, V., Romero, J., Merseguer, J. (1997). OO-METHOD: An OO software production environment combining conventional and
formal methods. In CAiSE '97: Proceedings of the 9th International Conference on
Advanced Information Systems Engineering, pages 145-158, London, UK. Springer-Verlag.
86. Pastor, O., Insfrán, E. (2003). OO-Method, the methodological support for
OlivaNova model execution system. Technical report, Care Technologies. White
paper. Available at http://www.care-t.com.
87. Molina, P., Pastor, O., Marti, S., Fons, J., Insfrán, E. (2001). Specifying
conceptual interface patterns in an object-oriented method with automatic code
generation. In Proceedings Second International Workshop on User Interfaces in Data
Intensive Systems, UIDIS 2001.
88. Jia, X., Steele, A., Liu, H., Qin, L., Jones, C. (2005). Using ZOOM
approach to support MDD. In Proceedings of the 2005 International Conference on
Software Engineering Research and Practice (SERP'05), Las Vegas, USA.
89. Jia, X., Steele, A., Qin, L., Liu, H., Jones, C. (2007). Executable visual
software modelling – the ZOOM approach. Software Quality Control, 15(1):27-51.
159
90. Puerta, Angel R., Eriksson, Henrik, Gennari, John H. and Musen, Mark A.
(1994): Beyond Data Models for Automated User Interface Generation. In: Cockton,
Gilbert, Draper, Steven and Weir, George R. S. Proceedings of the Ninth Conference
of the British Computer Society Human Computer Interaction Specialist Group -
People and Computers IX August 23-26, 1994, Glasgow, Scotland, UK. pp. 353-366.
91. Gennari, J.H. 1993. A Brief Guide to Maître and MODEL: An Ontology
Editor and a Frame-Based Knowledge Representation Language. Stanford
University, Knowledge Systems Laboratory, Report KSL-93-46, Stanford, California.
June 1993.
92. Eriksson, H., Puerta, A.R. and Musen, M.A. 1994. Generation of
Knowledge-Acquisition Tools from Domain Ontologies. In Proceedings of the Eighth
Banff Knowledge Acquisition for Knowledge-Based Systems Workshop. Banff,
Alberta, Canada. pp. 7.1–7.20.
93. Kleshchev Alexander, Gribova Valeriya. From an Ontology-Oriented
Approach Conception to User Interface Development // Information Theories &
Applications. – 2003. – Vol. 10, № 1. – P. 87-94.
94. Грибова В.В., Тарасов А.В., Черняховская М.Ю. Система
интеллектуальной поддержки обследования больных, управляемая онтологией
// Программные продукты и системы, 2007. №2. C. 49-51
95. Using Database Metadata and its Semantics toGenerate Automatic and
Dynamic Web Entry Forms. Mohammed M. Elsheh and Mick J. Ridley
96. А. В. Пастухов, В.В. Казимир., Применение стандарта XML при
проектировании пользовательского интерфейса интерактивных программ
//Проблемы программирования. 2000.-#1-2. - с. 307 - 315.
97. Чернецки К. Порождающее программирование. Методы,
инструменты, применение / У. Айзенекер, К. Чернецки // Издательский дом
Питер. – М. – СПб. – Харьков. – Минск. – 2005. – 730 с.
98. ГЕНЕЛЬТ А.Е. Автоматизированные методы разработки архитектуры
программного обеспечения: учебно-методическое пособие. - СПб.: СПбГУ
ИТМО, 2007. -133 с.
160
99. Ахо А., Ульман Дж. Теория синтаксического анализа,перевода и
компиляции. Т. 1: Синтаксический анализ. М.: Мир, 1978. — 612 с.
100. Пентус А. Е., Пентус М. Р. Теория формальных языков: Учебное
пособие. — М.: Изд-во ЦПИ при механико-математическом ф-те МГУ, 2004. - 80 с.
101. Большая советская энциклопедия. В 31 тт. / Под ред. A.M. Прохорова;
Н.К. Байбакова, A.A. Благонравова и др. Изд. 3-е, испр., перераб., расшир. и
доп. Т. 9. - М.: Издательство «Советская энциклопедия», 1969-1978.-623 с.
102. K. Alsabti, S. Ranka, V. Singh. An Efficient k-means Clustering
Algorithm, Proc. First Workshop High Performance Data Mining, Mar. 1998.
103. V. Faber. Clustering and the Continuous k-means Algorithm, Los
Alamos Science, vol. 22, pp. 138-144, 1994.
104. S.Z. Selim and M.A. Ismail, K-means-type Algorithms: A Generalized
Convergence Theorem and Characterization of Local Optimality, IEEE Trans. Pattern
Analysis and Machine Intelligence, vol. 6, pp. 81-87, 1984.
105. Уоссермен, Ф. Нейрокомпьютерная техника: Теория и практика =
Neural Computing. Theory and Practice. — М.: Мир, 1992. — 240 с. — ISBN 5-03-002115-9.
106. G. Celeux and J. Diebolt. The SEM algorithm : A probabilistic teacher
algorithm derived from the EM algorithm for the mixture problem. Computational
Statistics Quarterly, 2:73–82, 1985.
107. G.J. MacLachlan and T. Krishnan. The EM Algorithm and Extensions,
pages 120–211. Wiley, New York, 1997.
108. Yiming Yang, Xin Liu A re-examination of text categorization methods
//Proceedings of the 22nd annual international ACM SIGIR conference on Research
and development in information retrieval. – New York: ACM Press, 1999. – pp. 42-49.
109. The Apache Velocity Project. User guide.
http://velocity.apache.org/engine/devel/user-guide.html
110. JavaServer Pages. Hans Bergsten. First Edition, December 2000. ISBN:
1-56592-746-X, 572 pages.
161
111. Cachero, C., Gòmez, J., Pastor, O., “Object-Oriented Conceptual
Modeling of Web Application Interfaces: the OO-H Method Abstract Presentation
Model”, 2000
112. Damiano Distante, Paola Pedone, Gustavo Rossi, Gerardo Canfora.
Model-Driven Development of Web Applications with UWA, MVC and JavaServer
Faces, Web Engineering, 7th International Conference, ICWE 2007, Como, Italy,
July 16-20, 2007, Proceedings. Volume 4607 of Lecture Notes in Computer Science,
pages 457-472, Springer, 2007.
113. Christopher Scaffidi, Allen Cypher, Sebastian G. Elbaum, Andhy
Koesnandar, Brad A. Myers.Scenario-Based Requirements for Web Macro Tools. In
2007 IEEE Symposium on Visual Languages and Human-Centric Computing
(VL/HCC 2007), 23-27 September 2007, Coeur d Alene, Idaho, USA. pages 197-204,
IEEE Computer Society, 2007.
114. Raistrick, Chris; Colin Carter, Paul Francis; Ian Wilkie; John Wright.
Model Driven Architecture with Executable UML. Cambridge University Press,
2004. ISBN: 0-521-53771-1.
115. Hailpern and Tarr: Model-driven Development: The Good, the bad and
the ugly, IBM Systems Journal, vol.45, no 3, 2006.
116. Steve Cook, Microsoft Corporation: Domain-Specific Modeling and
Model Driven Architecture MDA Journal, January 2004.
117. Коутс P., Глеймник И. Интерфейс «человек-компьютер» М.: Мир,
1990. 234 с.71.
118. POI API Documentation [Электронный ресурс]. – The Apache
Software Foundation, 2010. Режим доступа: http://poi.apache.org/apidocs/
119. Kathleen, R., McKeown, R., Evans, D., Hatzivassiloglou, V., Kla-vans,
J., Nenkova, A., Sable, C., Schiffman, B., Sigelman, S., ‘Tracking and Summarizing
News on a Daily Basis with Columbia’s Newsblaster’, Proceedings of the Human
Language Technology Conference, 2002.
162
120. Brill, E., ‘A simple rule-based part of speech tagger’, Proceedings of the
Third Annual Conference on Applied Natural Language Processing, ACL, 1992, pp.
152-155
121. Kupiec, J., ‘Robust Part-of-speech tagging using a hidden Markov
model’, Computer Speech and Language 6, 1992, pp. 225-242] і полісемії [Ravin, Y.
and Leacock, C. (editors), ‘Polysemy: Theoretical and Computational Approaches’,
New York: Oxford University Press, 2000.
122. Ермаков А.Е. Тематический анализ текста с выявлением
сверхфразовой структуры // Информационные технологии. - 2000. -N11.
http://www.rco.ru/article.asp?ob_no=33
123. Ермаков А.Е., Плешко В.В. Ассоциативная модель порождения
текста в задаче классификации // Информационные технологии. -2000. -N 12.
http://www.rco.ru/article.asp?ob_no=32.
124. Levenshtein V.I. “Binary codes capable of correcting deletion, insertion
and reversal” Doklady Akademii Nauk SSR, 1966. - Vol. 163. - № 4. - Рр. 845-848.
125. Wagner R.A., Fisher M.J. “The string-to-string correction problem”
Journal of the ACM, 1974. -Vol 21. №1.-Рр. 168-173.
126. Wagner R.A., Fisher M.J. “The string-to-string correction problem”
Journal of the ACM, 1974. -Vol 21. №1.-Рр. 168-173.
127. Larose, Daniel T. “Discovering knowledge in data: an introduction to
data mining” / Daniel T. Larose.
128. ПИСЬМО Госкомстата РФ от 14.02.2002 N ОР-09-23/692
129. Document Object Model (DOM) Requirements. W3C Working Group
Note 26 February 2004. http://www.w3.org/TR/DOM-Requirements. Ben Chang,
Philippe Le Hégaret, Arnaud Le Hors, Ray Whitmer, Mike Champion, Tom Pixley,
Joe Kesselman, Andy Heninger, Angel Diaz, James Davidson, Lauren Wood, Jared
Sorensen
130. Кунгурцев, А.Б. Формирование словаря предметной области [Текст]
/ А.Б. Кунгурцев, И.В. Тыхан // Искусственный интеллект. – 2006. – № 1. – С.
144-151.
163
131. Кунгурцев, А. Метод построения словарей предметных областей
для извлечения фактов из текстов на естественном языке [Текст] / Алексей
Кунгурцев, Сергей Бородавкин, Алексей Голуб // Восточно-Европейский
журнал передовых технологий. – 2010. – T. 1, N 4(43). – С. 32-36. – Режим
доступа : URL :http://journals.uran.ua/eejet/article/view/2550.
132. Microsoft office excel 97-2007. Binary file format specification.
133. Дунько Ю.С. Структурно-синтаксический анализ электронных
документов с табличными структурами / Ю.С. Дунько, С.Ю. Марулин //
Информационные управляющие системы и компьютерный мониторинг: I
всеукраинская научно-техническая конференция студентов, аспирантов и
молодых учених, 19-21 мая 2010 г.: .: матеріали конференції — Донецк:
ДонНТУ, 2010. — С. 105-109.
134. Church, K. and Gale, W. (1995) “Inverse Document Frequency (IDF): A
Measure of Deviation from Poisson,” Proceedings of the Third Workshop on Very
Large Corpora, pp. 121-130.
135. Yamamoto, M. and Church, K (2001) “Using Suffix Arrays to compute
Term Frequency and Document Frequency for All Substrings in a
Corpus,”Computational Linguistics, vol 27:1, pp. 1-30, MIT Press.
136. H. Wu and R. Luk and K. Wong and K. Kwok. "Interpreting TF-IDF
term weights as making relevance decisions". ACM Transactions on Information
Systems, 26 (3). 2008.
137. Сауд Ибаа. Автоматизированное создание безопасных SQL-запросов в гетерогенных системах с иерархическим распределением доступа к
данным / Ибба Сауд, А.А. Блажко // Труды двенадцатой международной
научно-практической конференции „Современные информационные и
электронные технологии” г.Одесса, 23-27 мая, 2011. – С 168.
138. Постановление Минтруда России от 26 марта 2002 г. № 23 Об
утверждении норм времени на работы по документационному обеспечению
управленческих структур федеральных органов исполнительной власти –
164
(Нормативный документ Министерства труда и социального развития
Российской Федерации).
139. Landauer, T. K. An introduction to latent semantic analysis / T. K.
Landauer, P. Foltz, D. Laham // Discourse Processes. – 1998. – №25. – P. 259–284.
140. Развитие продвинутых навыков скольжения и сканирования при
быстром чтении [Электронный ресурс]. – Режим доступа:
http://www.prosvetlenie.org/razum/16/index.html. – 29.01.2012.
141. Клини C. Математическая логика. – М.: Мир, 1973. – 480 с.
142. Tutorial on semi-structured data by Peter Buneman from Symposium on
Principles of Database Systems, 1997.
143. Semi-Structured Text Documents as Data Sources / V.A. Gubin //
Bionics of Intelligence: Sci. Mag. – 2010. – № 3 (74). – P. 109–111.
144. Peter Buneman. Semistructured data. In PODS'97, 1997. Invited
Tutorial.
145. Peter Buneman, Susan B. Davidson, Mary F. Fernandez, and Dan Suciu.
Adding structure to unstructured data. In Foto N. Afrati and Phokion Kolaitis, editors,
Database Theory_ICDT'97, 6th International Conference, volume 1186 of Lecture
Notes in Computer Science, pages 336-350, Delphi, Greece, 8-10 January 1997.
146. Губин, В.А. Объектное представление электронных текстовых
документов [Текст] / В.А. Губин, А.Н. Гвоздинский // Радиоэлектроника и
информатика. –2007. – № 1 (36). – С. 61-63.
147. Анищенко В.С. Детерминированный хаос // Соросовский
образовательный журнал, 1997, №6, С. 70-76.
148. Data Migration between Document-Oriented and Relational Databases
Bogdan Walek, Cyril Klimes. World academy of science, engineering and technology
issue 0069, September 2012, P. 894-899.
- Стоимость доставки:
- 200.00 грн