ІНФОРМАЦІЙНА ТЕХНОЛОГІЯ АВТОМАТИЗОВАНОЇ ПЕРЕРОБКИ ТЕКСТОВОЇ ІНФОРМАЦІЇ ПРИ СТВОРЕННІ ЕЛЕКТРОННИХ СЛОВНИКІВ-ТЕЗАУРУСІВ




  • скачать файл:
Назва:
ІНФОРМАЦІЙНА ТЕХНОЛОГІЯ АВТОМАТИЗОВАНОЇ ПЕРЕРОБКИ ТЕКСТОВОЇ ІНФОРМАЦІЇ ПРИ СТВОРЕННІ ЕЛЕКТРОННИХ СЛОВНИКІВ-ТЕЗАУРУСІВ
Тип: Автореферат
Короткий зміст:

 

 

ОСНОВНИЙ ЗМІСТ РОБОТИ

 

Вступ розкриває суть проблеми. У ньому обґрунтовується актуальність теми, формулюється мета роботи, завдання, об’єкт та предмет, визначено методичну базу дослідження, висвітлено наукову новизну та практичне значення.

У першому розділі проведено огляд існуючих систем автоматизації лексикографічних задач, сучасний стан, типи та формати електронних словників. Невирішеними є наступні задачі:

1. Задача автоматизації створення електронних словників, оскільки сучасні системи інформаційного пошуку, системи реферування, витягання знань, класифікації даних, системи машинного перекладу для поліпшення якості своєї роботи не можуть обходитися без використання спеціалізованих словників.

2. Необхідно створення лексикографічного процесора в цілому, або деяких його компонентів, для автоматизації процесу перетворення паперових словників в електронну форму і створення електронного словника.

3. Існуючих на даний момент електронних словників, які можуть бути інтегровані в інформаційно-пошукові системи, системи анотування, реферування і перекладу, недостатньо, а їх формат даних розрізнений, що робить важким їхнє використання в різних системах. Необхідно вирішити питання розробки універсального формату зберігання електронного словника, який дозволить інтегрувати цей словник в інші лінгвістичні системи.

4. Найбільш потрібними є словники-тезауруси, оскільки вони є основою для складніших словарних систем, дозволяючи обробляти смислові компоненти текстів.

5. Більшість існуючих методів розпізнавання складні для реалізації або їх програмна реалізація відсутня, це стосується, у тому числі, і питань, які пов’язані з обробкою текстової інформації в лінгвістичних задачах. Тому існує необхідність використання методів розпізнавання, заснованих на простих, швидких і зручних в реалізації методах.

У другому розділі наведено узагальнене поняття моделювання лексикографічних систем, визначено проблеми й завдання моделювання таких систем, досліджено особливості моделювання словника-тезауруса, запропоновано механізм розмітки текстів у документах.

Сьогодні для формалізації теоретичних питань лексикографії широко використовується інформаційне моделювання лексикографічних ефектів. Під цим моделюванням розуміється наступне: інформаційна модель, що відповідає певній системі S довільної природи, повинна відображати лексикографічні аспекти системи S. В результаті такого моделювання формується лексикографічна система LS, що відображає елементи системи S, при цьому отримують структуровану лексикографічну систему, відповідну деякій початковій системі.

Словником є спеціальний вид тексту, в якому у систематизованому і структурованому вигляді представляється опис лексики певної мови в одному випадку, або лексики конкретної області – в іншому випадку. Але словник слід розглядати і як специфічний об’єкт техніки, а саме – інформаційну систему, в якій за допомогою поліграфічного виконання в паперовій копії або за допомогою елементів розмітки в електронному форматі позначені певні лінгвістичні ефекти. Ними можуть бути: шрифтові виділення, позиційні розміщення, спеціальні позначення і інше, які відіграють роль ідентифікаторів відповідних інформаційних змін.

Розробка програмних комплексів, орієнтованих на вирішення лексикографічних завдань, вимагає набору адекватних формальних інформаційних моделей словарних систем, які могли б відіграти роль початкової концептуальної бази для програмування лексикографічного процесора або його складових частин. Інтерпретація лексикографічних систем як інформаційних систем спеціального типу вимагає дотримання єдиної методології їх проектування. В першу чергу визначається загальна архітектура системи, розробляються складові частини цієї архітектури, зв’язки і відображення між ними. Відповідно до ANSI/X3/SPARK в архітектурі інформаційної системи виділяються три рівні опису даних: концептуальний, внутрішній і зовнішній.

 

Заказать выполнение авторской работы:

Поля, позначені * обов'язкові для заповнення:


Заказчик:


ПОШУК ГОТОВОЇ ДИСЕРТАЦІЙНОЇ РОБОТИ АБО СТАТТІ


Доставка любой диссертации из России и Украины


ОСТАННІ СТАТТІ ТА АВТОРЕФЕРАТИ

ГБУР ЛЮСЯ ВОЛОДИМИРІВНА АДМІНІСТРАТИВНА ВІДПОВІДАЛЬНІСТЬ ЗА ПРАВОПОРУШЕННЯ У СФЕРІ ВИКОРИСТАННЯ ТА ОХОРОНИ ВОДНИХ РЕСУРСІВ УКРАЇНИ
МИШУНЕНКОВА ОЛЬГА ВЛАДИМИРОВНА Взаимосвязь теоретической и практической подготовки бакалавров по направлению «Туризм и рекреация» в Республике Польша»
Ржевский Валентин Сергеевич Комплексное применение низкочастотного переменного электростатического поля и широкополосной электромагнитной терапии в реабилитации больных с гнойно-воспалительными заболеваниями челюстно-лицевой области
Орехов Генрих Васильевич НАУЧНОЕ ОБОСНОВАНИЕ И ТЕХНИЧЕСКОЕ ИСПОЛЬЗОВАНИЕ ЭФФЕКТА ВЗАИМОДЕЙСТВИЯ КОАКСИАЛЬНЫХ ЦИРКУЛЯЦИОННЫХ ТЕЧЕНИЙ
СОЛЯНИК Анатолий Иванович МЕТОДОЛОГИЯ И ПРИНЦИПЫ УПРАВЛЕНИЯ ПРОЦЕССАМИ САНАТОРНО-КУРОРТНОЙ РЕАБИЛИТАЦИИ НА ОСНОВЕ СИСТЕМЫ МЕНЕДЖМЕНТА КАЧЕСТВА