Каталог / ТЕХНИЧЕСКИЕ НАУКИ / Элементы и устройства вычислительной техники и систем управления
скачать файл:
- Название:
- Заболотня Тетяна Миколаївна. Інверсний контекстно-асоціативний метод та програмні засоби автоматизованої орфокорекції природомовних текстових об’єктів
- Альтернативное название:
- Заболотная Татьяна Николаевна. Инверсный контекстно-ассоциативный метод и программные средства автоматизированной орфокоррекции природоязычных текстовых объектов
- ВУЗ:
- Національний технічний університет України «КПІ», Київ
- Краткое описание:
- Заболотня Тетяна Миколаївна. Інверсний контекстно-асоціативний метод та програмні засоби автоматизованої орфокорекції природомовних текстових об’єктів : Дис... канд. наук: 05.13.05 2008
Заболотня Т.М. Інверсний контекстно-асоціативний метод та програмні засоби автоматизованої орфокорекції природномовних текстових об’єктів. Рукопис.
Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.05 комп’ютерні системи та компоненти. Національний технічний університет України «КПІ», Київ, 2008.
Дисертаційна робота присвячена розробці контекстно-асоціативних методів та програмних засобів орфокорекції, реалізація яких забезпечує підвищення швидкості та точності виправлення орфографічних помилок комп’ютерними системами автоматичної обробки текстів (АОТ).
Запропоновано інверсний контекстно-асоціативний метод автоматизованого виправлення орфографічних помилок шляхом ітеративного чергування процедур відбору гіпотез із лексико-семантичного словника за ознакою близькості за змістом до контексту та наступної їх перевірки на відповідність формальним критеріям схожості на спотворене слово. Застосування даного методу дозволяє підвищити ефективність відповідних програмних засобів за рахунок зменшення кількості операцій щодо обробки наборів гіпотез у ході орфокорекції.
Подано спосіб структурно-алгоритмічної організації орфокоректора у формі спеціалізованого реактивного програмного агента, який забезпечує його взаємодію з модулями відкритих систем АОТ.
Експериментально досліджено ефективність запропонованого методу орфокорекції та його програмної реалізації згідно з агентним підходом до побудови ПЗ за умови їх використання в інформаційно-пошуковій системі Єдиного інформаційного середовища НТУУ «КПІ». Отримані результати підтвердили теоретичні положення дисертації та дозволили визначити рекомендовані значення параметрів алгоритмів виправлення помилок, встановлення яких забезпечує ефективну роботу розробленого орфокоректора.
В дисертаційній роботі запропоноване нове вирішення задачі створення програмних засобів автоматизованого виправлення орфографічних помилок, яке знайшло відображення в розробці та експериментальному дослідженні інверсного контекстно-асоціативного методу орфокорекції, спрямованого на підвищення швидкодії та точності роботи відповідного ПЗ, а також у розробці способу структурно-алгоритмічної організації орфокоректора, яка забезпечує його інтегрованість до відкритих систем АОТ.
1. На основі дослідження існуючих методів та засобів автоматизованого виправлення орфографічних помилок у природномовних текстових об’єктах аргументовано доцільність використання алгоритмів семантичного аналізу текстових даних у ході орфокорекції, показано необхідність визначення місця процедури семантичноорієнтованого аналізу контексту в загальній схемі орфокорекції, обґрунтовано актуальність розробки способів структурно-алгоритмічної організації програмного орфокоректора, здатного гнучко налаштовуватись на взаємодію з модулями довільних сучасних систем АОТ.
2. Доведено доцільність формування множини гіпотез, виходячи з наявності у них семантико-асоціативних зв’язків з контекстом. Такий спосіб реалізації етапу вибору гіпотез дозволяє обмежити число операцій щодо перевірки наборів альтернатив на відповідність спотвореному слову та зменшити потужність множини нерелевантних варіантів виправлення, які пропонуються орфокоректором.
3. Запропоновано інверсний контекстно-асоціативний метод виправлення орфографічних помилок шляхом ітеративного чергування процедур відбору гіпотез із словника за ознакою семантичної близькості до контексту та наступної їх перевірки на відповідність формальним критеріям подібності до спотвореного слова, такий, що забезпечує підвищення швидкості та точності роботи орфокоректора.
4. Запропоновано спосіб оцінювання ступеня семантичної близькості альтернативи виправлення до оточення спотвореного слова за мінімальною з довжин найкоротших шляхів від неї до елементів контексту у графі словника. Застосування даного способу дозволяє зменшити кількість операцій щодо перевірки наборів гіпотез на відповідність спотвореному слову у ході орфокорекції.
5. Розроблено спосіб формування предметноорієнтованого словникового ресурсу шляхом автоматизованої модифікації існуючого універсального лексико-семантичного словника з урахуванням вимог до терміносистеми конкретної предметної галузі. Використання спеціалізованого словника відповідними програмними засобами дозволяє оперативно та точно аналізувати текстові дані з певної тематики.
6. Запропоновано спосіб структурно-алгоритмічної організації орфокоректора у формі спеціалізованого реактивного програмного агента, що забезпечує його інтегрованість до існуючих відкритих систем АОТ та оперативну взаємодію з їх модулями.
7. Розроблено програмні засоби, які реалізують запропонований інверсний контекстно-асоціативний метод виправлення орфографічних помилок у природномовних текстових даних та використовуються у межах Єдиного інформаційного середовища НТУУ «КПІ». Створено програмний інструментарій модифікації універсального лексико-семантичного ресурсу формату WordNet 3.0. Отримані результати експериментальних досліджень розробленого орфокоректора підтвердили теоретичні положення даної дисертаційної роботи, що дозволило визначити рекомендовані значення параметрів алгоритмів виправлення помилок, встановлення яких забезпечує ефективну роботу даного програмного продукту.
- Стоимость доставки:
- 150.00 грн