СТРУКТУРНО-СЕМАНТИЧНІ ТА ФУНКЦІОНАЛЬНІ ХАРАКТЕРИСТИКИ МІЖЧАСТИНОМОВНОЇ МОРФОЛОГІЧНОЇ ОМОНІМІЇ СУЧАСНОЇ УКРАЇНСЬКОЇ МОВИ : СТРУКТУРНО-семантические и функциональные характеристики МЕЖЧАСТИЧНОЯЗЫКОВОЙ морфологической омонимии СОВРЕМЕННОГО УКРАИНСКОГО ЯЗЫКА



Название:
СТРУКТУРНО-СЕМАНТИЧНІ ТА ФУНКЦІОНАЛЬНІ ХАРАКТЕРИСТИКИ МІЖЧАСТИНОМОВНОЇ МОРФОЛОГІЧНОЇ ОМОНІМІЇ СУЧАСНОЇ УКРАЇНСЬКОЇ МОВИ
Альтернативное Название: СТРУКТУРНО-семантические и функциональные характеристики МЕЖЧАСТИЧНОЯЗЫКОВОЙ морфологической омонимии СОВРЕМЕННОГО УКРАИНСКОГО ЯЗЫКА
Тип: Автореферат
Краткое содержание:

У Вступі обґрунтовано актуальність теми, окреслено об’єкт і предмет дослідження, сформульовано мету та завдання роботи, подано відомості про наукову новизну отриманих результатів та їх практичне застосування.


Перший розділ “Теоретичні засади вивчення міжчастиномовної морфологічної омонімії як одного із типів мовної неоднозначності” присвячено аналізу природи морфологічної омонімії як одного із типів мовної неоднозначності. Неоднозначність мовних одиниць розглянуто в площині проблеми асиметрії мовного знака, проблеми “розуміння тексту” як людиною, так і комп’ютером. У розділі подано огляд існуючих підходів до виділення та класифікації омонімів. Розкрито недостатність та суперечливість поглядів стосовно вивчення омографів. Обґрунтовано закономірності мовної природи явища морфологічної омонімії. Проаналізовано головні принципи контекстного аналізу як способу автоматичного усунення міжчастиномовної морфологічної омонімії текстових одиниць.


Однією з визначальних властивостей мови як знакової системи є те, що більш місткий за обсягом і багатовимірний за структурною організацією план змісту не має однозначного відповідника в плані вираження. У сучасному мовознавстві неоднозначність розглядається як абсолютна лінгвістична універсалія, яка проявляється на всіх мовних рівнях: фонетичному, лексичному, граматичному і, відповідно, може бути властивою всім мовним одиницям.


Об’єктом даного дослідження, як зазначалося, є графічно тотожні словоформи, які мають різне морфологічне значення. Тотожність омографів у формальному (графемному) аспекті та відмінності їх у змістовому (граматичному чи лексичному) відображають знакову природу писемної форми мови – невідповідність плану вираження й плану змісту мовних одиниць.


Дефініцію “морфологічні” вживаємо для експліцитного розмежування серед граматичних омонімів синтаксичних та морфологічних, що відповідає виділенню двох відповідних різновидів граматичної семантики. Морфологічний компонент значення таких одиниць розглядаємо в двох площинах: як загальне лексико-граматичне значення та як значення граматичних категорій у межах однієї частини мови.


Різні за своїм граматичним значенням, графемно тотожні словоформи в науковій літературі кваліфікуються по-різному: як омографи, омоформи, міжпарадигматичні омоніми. Непослідовність у трактуванні омонімічних одиниць, проблеми розмежування системної та текстової омонімії, повної та часткової, зумовлюються розбіжністю підходів до аналізу явища та неоднозначністю термінів, якими послуговуються для їх визначення, – слово, словоформа, значення.


З огляду на рівноправність в плані вираження графемної та звукової форми представлення, що відповідає різним формам існування мови – писемній та усній, а в плані значення – розмежування лексичного й граматичного значень, вважаємо доцільним виділення в межах омонімії мови морфологічних омонімів як окремого закономірного мовного явища. Специфіка предмета дослідження потребує розробки відповідних методик та прийомів його вивчення.


У другому розділі “Кількісні та якісні характеристики типів та моделей міжчастиномовних морфологічних омонімів сучасної української мови” запропоновано та реалізовано спеціальну методику виділення омонімів за словником словоформ, сформованим на базі граматичної ЛБД УМІФу НАНУ. Описано принципи формування лінгвістичної бази міжчастиномовних морфологічних омонімів (ММО) на основі попередньо визначеного списку. У розділі здійснено класифікацію досліджуваних омонімів за їхніми структурними характеристиками, представленими у відповідних моделях. Оцінено продуктивність встановлених типів та моделей ММО.


Зважаючи на те, що омографи, які репрезентують омонімію форм всередині парадигми, омонімію між формами різних лексем, не фіксуються, та й не можуть фіксуватися в словниках, оскільки словники зорієнтовані на подання в них вихідної форми, формування реєстру міжчастиномовних морфологічних омонімів вимагає розробки спеціальної методики. У нашій роботі для укладання повного реєстру міжчастиномовних морфологічних омонімів української мови запропоновано методику виділення омонімів за словником словоформ.


Базою побудови словника словоформ є розроблена в УМІФі граматична ЛБД, реєстр якої сягає 171 620 лексем (без урахування власних назв), автоматично маркована в кодах граматичних класів та підкласів. За допомогою програми синтезу парадигм її було розгорнуто в список обсягом 3 094 174 словоформи, який вважається достатньо репрезентативним для вирішення поставленого завдання. Для кожної із словоформ списку поставлено відповідні їй граматичні коди, тобто позначення словозмінних частиномовних характеристик слів.


Для омонімічних одиниць списку системою автоматичного морфологічного аналізу проставлено двосимвольні коди, що відповідають усім теоретично можливим граматичним значенням омонімічної словоформи, які можуть реалізуватися нею в тексті. Наприклад, словоформі мати за цим принципом відповідатиме ланцюжок <ГФЙАЙУЙШКИКК>, що тлумачиться як: іменник чоловічого роду називного відмінка множини іменника мат (ЙА в ланцюжку), іменник чоловічого роду знахідного відмінка множини іменника мат (ЙУ), іменник чоловічого роду кличного відмінка множини іменника мат (ЙШ), іменник жіночого роду називного відмінка однини від іменника мати (КИ), іменник жіночого роду кличного відмінка однини від іменника мати (КК) та дієслово в неозначеній формі мати (ГФ).


Обчислювальний експеримент виявив, що зі списку 3 094 174 словоформ 1 539 802 словоформи є однозначними, а для решти – 1 554 372 словоформ – одержано відповідні омонімічні коди. Представлена двосимвольними кодами граматична семантика кожної словоформи показує здатність омоніма виражати певну кількість граматичних значень. Наприклад, 6 двокомпонентних кодів наведеної вище словоформи мати свідчать про те, що ця словоформа в тексті може реалізувати значення двох граматичних класів (дієслова, іменника).


Визначаючи основним структурним елементом омонімічної системи мови омонімічний ряд як “сукупність слів або словоформ однієї мови в один і той же період її існування, що тотожні в плані вираження, але істотно різняться між собою в плані змісту”, під час опису підсистеми морфологічних омонімів ми розглядаємо поняття тотожності в плані вираження як однаковий графемний склад морфологічних омонімів, а різницю в плані змісту – як відмінності в їхньому граматичному значенні. Таким чином, під омонімічним рядом розуміємо сукупність морфологічно неоднозначних, графічно тотожних одиниць, об’єднаних однією формою.


Реєстр омонімічних рядів – 610 612 одиниць, представлених у словнику словоформ, одержано шляхом зведення в отриманому списку графічно тотожних словоформ. Отже, представленням ОР у нашому дослідженні є словоформа з визначеним для неї омонімічним кодом, тобто кодом, довжина якого більша або дорівнює двом двосимвольним кодам. Так, омонімічний ряд {поверх – ім., чол. р., З. в., одн. (ЙВ), поверх – ім., чол. р., Н. в., одн. (ЙИ), поверх – присл., (НО), поверх – прийм. (ПР)} у списку подається як поверх <ЙВЙИН0ПР>.


Омонімічні коди, поставлені у відповідність до ОР, є формальним представленням структурних моделей морфологічних омонімів, тобто модель репрезентує усі морфологічні функції, які можуть реалізувати в тексті елементи відповідного омонімічного ряду.


Список моделей морфологічних омонімів, представлених у словнику словоформ, формувався за списком попередньо виділених ОР шляхом зведення до однієї моделі тих ОР, що мають однакові омонімічні коди. У результаті було одержано список з 1486 різних структурних моделей ММО української мови.


Поняття типу ММО введено нами для розрізнення міжчастиномовних морфологічних омонімів і тих, що представляють омонімію форм у парадигмі слова в межах одного граматичного класу. Омонімічний тип у даному випадку відображає збіг граматичних властивостей лише на рівні морфологічних класів, функцію яких може виконувати омонім, без урахування конкретного граматичного значення. Формальною процедурою виділення ТММО є перетворення омонімічного ланцюжка кодів, яким представлена модель омографа, в ланцюжок на позначення граматичних класів, які й репрезентують можливості омоніма щодо актуалізації ним у тексті його частиномовних значень.


Так, за словником словоформ, дві моделі – ГЬЙВЙИСП (наказ. спосіб, дієсл. недок. в., одн.; іменн., З. в., чол. р., одн.; іменн., Н. в., одн.; сполучн.) та ГЬКЕСПґЬ (наказ. спосіб дієсл. док. та недок. в., одн.; іменн., жін. р., З. в., множ.; сполучн.), представляють омонімічні ряди словоформ ніж та мов, що репрезентують один тип міжчастиномовних морфологічних омонімів дієслово/іменник/сполучник (ДІС).


Для аналізу ММО в мові була сформована спеціальна лінгвістична база даних, яка представляє:


§  реєстр міжчастиномовних морфологічних омонімів сучасної української мови;


§  моделі та типи міжчастиномовних морфологічних омонімів, яким відповідають конкретні словоформи.


Як показали результати аналізу ЛБД з погляду співвідношення кількості ММО та морфологічних омонімів всередині одного граматичного класу, перші становлять 2 % (10 203) від загальної кількості реєстрових одиниць. Решта 98 % (600 409) – це омоніми всередині парадигми окремих граматичних класів.


Виділена група міжчастиномовних омонімів розподіляється за 81 омонімічним типом та 820 моделями, які репрезентують існуючі в українській мові омонімічні відношення між різними лексико-граматичними класами слів. Шість із них охоплюють 95 % усіх міжчастиномовних омонімів (9667 омографів). До них належать типи: ад’єктив / іменник (5670 омографів) ‘вартові, наречені’, дієслово / іменник (2406) ‘коти, лови’, ад’єктив / дієслово (588) ‘бадьорим, білим’, дієслово / прислівник (389) ‘значимо, мислимо’, іменник / прислівник (342) ‘візаві, ажур’, ад’єктив / прислівник (272) ‘балакуче, благословенно’. Саме вони й можуть уважатися ядром ММО української мови.


У результаті аналізу всіх типів ММО, виділених за базою даних, було встановлено, що у відношення міжчастиномовної морфологічної омонімії вступають усі одинадцять граматичних класів, виділених за прийнятою нами класифікацією: іменник, дієслово, ад’єктив, прислівник, сполучник, числівник, займенник-іменник, займенник-прикметник, прийменник, вигук, частка. Прийменник вступає в омонімічні відношення з найменшою кількістю лексико-граматичних класів (5). З найбільшою кількістю лексико-граматичних класів взаємодіють дієслово, прислівник та іменник.


Аналіз омонімічних типів з погляду їхнього кількісного компонентного складу показав, що довжина омонімічних типів варіюється в діапазоні від двох до шести. Більшість омографів представлені двокомпонентними омонімічними ланцюжками – 98,46 %. Визначене нами ядро міжчастиномовної морфологічної омонімії належить саме до цієї групи омографів.


Описані типи та моделі ММО репрезентують потенційні можливості словникового складу української мови. Системний аналіз досліджуваного явища морфологічної омонімії передбачає розгляд його в аспекті зіставлення мовно-мовленнєвих властивостей ММО з погляду реалізації визначених потенцій в реальних текстах. Цьому аналізу присвячено розділ 3 дисертації “Функціонування міжчастиномовних морфологічних омонімів в українських текстах”.


У розділі розглядається специфіка функціонування типів міжчастиномовних морфологічних омонімів у текстах наукового, публіцистичного та художнього стилів. Здійснюється порівняльний аналіз ТММО в мові та текстах. Визначається частота вживання ТММО в текстах та їх специфіка щодо наповнюваності омонімічними рядами. Особливу увагу в розділі зосереджено на представленні залежності частотної характеристики типів міжчастиномовних морфологічних омонімів від їх кількісного компонентного складу та граматичних властивостей компонентів омонімічного коду. У розділі розглядається методика автоматичного формування електронного словника міжчастиномовних морфологічних омонімів на основі розробленої бази даних.


ЛБД функціонування міжчастиномовних морфологічних омонімів у текстах сучасної української мови сформовано на текстах корпусу наукового, публіцистичного та художнього стилів, кожен із яких представлено вибірками обсягом 1 000 000 словоформ.


Принцип репрезентативності в даному випадку реалізується завдяки тому, що, по-перше, обрані для аналізу три стилі в основному представляють сучасну українську мову і, по-друге, як показав попередній аналіз матеріалу, в сукупній вибірці в 3 000 000 словоформ він представляє 95,06 % всіх типів ММО, властивих українській мові.


З-поміж виділених у текстах морфологічних омонімів міжчастиномовні омоніми найбільше представлені в художніх текстах, де їх частка становить 53,23 % (298 678 ММО) стосовно загальної кількості морфологічно неоднозначних словоформ. У публіцистичному стилі їх частка становить 41,21 % (254 713 ММО). Найменшу частку зафіксовано в текстах наукового стилю – 34,39 % (225 746 ММО).


За кількістю омонімічних рядів, які представляють міжчастиномовні омоніми в досліджуваних вибірках, перше місце посідає публіцистичний стиль, де зафіксовано 2355 ОР, у художніх текстах їх – 2150 та найменша кількість зафіксована в текстах наукового стилю – 1880. Загалом в аналізованій нами ЛБД текстів сучасної української мови реалізовано 58 % (5940) з реєстру ММО української мови.


Для розробки алгоритмів автоматичного усунення морфологічної омонімії особливо вагомою є інформація про реалізовані текстами типи міжчастиномовних омонімів та частоту їх вживання. Виділені в текстах типи ММО обумовлюють вибір конкретних текстових ситуацій, а за даними про частоту моделей визначається ієрархія правил алгоритму.


З 81 типу міжчастиномовних морфологічних омонімів, визначених для української мови, в досліджуваних текстах наукового стилю зафіксовано 70 типів, публіцистичного – 75 типів та художнього – 77. Отже, художній стиль реалізує максимальну кількість потенційно заданих мовою ММО. Найменший їх відсоток виявлено в науковому стилі. 70 типів міжчастиномовних морфологічних омонімів (із списку теоретично можливих) зафіксовано в усіх вибірках і їх можна вважати регулярними – такими, що функціонують в текстах усіх досліджуваних стилях сучасної української мови.


На сьогодні в українській лексикографії словника міжчастиномовних морфологічних омонімів, який би містив повний список усіх потенційних типів та моделей неоднозначних словоформ, немає. Це пояснюється тим, що досі лінгвісти були позбавлені можливості залучення комп’ютерних технологій до обробки репрезентативного повнотекстового мовного матеріалу.


Електронний словник ММО сучасної української мови було побудовано автоматично на основі бази даних, створеної за словником словоформ, синтезованим на основі граматичної лексикографічної системи української мови обсягом 3 094 174 словоформи, та стилістично диференційованого корпусу текстів за допомогою розробленого в УМІФі програмного забезпечення.


Словник міжчастиномовних морфологічних омонімів сучасної української мови містить таку інформацію:


·        реєстр міжчастиномовних морфологічних омонімів – близько 11 300 одиниць;


·        кожному із представлених у реєстрі омографів поставлена у відповідність модель, що описує морфологічні характеристики його компонентів;


·        для кожного компонента омонімічної моделі дається вихідна форма (вихідні форми виводилися автоматично за допомогою програми лематизації, розробленої в УМІФі);


·        про реалізацію реєстрових одиниць у Національному лінгвістичному корпусі обсягом 42 млн слововживань (омографи, які не зустрілися жодного разу, позначені зірочкою).


Розроблена для словника пошукова система дає можливість формувати запити не лише за конкретним омонімом, а й за будь-яким типом інформації, представленої в словниковій статті: за значеннями граматичних класів ММО, за конкретними граматичними значеннями компонентів омоніма.


У четвертому розділі “Контекстна детермінація міжчастиномовних морфологічних омонімів сучасної української мови” розглянуто принципи формування лінгвістичної бази контекстів ММО та лінгвістичної бази діагностувальних контекстів, виділеної з ЛБД контекстів для дослідження міжчастиномовних морфологічних омонімів сучасної української мови. У розділі визначено загальні принципи формування правил автоматичного усунення омонімії текстових одиниць на основі діагностувальних контекстів.


У даному дослідженні основним засобом опису контекстної реалізації міжчастиномовних морфологічних омонімів є сформована на текстах українського корпусу спеціальна лінгвістична база контекстів ММО. Головне призначення її полягає у фіксації всіх можливих контекстів конкретного омоніма, моделі або типу в аналізованих текстах. База контекстів формувалася на основі морфологічно розміченого корпусу текстів трьох стилів обсягом 3 000 000 словоформ. Цю базу було інтегровано до бази міжчастиномовних морфологічних омонімів, описаної в розділі 2. Коригування сформованих правил усунення омонімії та доповнення їх новими здійснювалося на нових текстах наукового та публіцистичного стилів.


База контекстів формувалася на основі вибраних із морфологічно анотованого корпусу речень, які містять конкретний омограф. Речення представлено стільки разів, скільки в ньому вжито омографів. Омонім у реченні супроводжується диз’юнктивним кодом – ланцюжком двосимвольних кодів. Наприклад, для омоніма дзвони подається його код <ГЬЙАЙУЙШ>.


База лінгвістичних контекстів ММО складається з трьох таблиць: Таблиця лексико-граматичних контекстів міжчастиномовних морфологічних омонімів (Таблиця 1), Таблиця діагностувальних контекстів моделей ММО (Таблиця 2) та Таблиця діагностувальних контекстів у межах типу (Таблиця 3).


Матеріалом для формування таблиці 1 є контексти ММО, визначені на текстах публіцистичного стилю загальною кількістю 1 млн словоформ і представлені у вигляді конкордансів ММО, довжина яких визначалася сімома текстовими одиницями (ТО) ліворуч і праворуч від омоніма в межах речення. Попередній аналіз показав, що саме в цих межах у 95 % перебувають контекстні детермінанти актуалізованого текстового значення ММО. Розділові знаки – кома, тире, крапка, крапка з комою тощо – вважаються на рівні зі словами окремими складниками контексту.


За результатами попереднього аналізу було встановлено необхідні й достатні ознаки текстового оточення, за якими може здійснюватися формальне розпізнавання актуалізованого значення ММО. До таких параметрів діагностувальних контекстів належать: позиція омографа в реченні – початкова, кінцева; розташування діагностувального контексту ліворуч, праворуч від ММО або ж одночасно і ліворуч, і праворуч; тип ММО; модель омоніма; граматичні ознаки ТО, що входять до складу ДК (граматичний клас, підклас); семантичні ознаки компонентів контексту – належність слова до певного семантичного класу (наприклад, урахування ознаки перехідності для дієслів, виділення дієслів семантичного класу, які вживаються на позначення розумової діяльності, виділення іменників назв істот тощо); семантична характеристика омоніма (один із компонентів омоніма є іменником, який вживається на позначення істоти / неістоти або ж є віддієслівним іменником).


Побудована таблиця лексико-граматичних контекстів опрацьовувалася нами для визначення діагностувальних контекстів актуалізованих значень ММО. Дослідником визначалися розміри контексту, який може бути достатнім для зняття омонімії в кожному конкретному випадку, позиція діагностувального компонента з оточення стосовно омографа (лівого, правого або лівого і правого), конкретне граматичне значення ДК, а також актуальне граматичне значення омографа в даному контексті. Визначені на основі таблиці 1 діагностувальні контексти автоматично переносилися в таблицю 2 діагностувальних контекстів моделей ММО.


Структура таблиці 2 і програмне забезпечення дозволяють в автоматизованому режимі перейти до таблиці 3 діагностувальних контекстів у межах кожного із 77 типів. Отримана таблиця представляє діагностувальні контексти в межах типу.


Побудова алгоритму усунення омонімії підпорядковується загальним принципам: доцільності, частоти вживання діагностувального контексту, найбільшого виграшу, принципу економності.


 


ВИСНОВКИ


Проведене дисертаційне дослідження дозволяє зробити такі висновки:


1. Спираючись на рівноправність визначення в плані вираження графемної та звукової форми представлення, що відповідає двом формам існування мови – писемній та усній, а в плані значення – розмежування лексичного й граматичного значень, доведено доцільність виділення в межах омонімії мови морфологічних омонімів як окремого закономірного мовного явища. Морфологічні омоніми характеризуються тими самими структурними ознаками, що й інші типи омонімів, й одночасно мають свою структурно-семантичну специфіку.


2. Розробка спеціальної методики виявлення морфологічних омонімів, яка полягає у виділенні графічно тотожних морфологічно неоднозначних одиниць словника словоформ (обсягом 3 094 174 одиниці), автоматично побудованого за допомогою програми синтезу парадигм слів, що увійшли до реєстру граматичного словника української мови обсягом 171 620 лексем, дозволила встановити максимально повний реєстр структурних моделей морфологічних омонімів, який нараховує 1486 одиниць й охоплює 610 612 омографів.


3. За допомогою спеціальної процедури із загального реєстру омонімів було виділено список міжчастиномовних морфологічних омонімів – 10 203 омоніми (820 моделей).


4. Аналіз омонімів найчисленніших структурних моделей, що представляють омонімію повнозначних частин мови, показав, що 75,24 % з них становлять міжчастиномовні морфологічні омоніми, між компонентами яких існує семантичний зв’язок: семантична близькість встановлюється через значення вихідних форм компонентів омоніма, які пов’язані між собою словотвірними відношеннями.


5. Виявлення структурно-семантичних особливостей омонімів з погляду морфологічних характеристик компонентів моделей та функціонально-стилістичної приналежності їх дозволило встановити продуктивні типи міжчастиномовних морфологічних омонімів сучасної української мови. Отримані дані про розподіл типів та моделей міжчастиномовних морфологічних омонімів за кількістю компонентів у відповідних їм моделях продемонстрував дію законів простоти та переваги: як на рівні типів, так і на рівні моделей домінують дво-, трикомпонентні одиниці.


Запропонована методика формування реєстру омографів та розроблені в роботі принципи формальної класифікації структурних моделей міжчастиномовних морфологічних омонімів можуть застосовуватися для аналізу морфологічних омонімів інших флективних мов.


6. На основі отриманого списку міжчастиномовних морфологічних омонімів було побудовано багатопараметризовану лінгвістичну базу даних, яка виявилася ефективним інструментом для дослідження омонімії в українській мові та може розглядатися як новий етап у розвитку лінгвістичних технологій. Сформована лінгвістична база міжчастиномовних морфологічних омонімів є основою для більш широкого узагальнення й глибшого дослідження омонімічних відношень на морфологічному рівні, наприклад, в аспекті вивчення прояву омонімічності певних граматичних форм.


7. Аналіз функціонування омонімів у текстах трьох стилів показав, що загальна частка морфологічних омонімів в українському тексті становить близько 61 %. У результаті аналізу було виявлено, що кількість реалізованих у текстах різних омонімів становить 11,88 % від їхньої загальної кількості – 610 612, із 10 203 міжчастиномовних омографів у текстах реалізовано 62 % омонімів. Із 81 встановлених типів ММО в текстах реалізовано 95 %.


8. Зважаючи на те, що обчислені коефіцієнти розбіжності між одержаними показниками частоти вживання морфологічних омонімів, частоти вживання міжчастиномовних морфологічних омонімів у випадку попарного порівняння вибірок виявилися суттєвими, можна говорити про коректність застосовування цих статистичних параметрів для розмежування стилів.


9. Автоматично побудований на основі сформованих баз даних словник міжчастиномовних морфологічних омонімів обсягом близько 11 300 омографів є інформаційною лексикографічною системою, розрахованою на широке коло запитів щодо різних аспектів омонімії в граматичній системі української мови, та може слугувати для зіставно-типологічних досліджень української та інших флективних мов. Створений словник є лексикографічним джерелом не тільки для фахівців, але й для тих, хто вивчає українську мову.


10. Розроблена структура бази даних лінгвістичних контекстів дала можливість сформувати списки діагностувальних контекстів, що є основою дослідження контекстної реалізації омонімів в мовленні та ефективним інструментом для побудови алгоритму автоматичного усунення морфологічної омонімії. База даних лінгвістичних контекстів відкриває нові шляхи до більш адекватного опису типів ознак, що залучаються для усунення омонімії граматичних елементів у системах автоматичної обробки мови. На основі створеної бази даних було розроблено загальні принципи формування правил автоматичного усунення омонімії.


11. Розроблена лінгвістична база даних дозволила визначити діагностувальну силу граматичних, лексико-граматичних та лексичних контекстів щодо детермінації ними конкретного граматичного значення міжчастиномовних морфологічних омонімів у тексті: 98 % правил спираються на граматичну інформацію діагностувальних контекстів.


12. Серед граматичних діагностувальних контекстів найбільшу діагностувальну силу було визначено для іменника, дієслова, прийменника, підрядних сполучників, займенника-іменника. Саме ці граматичні класи й можуть вважатися опорними елементами під час здійснення автоматичного контекстного аналізу текстів у системах автоматичної обробки мови.


13. Розроблені в процесі дисертаційного дослідження засоби та методи формування лінгвістичних баз даних являють універсальний лінгвістичний інструментарій, який може використовуватися у вирішенні інших лінгвістичних проблем.


 








Мельникова А. И. К вопросу о русских омографах // Русский язык в школе. – 1974. – №4. – С.80–84.; Сучасна українська лiтературна мова. Лексика і фразеологія / За заг. ред. І. К. Білодіда. – К.: Наук. думка, 1969. – С.45-58.




Виноградов В. В. Проблемы морфематической структуры слова и явления омонимии в славянских языках // Славян. языкознание. – VI Международный съезд славистов. Доклады советск. делегации. – М., 1968. – С. 53-120.




Awramiuk E. Systemowość polskiej homonimii międzyparadygmatycznej. – Białystok: Wyd. Uniwer-tu w Białymstoku, 1999. – 242 s.




Програма автоматичного морфологічного аналізу (АМА) та синтезу словозмінних парадигм є частиною програмного забезпечення системи автоматичної обробки текстової інформації УМІФу.




Шевченко І. В. Алгоритмічна словозмінна класифікація української лексики // Мовознавство. – 1996. – № 4-5. – С. 40-44.




Малаховский Л. В. Теория лексической и грамматической омонимии. – Ленинград: Наука, 1990. – С.46.



 


Обновить код

Заказать выполнение авторской работы:

Поля, отмеченные * обязательны для заполнения:


Заказчик:


ПОИСК ДИССЕРТАЦИИ, АВТОРЕФЕРАТА ИЛИ СТАТЬИ


Доставка любой диссертации из России и Украины


ПОСЛЕДНИЕ ДИССЕРТАЦИИ

Малахова, Татьяна Николаевна Совершенствование механизма экологизации производственной сферы экономики на основе повышения инвестиционной привлекательности: на примере Саратовской области
Зиньковская, Виктория Юрьевна Совершенствование механизмов обеспечения продовольственной безопасности в условиях кризиса
Искандаров Хофиз Хакимович СОВЕРШЕНСТВОВАНИЕ МОТИВАЦИОННОГО МЕХАНИЗМА КАДРОВОГО ОБЕСПЕЧЕНИЯ АГРАРНОГО СЕКТОРА ЭКОНОМИКИ (на материалах Республики Таджикистан)
Зудочкина Татьяна Александровна Совершенствование организационно-экономического механизма функционирования рынка зерна (на примере Саратовской области)
Валеева Сабира Валиулловна Совершенствование организационных форм управления инновационной активностью в сфере рекреации и туризма на региональном уровне