Каталог / ТЕХНИЧЕСКИЕ НАУКИ / Теоретические основы информатики
скачать файл:
- Название:
- Сафин Камиль Фанисович Комбинированные методы выявления заимствований в текстовых документах
- Альтернативное название:
- Сафін Каміль Фанісович Комбіновані методи виявлення запозичень у текстових документах
- ВУЗ:
- Московский физико-технический институт (национальный исследовательский университет)
- Краткое описание:
- Сафин Камиль Фанисович Комбинированные методы выявления заимствований в текстовых документах
ОГЛАВЛЕНИЕ ДИССЕРТАЦИИ
кандидат наук Сафин Камиль Фанисович
Введение
Глава 1. Обзор литературы
1.1 Интерпретации задачи
1.2 Функция стиля и статистический подход
1.3 Решение рассматриваемой задачи с применением методов машинного обучения
1.4 Использование вспомогательных моделей векторизации текстов
1.5 Архитектуры нейросетевых моделей
1.6 Выводы к главе
Глава 2. Метод поиска некорректных текстовых
заимствований без использования внешних источников
2.1 Векторизация текстов
2.1.1 Метод мешка слов
2.1.2 Метод с использованием статистики
2.2 Поиск смены авторского стиля
2.2.1 Сегментирование текста
2.2.2 Векторизация сегментов
2.2.3 Построение ряда статистик
2.2.4 Поиск выбросов
2.3 Базовый эксперимент
2.3.1 Подход
2.3.2 Результаты и примеры
2.4 Выводы к главе
Глава 3. Поиск внутренних заимствований как
самостоятельная система исследования текста на
оригинальность
3.1 Постановка задачи
3.2 Критерии качества
3.3 Общий подход
3.3.1 Описание алгоритма
3.3.2 Сегментирование текста
3.3.3 Построение статистики и детектирование аномалий
3.4 Вычислительный эксперимент
3.4.1 Описание данных
3.4.2 Результаты эксперимента и примеры работы
3.5 Анализ ошибок
3.6 Выводы к главе
Глава 4. Поиск внутренних заимствований с использованием
вспомогательных моделей векторизации текстов
4.1 Критерии качества
4.2 Описание алгоритма
4.2.1 Модель векторизации сегментов текста
4.2.2 Сегментирование и построение статистик
4.3 Вычислительный эксперимент
4.3.1 Подбор гиперпараметров
4.3.2 Результаты и примеры работы
4.4 Выводы к главе
Глава 5. Система фильтрации высокооригинальных текстов на
основе стилистического анализа
5.1 Постановка задачи
5.2 Критерии качества
5.3 Описание алгоритма
5.3.1 Предобработка текста
5.3.2 Сегментация текста
5.3.3 Векторизация сегментов
5.3.4 Подсчет статистик и нахождение аномалий
5.4 Вычислительный эксперимент
5.4.1 Описание данных
5.5 Результаты эксперимента
5.6 Детали реализации программного комплекса
5.6.1 Формат входных данных и предобработка
5.6.2 Модуль фильтрации
5.7 Выводы к главе
Заключение
Список литературы
- Стоимость доставки:
- 230.00 руб