Каталог / ТЕХНИЧЕСКИЕ НАУКИ / Вычислительные машины, системы и сети
скачать файл:
- Название:
- Снытников Алексей Владимирович Исследование производительности высокопроизводительных вычислительных систем
- Альтернативное название:
- Снитников Олексій Володимирович Дослідження продуктивності високопродуктивних обчислювальних систем
- Краткое описание:
- Снытников Алексей Владимирович Исследование производительности высокопроизводительных вычислительных систем
ОГЛАВЛЕНИЕ ДИССЕРТАЦИИ
доктор наук Снытников Алексей Владимирович
Введение
Глава 1. Описание реализации метода частиц в ячейках для
высокопроизводительных ВС
1.1 Краткое описание метода частиц в ячейках
1.2 Модель высокотемпературной бесстолкновительной плазмы
1.3 Решение уравнений Максвелла и Власова
1.4 Параллельная реализация
1.4.1 Декомпозиция расчетной области
1.5 Ход вычислений в программе
1.6 Программная реализация вычислительных методов
1.6.1 Вычисление электромагнитного поля во всей расчетной области
1.6.2 Расчет движения модельной частицы
1.6.3 Общее замечание о методике подсчета количества операций
1.7 Список входных и выходных данных программы
1.7.1 Список входных данных
1.7.2 Список выходных данных
1.7.3 Выходные данные программы-теста
Глава 2. Физико-математические задачи и вычислительные методы в исследованиях, проводимых с
использованием высокопроизводительных ВС
2.1 Масштабируемость и увеличение числа ПЭ
2.2 Адаптация вычислительных методов к архитектуре ВВС
2.3 Использование ускорителей вычислений
Глава 3. Комплексная оценка производительности ВС
3.1 О влиянии организации данных на результат измерения производительности процессоров
3.2 Расчет пропускной способности системы памяти
3.3 Расчет производительности процессорных элементов
3.4 Расчет производительности процессорных элементов на основе
движения модельных частиц
3.4.1 Использование результатов измерения
производительности для улучшения
технико-эксплуатационных показателей ВС
3.5 Расчет пропускной способности коммуникационной сети
3.6 Оценка возможности выполнения крупномасштабных трехмерных расчетов
3.7 Формула для комплексной оценки ВС
3.8 Сравнение с известными тестами производительности
3.8.1 ТестЫРЬ
3.8.2 Актуальность создания нового теста для определения производительности ВВС
3.8.3 Тест ЫРСО
Глава 4. Анализ масштабируемости, параллельной
эффективности и ускорения параллельной ВС
4.1 Формулы для анализа данных о масштабируемости
4.2 Структура временного шага метода частиц в ячейках
4.3 Вычисление характеристик коммуникационного оборудования ВС на основе измеренной масштабируемости метода частиц в ячейках
4.4 Анализ масштабируемости как интегральной характеристики ВС
4.4.1 Описание пересылаемых данных
4.4.2 Вспомогательные величины для анализа масштабируемости
4.4.3 Измерение продолжительности параллельных коммуникаций и анализ характеристик и топологии коммуникационного оборудования
4.5 Оценки параллельной масштабируемости на основе измерений времени прохождения сообщений
4.5.1 Краткое описание проведенных тестов
4.5.2 Использование факторного анализа для интерпретации результатов теста
4.6 Опредедение зависимости масштабируемости от наличия и типа ускорителей вычислений
4.7 Измерение производительности коммуникационной сети на
основе данных о пересылке модельных частиц
4.8 Сравнение с известными тестами производительности
4.8.1 Краткое описание теста IMB
4.8.2 Сравнение результатов теста IMB и PIC-MANAS
Глава 5. Анализ производительности узлов
мультиархитектурной ВС
5.1 Анализ производительности узлов с графическими ускорителями
5.2 Реализация программы теста на различных типах мультиархитектурных ВВС
5.2.1 Постановка задачи
5.2.2 Универсальная процедура запуска
5.2.3 Унифицированная сигнатура расчетных процедур
5.2.4 Механизм передачи параметров расчетных процедур
5.3 Анализ производительности узлов с многоядерными процессорами и ускорителями вычислений
Заключение
Список сокращений и условных обозначений
Список литературы
Список рисунков
Список таблиц
Приложение А. Основные характеристики процессоров и GPU,
использованных в тестовых расчетах
А.1 Процессоры семейства Intel Xeon
А.1.1 Устаревшие процессоры семейства Intel Xeon
А.1.2 Современные процессоры семейства Intel Xeon
А.2 Процессор Phenom II X6 1055T
А.3 Графические ускорители (GPU)
Приложение Б. Краткое описание основных свойств сетевого
оборудования и сетевых протоколов, использованных в тестовых расчетах
Б.1 Gigabit Ethernet
Б.2 Infiniband
Б.3 Omnipath
- Стоимость доставки:
- 230.00 руб