|
Вестн. ЮУрГУ. Сер. Матем. моделирование и программирование, 2018, том 11, выпуск 1, страницы 124–136
(Mi vyuru423)
|
|
|
|
Программирование
New features of parallel implementation of $N$-body problems on GPU
[Особенности параллельной реализации численных моделей $N$-тел на GPU]
S. S. Khrapova, S. A. Khoperskovb, A. V. Khoperskova a Volgograd State University, Volgograd, Russian Federation
b Institute of Astronomy, Russian Academy of Sciences, Moscow, Russian Federation
Аннотация:
Рассмотрены особенности параллельной реализации прямого гравитационного моделирования $N$-тел на нескольких GPU с использованием технологии GPU-Direct.
Подробно описан параллельный алгоритм решения задачи $N$-тел, основанный на гибридной технологии распараллеливания OpenMP-CUDA с количеством частиц $N\sim 10^5\div 10^7$.
Исследована эффективность распараллеливания нашего алгоритма для различных GPU линейки Nvidia Tesla (K20, K40, K80) при моделировании динамики гравитационно-неустойчивого звездного галактического диска.
Изучена производительность и точность моделирования при использовании чисел одинарной и двойной точности. Так, например, для процессора Nvidia Tesla K80 время вычислений с двойной точностью оказалась всего лишь в $1,85$ раз больше чем для одинарной точности. Показано, что использовать числа с одинарной точностью при моделировании на GPU сильно несимметричных систем взаимодействующих $N$-тел схемами второго порядка точности по времени некорректно, так как это приводит к значительным количественным и качественным искажениям результата.
Так, например, для чисел одинарной точности после $10^4$ шагов по времени полные энергия, импульс и момент импульса системы $N$-тел ($N=2^{20}$) сохранились с точностью менее $2\cdot 10^{-3}$, $4\cdot 10^{-2}$ и $7\cdot 10^{-3}$, соответственно.
Для чисел двойной точности эти законы сохранения выполнялись с точностью более $5\cdot 10^{-5}$, $10^{-15}$ и $10^{-13}$, соответственно. Наши оценки показывают, что по шкале производительность–точность использование схем второго порядка точности по времени наряду с числами двойной точности оказывается на $20$–$30%$ более эффективно, чем схем четвертого порядка с числами одинарной точности.
Ключевые слова:
Multi-GPU; OpenMP-CUDA; GPU-Direct; Nvidia Tesla; задача $N$-тел; одинарная и двойная точность численных решений; звездный галактический диск; гравитационная неустойчивость.
DOI:
https://doi.org/10.14529/mmp180111
Полный текст:
PDF файл (7905 kB)
Список литературы:
PDF файл
HTML файл
Реферативные базы данных:
Тип публикации:
Статья
УДК:
502.57
MSC: 34N05, 37M05, 68U20 Поступила в редакцию: 22.01.2018
Язык публикации: английский
Образец цитирования:
S. S. Khrapov, S. A. Khoperskov, A. V. Khoperskov, “New features of parallel implementation of $N$-body problems on GPU”, Вестн. ЮУрГУ. Сер. Матем. моделирование и программирование, 11:1 (2018), 124–136
Цитирование в формате AMSBIB
\RBibitem{KhrKhoKho18}
\by S.~S.~Khrapov, S.~A.~Khoperskov, A.~V.~Khoperskov
\paper New features of parallel implementation of $N$-body problems on GPU
\jour Вестн. ЮУрГУ. Сер. Матем. моделирование и программирование
\yr 2018
\vol 11
\issue 1
\pages 124--136
\mathnet{http://mi.mathnet.ru/vyuru423}
\crossref{https://doi.org/10.14529/mmp180111}
\elib{https://elibrary.ru/item.asp?id=32711856}
Образцы ссылок на эту страницу:
http://mi.mathnet.ru/vyuru423 http://mi.mathnet.ru/rus/vyuru/v11/i1/p124
Citing articles on Google Scholar:
Russian citations,
English citations
Related articles on Google Scholar:
Russian articles,
English articles
|
Просмотров: |
Эта страница: | 107 | Полный текст: | 133 | Литература: | 11 |
|