Вестник Южно-Уральского государственного университета. Серия «Вычислительная математика и информатика»
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Вестн. ЮУрГУ. Сер. Выч. матем. информ.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Вестн. ЮУрГУ. Сер. Выч. матем. информ., 2014, том 3, выпуск 3, страницы 20–36 (Mi vyurv46)  

Эта публикация цитируется в 2 научных статьях (всего в 2 статьях)

Информатика, вычислительная техника и управление

Обеспечение отказоустойчивости высокопроизводительных вычислений с помощью локальных контрольных точек

А. А. Бондаренко, М. В. Якобовский

Институт прикладной математики им. М.В. Келдыша РАН (Москва, Российская Федерация)

Аннотация: Рассматриваются вопросы, связанные с проведением расчетов в распределенных вычислительных системах, компоненты которых подвержены отказам. В работе приводятся: определения системы, сбоя, ошибки, отказа и модели сбоя; наиболее важные результаты исследований отказов в параллельных вычислительных системах, в том числе с большими группами дисков; основные существующие методы восстановления и распространенные программные реализации обеспечения отказоустойчивости. Развивается подход обеспечения отказоустойчивости на уровне пользователя. Данный подход требует непосредственного участия разработчика прикладной программы в реализации метода обеспечения отказоустойчивости, в частности в формировании контрольных точек и процедур восстановления. Предложена схема сохранения в памяти вычислительных узлов данных прикладной программы, формирующих согласованную глобальную контрольную точку. В её рамках осуществляется дублирование локальных контрольных точек, что позволяет восстановить вычислительный процесс, если число отказов не превосходит допустимого для данной схемы уровня. Она может быть использована в различных протоколах восстановления и их модификациях.

Ключевые слова: параллельные вычисления, отказоустойчивость, контрольные точки, MPI.

Финансовая поддержка Номер гранта
Российский фонд фундаментальных исследований 13-01-12073 офи_м
Работа выполнена при поддержке Российского фонда фундаментальных исследований по гранту 13-01-12073 офи_м.


Полный текст: PDF файл (360 kB)
Список литературы: PDF файл   HTML файл
Тип публикации: Статья
УДК: 004.052.3
Поступила в редакцию: 05.08.2014

Образец цитирования: А. А. Бондаренко, М. В. Якобовский, “Обеспечение отказоустойчивости высокопроизводительных вычислений с помощью локальных контрольных точек”, Вестн. ЮУрГУ. Сер. Выч. матем. информ., 3:3 (2014), 20–36

Цитирование в формате AMSBIB
\RBibitem{BonIak14}
\by А.~А.~Бондаренко, М.~В.~Якобовский
\paper Обеспечение отказоустойчивости высокопроизводительных вычислений с помощью локальных контрольных точек
\jour Вестн. ЮУрГУ. Сер. Выч. матем. информ.
\yr 2014
\vol 3
\issue 3
\pages 20--36
\mathnet{http://mi.mathnet.ru/vyurv46}


Образцы ссылок на эту страницу:
  • http://mi.mathnet.ru/vyurv46
  • http://mi.mathnet.ru/rus/vyurv/v3/i3/p20

    ОТПРАВИТЬ: VKontakte.ru FaceBook Twitter Mail.ru Livejournal Memori.ru


    Citing articles on Google Scholar: Russian citations, English citations
    Related articles on Google Scholar: Russian articles, English articles

    Эта публикация цитируется в следующих статьяx:
    1. А. А. Бондаренко, М. В. Якобовский, “Моделирование отказов в высокопроизводительных вычислительных системах в рамках стандарта MPI и его расширения ULFM”, Вестн. ЮУрГУ. Сер. Выч. матем. информ., 4:3 (2015), 5–12  mathnet  crossref  elib
    2. А. А. Бондаренко, П. А. Ляхов, М. В. Якобовский, “Координированное сохранение с журналированием передаваемых данных и асинхронное восстановление в случае отказа”, Вестн. ЮУрГУ. Сер. Выч. матем. информ., 8:2 (2019), 76–91  mathnet  crossref  elib
  • Вестник Южно-Уральского государственного университета. Серия «Вычислительная математика и информатика»
    Просмотров:
    Эта страница:162
    Полный текст:57
    Литература:18
     
    Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2021