Компьютерные исследования и моделирование
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Компьютерные исследования и моделирование:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Компьютерные исследования и моделирование, 2024, том 16, выпуск 7, страницы 1779–1792
DOI: https://doi.org/10.20537/2076-7633-2024-16-7-1779-1792
(Mi crm1248)
 

СПЕЦИАЛЬНЫЙ ВЫПУСК

Fast and accurate x86 disassembly using a graph convolutional network model
[Графовая сверточная нейронная сеть для быстрого и точного дизассемблирования инструкций x86]

N. A. Strygin, N. D. Kudasov

Innopolis University, 1 Universitetskaya st., Innopolis, 420500, Russia
Список литературы:
Аннотация: Дизассемблирование двоичных файлов x86 — важная, но нетривиальная задача. Дизассемблирование трудно выполнить корректно без отладочной информации, особенно на архитектуре x86, в которой инструкции переменного размера чередуются с данными. Более того, наличие непрямых переходов в двоичном коде добавляет еще один уровень сложности. Непрямые переходы препятствуют возможности рекурсивного обхода, распространенного метода дизассемблирования, успешно идентифицировать все инструкции в коде. Следовательно, дизассемблирование такого кода становится еще более сложным и требовательным, что еще больше подчеркивает проблемы, с которыми приходится сталкиваться в этой области. Многие инструменты, включая коммерческие, такие как IDA Pro, с трудом справляются с точным дизассемблированием x86. В связи с этим был проявлен определенный интерес к разработке более совершенного решения с использованием методов машинного обучения, которое потенциально может охватывать базовые, независимые от компилятора паттерны, присущие машинному коду, сгенерированному компилятором. Методы машинного обучения могут превосходитьпо точности классические инструменты. Их разработка также может занимать меньше времени по сравнению с эвристическими методами, реализуемыми вручную, что позволяет переложитьо сновную нагрузку на сбор большого представительного набора данных исполняемых файлов с отладочной информацией. Мы усовершенствовали существующую архитектуру на основе рекуррентных графовых сверточных нейронных сетей, которая строит граф управления и потоков для дизассемблирования надмножеств инструкций. Мы расширили граф информацией о потоках данных: при кодировании входной программы, мы добавляем ребра потока управления и зависимостей от регистров, вдохновленные вероятностным дизассемблированием. Мы создали открытый набор данных для идентификации инструкций x86, основанный на комбинации набора данных ByteWeight и нескольких пакетов Debian с открытым исходным кодом. По сравнению с IDA Pro, современным коммерческим инструментом, наш подход обеспечивает более высокую точность при сохранении высокой производительности в наших тестах. Он также хорошо себя показывает по сравнению с существующими подходами машинного обучения, такими как DeepDi.
Ключевые слова: дизассемблер, машинное обучение, графовые нейронные сети, x86
Поступила в редакцию: 26.10.2024
Исправленный вариант: 15.11.2024
Принята в печать: 25.11.2024
Тип публикации: Статья
УДК: 004.93
Язык публикации: английский
Образец цитирования: N. A. Strygin, N. D. Kudasov, “Fast and accurate x86 disassembly using a graph convolutional network model”, Компьютерные исследования и моделирование, 16:7 (2024), 1779–1792
Цитирование в формате AMSBIB
\RBibitem{StrKud24}
\by N.~A.~Strygin, N.~D.~Kudasov
\paper Fast and accurate x86 disassembly using a graph convolutional network model
\jour Компьютерные исследования и моделирование
\yr 2024
\vol 16
\issue 7
\pages 1779--1792
\mathnet{http://mi.mathnet.ru/crm1248}
\crossref{https://doi.org/10.20537/2076-7633-2024-16-7-1779-1792}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/crm1248
  • https://www.mathnet.ru/rus/crm/v16/i7/p1779
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Компьютерные исследования и моделирование
    Статистика просмотров:
    Страница аннотации:84
    PDF полного текста:93
    Список литературы:21
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2026