Труды института системного программирования РАН
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Труды ИСП РАН:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Труды института системного программирования РАН, 2023, том 35, выпуск 1, страницы 237–264
DOI: https://doi.org/10.15514/ISPRAS-2023-35(1)-15
(Mi tisp765)
 

Сравнение графовых векторных представлений исходного кода с текстовыми моделями на основе архитектур CNN и CodeBERT

В. А. Романов, В. В. Иванов

Университет Иннополис
Аннотация: Одним из возможных способов уменьшения ошибок в исходном коде является создание интеллектуальных инструментов, облегчающих процесс разработки. Такие инструменты часто используют векторные представления исходного кода и методы машинного обучения, заимствованные из области обработки естественного языка. Однако такие подходы не учитывают специфику исходного кода и его структуру. Данная работа посвящена исследованию методов предварительного обучения графовых векторных представлений исходного кода, где граф представляет структуру программы. Результаты показывают, что графовые векторные представления позволяют достичь точности классификации типов переменных программ, написанных на языке Python, сравнимой с векторными представлениями CodeBERT. Более того, одновременное использование текстовых и графовых векторных представлений в составе гибридной модели позволяет повысить точность классификации типов более чем на 10%.
Ключевые слова: исходный код, классификация типов переменных, Python, графовые нейронные сети, CodeBERT
Финансовая поддержка Номер гранта
Российский научный фонд 22-21-00493
Тип публикации: Статья
Образец цитирования: В. А. Романов, В. В. Иванов, “Сравнение графовых векторных представлений исходного кода с текстовыми моделями на основе архитектур CNN и CodeBERT”, Труды ИСП РАН, 35:1 (2023), 237–264
Цитирование в формате AMSBIB
\RBibitem{RomIva23}
\by В.~А.~Романов, В.~В.~Иванов
\paper Сравнение графовых векторных представлений исходного кода с текстовыми моделями на основе архитектур CNN и CodeBERT
\jour Труды ИСП РАН
\yr 2023
\vol 35
\issue 1
\pages 237--264
\mathnet{http://mi.mathnet.ru/tisp765}
\crossref{https://doi.org/10.15514/ISPRAS-2023-35(1)-15}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/tisp765
  • https://www.mathnet.ru/rus/tisp/v35/i1/p237
  • Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Труды института системного программирования РАН
    Статистика просмотров:
    Страница аннотации:51
    PDF полного текста:58
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2025