Чебышевский сборник
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Чебышевский сб.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Чебышевский сб., 2018, том 19, выпуск 1, страницы 187–199 (Mi cheb631)  

Эта публикация цитируется в 1 научной статье (всего в 1 статье)

Классификация последовательностей на основе коротких мотивов

Е. П. Офицеров

Тульский государственный университет

Аннотация: Задачи, связанные с классификацией последовательностей символов некоторого алфавита, часто возникают в таких областях, как биоинформатика и обработка естественного языка. Методы глубокого обучения, в особенности модели на основе рекуррентных нейронных сетей, в последние несколько лет зарекомендовали себя как наиболее эффективный способ решения подобных задач. Однако существующие подходы имеют серьезный недостаток — низкую интерпретируемость получаемых результатов. Крайне сложно установить какие именно свойства входной последовательности ответственны за её принадлежность к тому или иному классу. Упрощение же таких моделей с целью повышения их интерпретируемости, в свою очередь, приводит к снижению качества классификации. Такие недостатки ограничивают применение современных методов машинного обучения во многих предметных областях. В настоящей работе мы представляем принципиально новую, интерпретируемую архитектуру нейронных сетей, основанную на поиске набора коротких подпоследовательностей — мотивов, наличие которых влияет на принадлежность последовательности к определенному классу. Ключевой составляющей предлагаемого решения является разработанный нами алгоритм дифференцируемого выравнивания, являющийся дифференцируемым аналогом таких классических способов сравнения строк, как редакционное расстояние Левенштейна и алгоритм Смита–Ватермана. В отличие от предыдущих работ, посвященных классификации последовательностей на основе мотивов, новый метод позволяет не только выполнять поиск в произвольной части строки, но и учитывать возможные вставки.

Ключевые слова: классификация последовательностей, машинное обучение, нейронные сети, поиск мотивов.

DOI: https://doi.org/10.22405/2226-8383-2018-19-1-187-199

Полный текст: PDF файл (646 kB)
Список литературы: PDF файл   HTML файл

Реферативные базы данных:

Тип публикации: Статья
УДК: 004.032.26, 004.424.62

Образец цитирования: Е. П. Офицеров, “Классификация последовательностей на основе коротких мотивов”, Чебышевский сб., 19:1 (2018), 187–199

Цитирование в формате AMSBIB
\RBibitem{Ofi18}
\by Е.~П.~Офицеров
\paper Классификация последовательностей на~основе коротких мотивов
\jour Чебышевский сб.
\yr 2018
\vol 19
\issue 1
\pages 187--199
\mathnet{http://mi.mathnet.ru/cheb631}
\crossref{https://doi.org/10.22405/2226-8383-2018-19-1-187-199}
\elib{https://elibrary.ru/item.asp?id=36312686}


Образцы ссылок на эту страницу:
  • http://mi.mathnet.ru/cheb631
  • http://mi.mathnet.ru/rus/cheb/v19/i1/p187

    ОТПРАВИТЬ: VKontakte.ru FaceBook Twitter Mail.ru Livejournal Memori.ru


    Citing articles on Google Scholar: Russian citations, English citations
    Related articles on Google Scholar: Russian articles, English articles

    Эта публикация цитируется в следующих статьяx:
    1. Д. В. Горбачев, Е. П. Офицеров, “Новый подход к поиску строковой медианы и визуализация строковых кластеров”, Чебышевский сб., 20:2 (2019), 93–107  mathnet  crossref
  • Просмотров:
    Эта страница:213
    Полный текст:117
    Литература:14
     
    Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2022