Математическая биология и биоинформатика
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Матем. биология и биоинформ.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Матем. биология и биоинформ., 2020, том 15, выпуск 2, страницы 313–337 (Mi mbb435)  

Обзоры

Сложность ДНК-последовательностей. Различные подходы и определения

В. Д. Гусев, Л. А. Мирошниченко

Институт математики им. С.Л. Соболева Сибирского отделения Российской академии наук, Новосибирск, Россия

Аннотация: Важной количественной характеристикой символьных последовательностей (текстов, строк) является сложность, отражающая на интуитивном уровне степень их “неслучайности”. Достаточно общий подход к оцениванию сложности сформулировал А.Н. Колмогоров. Он предложил измерять её длиной кратчайшего описания, по которому последовательность восстанавливается однозначно. Поскольку программы, гарантированно осуществляющей поиск кратчайшего описания, не существует, на практике для этой цели используют различные алгоритмические приближения, рассматриваемые в данной работе. Наряду с определениями сложности, предполагающими возможность восстановления последовательности по её описанию, рассмотрен и ряд мер, не обладающих указанным свойством. Основное внимание уделено не столько количественной оценке сложности, сколько выявлению и классификации структурных закономерностей, обусловивших конкретное её значение. Все они в той или иной форме сводятся к проявлениям повторности в самом широком смысле.
Рассматриваемые меры сложности можно условно разделить на статистические, учитывающие частоту встречаемости символов или коротких слов в тексте, “словарные”, оценивающие число всевозможных подслов в анализируемой последовательности (тексте) и “структурные”, основанные на выделении длинных повторяющихся фрагментов текста и установлении взаимосвязей между ними.
Большинство методов ориентировано на последовательности произвольной языковой природы. Особое внимание, уделяемое ДНК-последовательностям, отраженное в названии статьи, обусловлено значимостью объекта, проявлениями повторности разного типа и многочисленными примерами использования понятия сложности при решении задач классификации и эволюции различных биологических объектов. Значительный интерес представляют локальные структурные особенности, выявляемые в режиме скользящего окна в ДНК-последовательностях, поскольку зачастую зоны пониженной сложности в геномах различных организмов имеют отношение к регуляции основных генетических процессов.

Ключевые слова: ДНК-последовательности, сложность, алгоритмы, сжатие данных, энтропия, статистические меры, лингвистическая сложность, структурные меры сложности.

Финансовая поддержка Номер гранта
Министерство образования и науки Российской Федерации 0314-2019-0015
Работа выполнена в рамках государственного задания ИМ СО РАН (проект № 0314-2019-0015).


DOI: https://doi.org/10.17537/2020.15.313

Полный текст: PDF файл (978 kB)
Список литературы: PDF файл   HTML файл

Тип публикации: Статья
Материал поступил в редакцию 23.10.2020, 14.11.2020, опубликован 30.11.2020

Образец цитирования: В. Д. Гусев, Л. А. Мирошниченко, “Сложность ДНК-последовательностей. Различные подходы и определения”, Матем. биология и биоинформ., 15:2 (2020), 313–337

Цитирование в формате AMSBIB
\RBibitem{GusMir20}
\by В.~Д.~Гусев, Л.~А.~Мирошниченко
\paper Сложность ДНК-последовательностей. Различные подходы и определения
\jour Матем. биология и биоинформ.
\yr 2020
\vol 15
\issue 2
\pages 313--337
\mathnet{http://mi.mathnet.ru/mbb435}
\crossref{https://doi.org/10.17537/2020.15.313}


Образцы ссылок на эту страницу:
  • http://mi.mathnet.ru/mbb435
  • http://mi.mathnet.ru/rus/mbb/v15/i2/p313

    ОТПРАВИТЬ: VKontakte.ru FaceBook Twitter Mail.ru Livejournal Memori.ru


    Citing articles on Google Scholar: Russian citations, English citations
    Related articles on Google Scholar: Russian articles, English articles
  • Просмотров:
    Эта страница:36
    Полный текст:22
    Литература:1
     
    Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2021