|
Биоинформатика
Facilitating rapid screening of metaviral data with the VERA pipeline
[Cкрининг метавирусных данных с использованием вычислительного конвейера VERA]
I. K. Chudinovab, A. S. Speranskayac a Scientific Research Institute for Systems Biology and Medicine of Rospotrebnadzor, Moscow
b Moscow Institute of Physics and Technology (National Research University), Moscow, Russia
c Vavilov Institute of General Genetics Russian Academy of Science, Moscow, Russia
Аннотация:
Изучение метагеномных (в частности, метавиромных) данных стало одним из лидирующих направлений в биологии в последние годы. Рост количества данных секвенирования стимулировал развитие методов анализа, направленных на изучение вирусного разнообразия, обнаруженного в природных образцах. Недавние достижения в этой области подчеркивают важность интеграции высокопроизводительных технологий секвенирования с передовыми биоинформатическими инструментами, поскольку это повышает чувствительность и точность идентификации вирусов. В данном исследовании представлена новая конвейерная система VERA, разработанная для анализа данных секвенирования метавиромов. В основе лежит принцип строгой двойной фильтрации контигов, что позволяет максимизировать обнаружение истинных вирусных последовательностей и минимизировать включение невирусных артефактов. Улучшая обнаружение вирусов через двойную таксономическую фильтрацию и используя современные системы управления рабочими процессами, созданный конвейер не только устраняет пробелы в существующих методах, но и предлагает новый подход к метавирусным исследованиям. Конвейер реализован на системе Nextflow. Валидация VERA проведена с использованием контрольных образцов. Результаты показали соответствие ручной проверки, и были сопоставимы по точности с коммерческими платформами. Конвейер VERA предлагает инновационный подход к изучению полноты и сложности вирусного разнообразия в природных образцах. В перспективе, его внедрение дает новые возможности для исследований в области вирусологии и экологии.
Ключевые слова:
NGS, метавирусные исследования, NextFlow, вычислительные конвейеры, таксономическая идентификация.
Материал поступил в редакцию 10.03.2025, 23.03.2025, опубликован 14.05.2025
Образец цитирования:
I. K. Chudinov, A. S. Speranskaya, “Facilitating rapid screening of metaviral data with the VERA pipeline”, Матем. биология и биоинформ., 20:1 (2025), 100–121
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/mbb588 https://www.mathnet.ru/rus/mbb/v20/i1/p100
|
|