Математическая биология и биоинформатика
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Матем. биология и биоинформ.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Матем. биология и биоинформ., 2019, том 14, выпуск 2, страницы 464–476 (Mi mbb396)  

Информационные и вычислительные технологии в биологии и медицине

Очистка данных от диагностических ошибок в признаковых пространствах большой размерности

И. А. Борисова, О. А. Кутненко

Институт математики им. С.Л. Соболева Сибирского отделения Российской академии наук, Новосибирск, Россия

Аннотация: В статье предлагается новый подход к цензурированию данных, позволяющий очищать выборки от диагностических ошибок в целевом признаке в случае, когда эти выборки описаны в признаковых пространствах большой размерности. Рассмотрение данного случая как отдельной задачи объясняется тем, что в пространствах большой размерности перестают работать большинство методов цензурирования и очистки данных, как статистических, так и метрических. При этом для задач медицинской диагностики, учитывая сложность изучаемых объектов и явлений, большое количество описывающих характеристик является скорее нормой, чем исключением. Для решения поставленной задачи предложен подход, ориентированный на локальное сходство между собой объектов выборки и использующий в качестве меры сходства функцию конкурентного сходства (FRiS-функцию). В предложенном подходе для эффективной очистки данных от ошибок происходит выбор наиболее информативного и релевантного решаемой задаче признакового подпространства малой размерности, в котором разделимость классов после их корректировки будет максимальна. Под разделимостью классов понимается похожесть объектов одного класса друг на друга и их непохожесть на объекты другого классов. Очистка от ошибок может выражаться как в их исправлении, так и в удалении испорченных объектов из выборки. Описанный метод был реализован в виде алгоритма FRiS-LCFS (FRiS Local Censoring with Feature Selection) и протестирован на модельных и реальных биомедицинских задачах, в том числе и на задаче диагностики рака простаты по результатам измерения генной активности. Разработанный алгоритм показал свою конкурентоспособность по сравнению со стандартными методами, фильтрации данных в пространствах большой размерности.

Ключевые слова: распознавание образов, функция конкурентного сходства, компактность образов, разделимость классов, цензурирование объектов, выбор признаков.

Финансовая поддержка Номер гранта
Российская академия наук - Федеральное агентство научных организаций 0314-2019-0015
Работа выполнена при поддержке программы ФНИ РАН, проект № 0314-2019-0015.


DOI: https://doi.org/10.17537/2019.14.464

Полный текст: PDF файл (633 kB)
Список литературы: PDF файл   HTML файл

Тип публикации: Статья
УДК: 519.95
Материал поступил в редакцию 04.07.2019, 04.10.2019, опубликован 07.10.2019

Образец цитирования: И. А. Борисова, О. А. Кутненко, “Очистка данных от диагностических ошибок в признаковых пространствах большой размерности”, Матем. биология и биоинформ., 14:2 (2019), 464–476

Цитирование в формате AMSBIB
\RBibitem{BorKut19}
\by И.~А.~Борисова, О.~А.~Кутненко
\paper Очистка данных от диагностических ошибок в признаковых пространствах большой размерности
\jour Матем. биология и биоинформ.
\yr 2019
\vol 14
\issue 2
\pages 464--476
\mathnet{http://mi.mathnet.ru/mbb396}
\crossref{https://doi.org/10.17537/2019.14.464}


Образцы ссылок на эту страницу:
  • http://mi.mathnet.ru/mbb396
  • http://mi.mathnet.ru/rus/mbb/v14/i2/p464

    ОТПРАВИТЬ: VKontakte.ru FaceBook Twitter Mail.ru Livejournal Memori.ru


    Citing articles on Google Scholar: Russian citations, English citations
    Related articles on Google Scholar: Russian articles, English articles
  • Просмотров:
    Эта страница:11
    Полный текст:12
     
    Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2021