Семинары
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Календарь
Поиск
Регистрация семинара

RSS
Ближайшие семинары




Прикладная статистика
3 октября 2025 г. 13:00, г. Новосибирск, онлайн Зум (указано московское время)
 


Оценка статистической значимости одного классификатора, идентифицирующего ER-положительный рак молочной железы

А. П. Жиянов

Национальный исследовательский университет "Высшая школа экономики", г. Москва



Аннотация: Классификаторы широко используются в биомедицинских приложениях для выявления закономерностей, позволяющих различать группы образцов (например, рак и норму). Построение классификатора можно разделить на два основных этапа: выбор метода классификации и метрики, определяющей его качество. Среди методов классификации важный класс составляют линейные методы, обладающие высокой степенью интерпретируемости.
Обычно качество классификатора измеряется на отдельной выборке. Тем не менее бывает полезно сравнить это качество с референсным значением. Для линейных классификаторов в качестве референсного мы предлагаем рассматривать качество “случайного” классификатора.
Формально, пусть $Y = (Y_i, i \le k)$, $Z = (Z_i, i \le l)$ – две независимые выборки в $\mathbb{R}^d$, взятые из распределений $\mathcal{F}_{Y}$ и $\mathcal{F}_{Z}$ соответственно. Предположим, что множества $\{ Y_i, i \le k \}$ и $\{ Z_i, i \le l \}$ почти линейно разделимы. В этом случае естественно считать, что $\mathcal{F}_Y \neq \mathcal{F}_Z$. Доклад посвящен ответу на вопрос, какова вероятность события $A_m$, что две выборки почти линейно разделимы с не более чем $m$ ошибками, если их распределения предполагаются равными?
В докладе будут представлены верхние оценки условной $\mathbb{P}( A_m \mid (Y, Z))$ и безусловной $\mathbb{P}( A_m )$ вероятностей почти линейной разделимости. На их основе строится статистический критерий, который применяется к классификатору, обнаруживающему рецидив рака молочной железы у пациентов с ER-положительным статусом. В результате подтверждается роль пары генов IGFBP6 и ELOVL5 в дифференциации рецидива.
Доклад основан на совместной работе с А.В. Шкляевым (МГУ), А.В. Галатенко (НИУ ВШЭ, МГУ), В.В. Галатенко (МГУ) и А.Г. Тоневицким (НИУ ВШЭ).
 
  Обратная связь:
 Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2025