|
|
Прикладная статистика
3 октября 2025 г. 13:00, г. Новосибирск, онлайн Зум (указано московское время)
|
|
|
|
|
|
|
Оценка статистической значимости одного классификатора, идентифицирующего ER-положительный рак молочной железы
А. П. Жиянов Национальный исследовательский университет "Высшая школа экономики", г. Москва
|
|
Аннотация:
Классификаторы широко используются в биомедицинских приложениях для выявления закономерностей, позволяющих различать группы образцов (например, рак и норму).
Построение классификатора можно разделить на два основных этапа: выбор метода классификации и метрики, определяющей его качество.
Среди методов классификации важный класс составляют линейные методы, обладающие высокой степенью интерпретируемости.
Обычно качество классификатора измеряется на отдельной выборке.
Тем не менее бывает полезно сравнить это качество с референсным значением.
Для линейных классификаторов в качестве референсного мы предлагаем рассматривать качество “случайного” классификатора.
Формально, пусть $Y = (Y_i, i \le k)$, $Z = (Z_i, i \le l)$ – две независимые выборки в $\mathbb{R}^d$, взятые из распределений $\mathcal{F}_{Y}$ и $\mathcal{F}_{Z}$ соответственно.
Предположим, что множества $\{ Y_i, i \le k \}$ и $\{ Z_i, i \le l \}$ почти линейно разделимы.
В этом случае естественно считать, что $\mathcal{F}_Y \neq \mathcal{F}_Z$.
Доклад посвящен ответу на вопрос, какова вероятность события $A_m$, что две выборки почти линейно разделимы с не более чем $m$ ошибками, если их распределения предполагаются равными?
В докладе будут представлены верхние оценки условной $\mathbb{P}( A_m \mid (Y, Z))$ и безусловной $\mathbb{P}( A_m )$ вероятностей почти линейной разделимости.
На их основе строится статистический критерий, который применяется к классификатору, обнаруживающему рецидив рака молочной железы у пациентов с ER-положительным статусом.
В результате подтверждается роль пары генов IGFBP6 и ELOVL5 в дифференциации рецидива.
Доклад основан на совместной работе с А.В. Шкляевым (МГУ), А.В. Галатенко (НИУ ВШЭ, МГУ), В.В. Галатенко (МГУ) и А.Г. Тоневицким (НИУ ВШЭ).
|
|