|
Доклады Российской академии наук. Математика, информатика, процессы управления, 2024, том 520, номер 2, страницы 71–84 DOI: https://doi.org/10.31857/S2686954324700395
(Mi danma589)
|
|
|
|
Эта публикация цитируется в 2 научных статьях (всего в 2 статьях)
СПЕЦИАЛЬНЫЙ ВЫПУСК: ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И МАШИННОГО ОБУЧЕНИЯ
Эмпирический метод расчета размера выборки для тестирования алгоритмов искусственного интеллекта
М. Р. Коденкоab, Т. М. Бобровскаяa, Р. В. Решетниковa, К. М. Арзамасовa, А. В. Владзимирскийa, О. В. Омелянскаяa, Ю. А. Васильевa a Государственное бюджетное учреждение здравоохранения города Москвы "Научно-практический клинический центр диагностики и телемедицинских технологий Департамента здравоохранения города Москвы", Москва, Россия
b Московский государственный технический университет имени Н. Э. Баумана, Москва, Россия
DOI:
https://doi.org/10.31857/S2686954324700395
Аннотация:
Расчет размера выборки – одна из базовых задач в области корректного и объективного тестирования алгоритмов искусственного интеллекта (ИИ). Существующие подходы, несмотря на исчерпывающее теоретическое обоснование, при одинаковых начальных условиях могут давать результаты, отличающиеся на порядок. Большинство вводных параметров для таких методов определяются исследователем интуитивно либо на основании релевантных литературных данных в предметной области. Подобная неопределенность на этапе планирования исследования сопряжена с высоким риском получения необъективных результатов, что особенно важно учитывать при использовании алгоритмов ИИ для задач медицинской диагностики. В рамках данной работы проведено эмпирическое исследование значения минимально необходимого размера выборки лучевых диагностических исследований для получения объективного значения метрики AUROC. Разработан и реализован в формате программного обеспечения алгоритм расчета порогового значения размера выборки по критерию отсутствия статистически значимых изменений значения метрики в случае увеличения этого размера. С использованием наборов данных, содержащих результаты тестирования алгоритмов ИИ на маммографических и рентгенографических исследованиях общим объемом более 300 тыс., проведен расчет эмпирического порога для размера выборки от 30 до 25 тыс. исследований при различном относительном содержании патологии – от 10 до 90%. Предложенный алгоритм позволяет получить результаты, инвариантные к балансу классов в выборке, целевому значению AUROC, модальности исследований и алгоритму ИИ. Эмпирическое значение минимально достаточного размера выборки для тестирования ИИ-алгоритма бинарной классификации, полученное при анализе свыше 2 млн расчетных значений, составляет 400 исследований. Полученные результаты могут быть использованы для решения задач разработки и тестирования диагностических инструментов, в т.ч. алгоритмов ИИ.
Ключевые слова:
лучевая диагностика, объем выборки, искусственный интеллект, тестирование, ROC, AUC.
Поступило: 30.09.2024 Принято к публикации: 02.10.2024
Образец цитирования:
М. Р. Коденко, Т. М. Бобровская, Р. В. Решетников, К. М. Арзамасов, А. В. Владзимирский, О. В. Омелянская, Ю. А. Васильев, “Эмпирический метод расчета размера выборки для тестирования алгоритмов искусственного интеллекта”, Докл. РАН. Матем., информ., проц. упр., 520:2 (2024), 71–84; Dokl. Math., 110:suppl. 1 (2024), S62–S74
Образцы ссылок на эту страницу:
https://www.mathnet.ru/rus/danma589 https://www.mathnet.ru/rus/danma/v520/i2/p71
|
|