Доклады Российской академии наук. Математика, информатика, процессы управления
RUS  ENG    ЖУРНАЛЫ   ПЕРСОНАЛИИ   ОРГАНИЗАЦИИ   КОНФЕРЕНЦИИ   СЕМИНАРЫ   ВИДЕОТЕКА   ПАКЕТ AMSBIB  
Общая информация
Последний выпуск
Архив
Импакт-фактор

Поиск публикаций
Поиск ссылок

RSS
Последний выпуск
Текущие выпуски
Архивные выпуски
Что такое RSS



Докл. РАН. Матем., информ., проц. упр.:
Год:
Том:
Выпуск:
Страница:
Найти






Персональный вход:
Логин:
Пароль:
Запомнить пароль
Войти
Забыли пароль?
Регистрация


Доклады Российской академии наук. Математика, информатика, процессы управления, 2024, том 520, номер 2, страницы 71–84
DOI: https://doi.org/10.31857/S2686954324700395
(Mi danma589)
 

Эта публикация цитируется в 2 научных статьях (всего в 2 статьях)

СПЕЦИАЛЬНЫЙ ВЫПУСК: ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И МАШИННОГО ОБУЧЕНИЯ

Эмпирический метод расчета размера выборки для тестирования алгоритмов искусственного интеллекта

М. Р. Коденкоab, Т. М. Бобровскаяa, Р. В. Решетниковa, К. М. Арзамасовa, А. В. Владзимирскийa, О. В. Омелянскаяa, Ю. А. Васильевa

a Государственное бюджетное учреждение здравоохранения города Москвы "Научно-практический клинический центр диагностики и телемедицинских технологий Департамента здравоохранения города Москвы", Москва, Россия
b Московский государственный технический университет имени Н. Э. Баумана, Москва, Россия
DOI: https://doi.org/10.31857/S2686954324700395
Аннотация: Расчет размера выборки – одна из базовых задач в области корректного и объективного тестирования алгоритмов искусственного интеллекта (ИИ). Существующие подходы, несмотря на исчерпывающее теоретическое обоснование, при одинаковых начальных условиях могут давать результаты, отличающиеся на порядок. Большинство вводных параметров для таких методов определяются исследователем интуитивно либо на основании релевантных литературных данных в предметной области. Подобная неопределенность на этапе планирования исследования сопряжена с высоким риском получения необъективных результатов, что особенно важно учитывать при использовании алгоритмов ИИ для задач медицинской диагностики. В рамках данной работы проведено эмпирическое исследование значения минимально необходимого размера выборки лучевых диагностических исследований для получения объективного значения метрики AUROC. Разработан и реализован в формате программного обеспечения алгоритм расчета порогового значения размера выборки по критерию отсутствия статистически значимых изменений значения метрики в случае увеличения этого размера. С использованием наборов данных, содержащих результаты тестирования алгоритмов ИИ на маммографических и рентгенографических исследованиях общим объемом более 300 тыс., проведен расчет эмпирического порога для размера выборки от 30 до 25 тыс. исследований при различном относительном содержании патологии – от 10 до 90%. Предложенный алгоритм позволяет получить результаты, инвариантные к балансу классов в выборке, целевому значению AUROC, модальности исследований и алгоритму ИИ. Эмпирическое значение минимально достаточного размера выборки для тестирования ИИ-алгоритма бинарной классификации, полученное при анализе свыше 2 млн расчетных значений, составляет 400 исследований. Полученные результаты могут быть использованы для решения задач разработки и тестирования диагностических инструментов, в т.ч. алгоритмов ИИ.
Ключевые слова: лучевая диагностика, объем выборки, искусственный интеллект, тестирование, ROC, AUC.
Финансовая поддержка Номер гранта
Министерство науки и высшего образования Российской Федерации 123031500002-1
Данная статья подготовлена авторским коллективом в рамках НИОКР “Разработка программного обеспечения для автоматического формирования наборов данных КТ-исследований сердечно-сосудистой системы с подавлением контрастирования для обучения и тестирования алгоритмов на основе искусственного интеллекта” (№ ЕГИСУ: 123031500002-1).
Поступило: 30.09.2024
Принято к публикации: 02.10.2024
Англоязычная версия:
Doklady Mathematics, 2024, Volume 110, Issue suppl. 1, Pages S62–S74
DOI: https://doi.org/10.1134/S1064562424602063
Реферативные базы данных:
Тип публикации: Статья
УДК: 004.8
Образец цитирования: М. Р. Коденко, Т. М. Бобровская, Р. В. Решетников, К. М. Арзамасов, А. В. Владзимирский, О. В. Омелянская, Ю. А. Васильев, “Эмпирический метод расчета размера выборки для тестирования алгоритмов искусственного интеллекта”, Докл. РАН. Матем., информ., проц. упр., 520:2 (2024), 71–84; Dokl. Math., 110:suppl. 1 (2024), S62–S74
Цитирование в формате AMSBIB
\RBibitem{KodBobRes24}
\by М.~Р.~Коденко, Т.~М.~Бобровская, Р.~В.~Решетников, К.~М.~Арзамасов, А.~В.~Владзимирский, О.~В.~Омелянская, Ю.~А.~Васильев
\paper Эмпирический метод расчета размера выборки для тестирования алгоритмов искусственного интеллекта
\jour Докл. РАН. Матем., информ., проц. упр.
\yr 2024
\vol 520
\issue 2
\pages 71--84
\mathnet{http://mi.mathnet.ru/danma589}
\elib{https://elibrary.ru/item.asp?id=80287437}
\transl
\jour Dokl. Math.
\yr 2024
\vol 110
\issue suppl. 1
\pages S62--S74
\crossref{https://doi.org/10.1134/S1064562424602063}
Образцы ссылок на эту страницу:
  • https://www.mathnet.ru/rus/danma589
  • https://www.mathnet.ru/rus/danma/v520/i2/p71
  • Эта публикация цитируется в следующих 2 статьяx:
    Citing articles in Google Scholar: Russian citations, English citations
    Related articles in Google Scholar: Russian articles, English articles
    Доклады Российской академии наук. Математика, информатика, процессы управления Доклады Российской академии наук. Математика, информатика, процессы управления
     
      Обратная связь:
     Пользовательское соглашение  Регистрация посетителей портала  Логотипы © Математический институт им. В. А. Стеклова РАН, 2025