М. Р. Коденко, Т. М. Бобровская, Р. В. Решетников, К. М. Арзамасов, А. В. Владзимирский, О. В. Омелянская, Ю. А. Васильев, “Эмпирический метод расчета размера выборки для тестирования алгоритмов искусственного интеллекта”, Докл. РАН. Матем., информ., проц. упр., 520:2 (2024), 71–84; Dokl. Math., 110:suppl. 1 (2024), S62

Доклады Российской академии наук. Математика, информатика, процессы управления

RUS ENG

ЖУРНАЛЫ ПЕРСОНАЛИИ ОРГАНИЗАЦИИ КОНФЕРЕНЦИИ СЕМИНАРЫ ВИДЕОТЕКА ПАКЕТ AMSBIB

JavaScript is disabled in your browser. Please switch it on to enable full functionality of the website

	Общая информация
	Последний выпуск
	Архив
	Импакт-фактор

	Поиск публикаций
	Поиск ссылок

	RSS
	Последний выпуск
	Текущие выпуски
	Архивные выпуски
	Что такое RSS

Докл. РАН. Матем., информ., проц. упр.:
Год:
Том:
Выпуск:
Страница:
	Найти

Персональный вход:
Логин:
Пароль:
	Запомнить пароль
	Войти
	Забыли пароль?
	Регистрация

Доклады Российской академии наук. Математика, информатика, процессы управления, 2024, том 520, номер 2, страницы 71–84
DOI: https://doi.org/10.31857/S2686954324700395 (Mi danma589)

Эта публикация цитируется в 2 научных статьях (всего в 2 статьях)

СПЕЦИАЛЬНЫЙ ВЫПУСК: ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И МАШИННОГО ОБУЧЕНИЯ

Эмпирический метод расчета размера выборки для тестирования алгоритмов искусственного интеллекта

М. Р. Коденко^ab, Т. М. Бобровская^a, Р. В. Решетников^a, К. М. Арзамасов^a, А. В. Владзимирский^a, О. В. Омелянская^a, Ю. А. Васильев^a

^a Государственное бюджетное учреждение здравоохранения города Москвы "Научно-практический клинический центр диагностики и телемедицинских технологий Департамента здравоохранения города Москвы", Москва, Россия
^b Московский государственный технический университет имени Н. Э. Баумана, Москва, Россия

Список цитирования (2)

DOI: https://doi.org/10.31857/S2686954324700395

Аннотация: Расчет размера выборки – одна из базовых задач в области корректного и объективного тестирования алгоритмов искусственного интеллекта (ИИ). Существующие подходы, несмотря на исчерпывающее теоретическое обоснование, при одинаковых начальных условиях могут давать результаты, отличающиеся на порядок. Большинство вводных параметров для таких методов определяются исследователем интуитивно либо на основании релевантных литературных данных в предметной области. Подобная неопределенность на этапе планирования исследования сопряжена с высоким риском получения необъективных результатов, что особенно важно учитывать при использовании алгоритмов ИИ для задач медицинской диагностики. В рамках данной работы проведено эмпирическое исследование значения минимально необходимого размера выборки лучевых диагностических исследований для получения объективного значения метрики AUROC. Разработан и реализован в формате программного обеспечения алгоритм расчета порогового значения размера выборки по критерию отсутствия статистически значимых изменений значения метрики в случае увеличения этого размера. С использованием наборов данных, содержащих результаты тестирования алгоритмов ИИ на маммографических и рентгенографических исследованиях общим объемом более 300 тыс., проведен расчет эмпирического порога для размера выборки от 30 до 25 тыс. исследований при различном относительном содержании патологии – от 10 до 90%. Предложенный алгоритм позволяет получить результаты, инвариантные к балансу классов в выборке, целевому значению AUROC, модальности исследований и алгоритму ИИ. Эмпирическое значение минимально достаточного размера выборки для тестирования ИИ-алгоритма бинарной классификации, полученное при анализе свыше 2 млн расчетных значений, составляет 400 исследований. Полученные результаты могут быть использованы для решения задач разработки и тестирования диагностических инструментов, в т.ч. алгоритмов ИИ.

Ключевые слова: лучевая диагностика, объем выборки, искусственный интеллект, тестирование, ROC, AUC.

Финансовая поддержка	Номер гранта
Министерство науки и высшего образования Российской Федерации	123031500002-1
Данная статья подготовлена авторским коллективом в рамках НИОКР “Разработка программного обеспечения для автоматического формирования наборов данных КТ-исследований сердечно-сосудистой системы с подавлением контрастирования для обучения и тестирования алгоритмов на основе искусственного интеллекта” (№ ЕГИСУ: 123031500002-1).

Поступило: 30.09.2024
Принято к публикации: 02.10.2024

Англоязычная версия:
Doklady Mathematics, 2024, Volume 110, Issue suppl. 1, Pages S62–S74
DOI: https://doi.org/10.1134/S1064562424602063

Реферативные базы данных:

Тип публикации: Статья

УДК: 004.8

Образец цитирования: М. Р. Коденко, Т. М. Бобровская, Р. В. Решетников, К. М. Арзамасов, А. В. Владзимирский, О. В. Омелянская, Ю. А. Васильев, “Эмпирический метод расчета размера выборки для тестирования алгоритмов искусственного интеллекта”, Докл. РАН. Матем., информ., проц. упр., 520:2 (2024), 71–84; Dokl. Math., 110:suppl. 1 (2024), S62–S74

Цитирование в формате AMSBIB

\RBibitem{KodBobRes24}

\by М.~Р.~Коденко, Т.~М.~Бобровская, Р.~В.~Решетников, К.~М.~Арзамасов, А.~В.~Владзимирский, О.~В.~Омелянская, Ю.~А.~Васильев

\paper Эмпирический метод расчета размера выборки для тестирования алгоритмов искусственного интеллекта

\jour Докл. РАН. Матем., информ., проц. упр.

\yr 2024

\vol 520

\issue 2

\pages 71--84

\mathnet{http://mi.mathnet.ru/danma589}

\elib{https://elibrary.ru/item.asp?id=80287437}

\transl

\jour Dokl. Math.

\yr 2024

\vol 110

\issue suppl. 1

\pages S62--S74

\crossref{https://doi.org/10.1134/S1064562424602063}

Образцы ссылок на эту страницу:

https://www.mathnet.ru/rus/danma589

https://www.mathnet.ru/rus/danma/v520/i2/p71

Эта публикация цитируется в следующих 2 статьяx:

Citing articles in Google Scholar: Russian citations, English citations
Related articles in Google Scholar: Russian articles, English articles

Доклады Российской академии наук. Математика, информатика, процессы управления

Обратная связь:

Пользовательское соглашение

Регистрация посетителей портала

Логотипы