В останні роки штучний інтелект (ШІ) стає все більш важливим інструментом у медичній діагностиці, зокрема в боротьбі із сепсисом — небезпечним станом, що виникає внаслідок інфекції. Проте фахівці наголошують на необхідності ретельного калібрування та персоналізації алгоритмів ШІ для досягнення максимального ефекту. Сепсис є складною патологією, яка може швидко прогресувати і призводити до серйозних наслідків, включаючи смерть пацієнта. Тому своєчасна та
Дослідження, проведене у дев’яти лікарнях невідкладної допомоги США, виявило серйозні виклики у впровадженні алгоритмів штучного інтелекту при визначенні та прогнозуванні перебігу сепсису.
До аналізу було включено дані майже 200 тисяч дорослих пацієнтів, серед яких 54,8% становили жінки. Локально навчена модель, що генерувала прогнози кожні 15 хвилин на основі вітальних показників та результатів лабораторних аналізів, порівнювали з трьома загальноприйнятими моделями: Sepsis-3, протоколами Medicare (SEP-1) та CDC (ASE). Частота виявлення сепсису коливалася від 1,2% до 2,9% залежно від обраного стандарту, що безпосередньо впливало на здатність алгоритму коректно визначати загрозу.
Модель продемонструвала лише помірну точність, яка критично залежала від того, яке саме медичне визначення сепсису використовувалося для оцінки. Ключовою проблемою стала низька прогностична цінність позитивного результату. При використанні стандарту Sepsis-3 лише в 11,4% випадків спрацювання моделі виявлялося правдивим, а при критеріях SEP-1 цей показник падав до 6,8%. Хоча модель давала лікарям запас часу від 3,4 до 4,5 годин до клінічного прояву, ціна такого випередження була занадто високою — кожен п’ятий пацієнт отримував хибне сповіщення про сепсис. Це створює ризик «втоми від тривог» серед медичного персоналу та загрожує ігноруванням справді критичних ситуацій.
Крім того, точність моделі суттєво знижувалася зі збільшенням тяжкості стану пацієнта: найкращі результати спостерігалися у відділеннях невідкладної допомоги, тоді як у відділеннях інтенсивної терапії показники були значно гіршими.
Високий рівень хибнопозитивних результатів та мінливість випередження в часі ставлять під сумнів поточну клінічну корисність таких інструментів без суттєвого калібрування.
Автори дослідження наголошують, що без ретельного налаштування та персоналізації навіть сучасні ШІ-моделі можуть приносити більше хаосу, ніж реальної допомоги у боротьбі за життя пацієнтів.