В недавнем исследовании, опубликованном на сервере препринтов medRxiv, исследователи провели комплексный обзор рандомизированных контролируемых исследований (РКИ) с использованием алгоритмов искусственного интеллекта (ИИ) в период с 2018 по 2023 год. Целью этого обзора было пролить свет на клиническую значимость ИИ в здравоохранении и здравоохранении. определить области, требующие дальнейшего изучения. Хотя исследование дало многообещающие результаты, оно также подняло важные вопросы о внедрении ИИ в клиническую практику.*
Одобрение FDA медицинских устройств с поддержкой искусственного интеллекта
Управление по санитарному надзору за качеством пищевых продуктов и медикаментов (FDA) дало одобрение примерно 300 медицинским устройствам с поддержкой искусственного интеллекта, ссылаясь на исследования, которые продемонстрировали их превосходные характеристики по сравнению с врачами. Однако заметная обеспокоенность возникла, когда выяснилось, что некоторые широко используемые модели ИИ, такие как модель сепсиса, работают хуже, чем первоначально сообщалось их разработчиками. Это несоответствие привело к неправильным оповещениям, что вызвало сомнения в реальной эффективности ИИ в клинических условиях.
Обзорный обзор раскрывает тенденции в РКИ по искусственному интеллекту.
В своем обзорном обзоре исследователи стремились дать представление о влиянии ИИ на клиническую практику, анализируя РКИ, опубликованные в период с 2018 по 2023 год. Они использовали конкретные ключевые слова, связанные с ИИ, врачами и клиническими испытаниями, чтобы определить соответствующие исследования, опубликованные на английском языке на PubMed и International. Платформа регистрации клинических исследований (ICTRP).
Критерии включения в исследование были следующими:
1. Использование нелинейной вычислительной модели на основе ИИ в качестве вмешательства.
2. Интеграция вмешательств на основе ИИ в клиническую практику, что приводит к влиянию на здоровье пациентов.
3. Публикация в виде полнотекстовой рецензируемой статьи.
Два независимых исследователя первоначально проверяли исследования, после чего проводился полнотекстовый просмотр, а расхождения устранялись путем обсуждения третьим рецензентом. Информация о месте проведения исследования, клинической задаче, результатах и типе использованного ИИ была собрана из подходящих РКИ. Исследования были классифицированы по основным конечным точкам, таким как организация ухода, медицинская специализация и модальность данных, используемых ИИ.
Заметные тенденции в РКИ ИИ
В ходе исследования было проанализировано в общей сложности 84 РКИ, выявивших несколько заметных тенденций в развитии ИИ в клинической практике:
Медицинские специальности
– Наиболее распространенными были РКИ, связанные с гастроэнтерологией (35 из 84), за которыми следовали радиология, хирургия и кардиология.
– РКИ, связанные с гастроэнтерологией, в основном проводились четырьмя исследовательскими группами из Уханьского университета, Wision AI, Medtronic и Fujifilm. Эти исследования отличались единообразием и тестированием алгоритмов машинного обучения (МО) на основе видео с участием врачей.
Географическое распространение
– США лидируют по количеству проведенных РКИ, за ними следует Китай. Это говорит о том, что большинство РКИ были исследованиями в одном центре.
– В Китае преимущественно проводились РКИ, связанные с гастроэнтерологией, тогда как РКИ в США охватывали несколько медицинских специальностей.
– Многоцентровые РКИ в основном проводились в европейских странах, но в окончательной выборке исследований преобладали одноцентровые РКИ, в которых оценивалось в среднем 359 пациентов.
Результаты РКИ
– По сравнению с историческими обзорами РКИ по ИИ в здравоохранении, большинство РКИ, оценивающих медицинские устройства на основе ИИ в клинической практике, дали более положительные результаты по первичным конечным точкам (69/84). Столь высокий уровень успеха повышает доверие к клиническому ИИ.
– Однако важно признать, что ранняя стадия исследования и потенциальная предвзятость публикаций могли повлиять на эти наблюдения.
Необходимость клинически значимых конечных результатов
– Хотя РКИ, оценивающие диагностическую точность алгоритмов ИИ, показали многообещающие результаты, они могут неточно отражать улучшение результатов лечения пациентов.
– Исследование подчеркивает важность включения клинически значимых конечных точек, таких как симптомы пациента, выживаемость и потребности в лечении, в будущие РКИ, оценивающие алгоритмы ИИ в здравоохранении.
Исследование показывает растущий интерес к приложениям ИИ в различных медицинских специальностях и регионах. Одобрение FDA многочисленных медицинских устройств с поддержкой искусственного интеллекта подчеркивает потенциал искусственного интеллекта в улучшении здравоохранения. Тем не менее, исследование также выдвигает на первый план важные проблемы, которые необходимо решить:
1. Расхождения в производительности. Разрыв между заявленными показателями производительности ИИ и реальными результатами, как видно из модели сепсиса, требует дальнейшего исследования и уточнения.
2. Географическое разнообразие. Чтобы обеспечить эффективность систем искусственного интеллекта в различных группах населения и системах здравоохранения, существует явная необходимость в большем количестве многоцентровых международных исследований.
3. Клинически значимые конечные точки. Хотя точность диагностики имеет важное значение, будущие РКИ должны отдавать приоритет конечным точкам, которые напрямую влияют на результаты лечения пациентов, что в конечном итоге продемонстрирует истинную ценность ИИ в клинической практике.
Поскольку ИИ продолжает развиваться и находить свое место в здравоохранении, постоянные исследования и сотрудничество между заинтересованными сторонами имеют решающее значение для максимизации его преимуществ и одновременного устранения его ограничений. Исследование служит ценной дорожной картой для будущего искусственного интеллекта в клинической практике, подчеркивая необходимость более комплексного и ориентированного на пациента подхода.