Искусственный интеллект Microsoft эффективнее врачей в диагностике трудных ситуаций.

Инструмент искусственного интеллекта Microsoft MAI-DxO продемонстрировал более высокую точность диагностики сложных клинических случаев по сравнению с группой опытных врачей. В ходе теста, организованного компанией, ИИ поставил верный диагноз в 85,5% случаев, а 21 врач из США и Великобритании — лишь в 20%.

Тестирование состояло в проверке работы на 304 сложных случая, недавно опубликованных в журнале New England Journal of Medicine. MAI-DxO имитирует действия врача: анализирует симптомы, задает уточняющие вопросы и советует назначить необходимые медицинские тесты. Важно то, что инструмент может оптимизировать затраты, избегая назначения излишних диагностических процедур.

В разработке MAI-DxO Microsoft применила различные языковые модели: GPT, Llama, Claude, Gemini, Grok и DeepSeek. Наиболее удачным оказалось сочетание инструмента с моделью o3 от OpenAI. По информации компании, врачи в тестовом режиме работали поодиночке, без возможности советоваться с коллегами или использовать дополнительные ресурсы. Это не соответствует реальным условиям работы медиков.

Это достижение отличается от предыдущих тестов ИИ в медицине, например сдачи экзамена USMLE, где системы показывают почти идеальные результаты. Microsoft отмечает, что новый тест фокусируется на «последовательной диагностике» — ключевом навыке реальной врачебной работы, требующем глубокого понимания, а не запоминания фактов.

В настоящее время MAI-DxO не применяется в клинической практике. Следующие этапы включают тестирование инструмента на распространенных заболеваниях. Перед внедрением необходимы клинические испытания для оценки безопасности и эффективности, а также одобрение регулирующих органов. Вице-президент Microsoft AI по вопросам здравоохранения Бэй Гросс назвал разработку доказательством концепции, показывающим, что искусственный интеллект может решать сложнейшие диагностические задачи с помощью врачебной логики.

Компания заявляет, что инструмент призван помогать врачам, а не заменять их. Функции инструмента: автоматизация рутинных задач, помощь в постановке диагноза и разработка индивидуальных планов лечения. Подробности исследования описаны в научной статье, которая пока не была рассмотрена экспертами.