Американские разработчики из Массачусетского технологического института создали метод автоматической диагностики депрессии по устной речи.
Подход основан на использовании нейросети, натренированной на беседах с пациентами с депрессией и со здоровыми людьми. Точность диагностики с использованием предложенного метода составила 77 процентов. Авторы отмечают, что алгоритм контекстно-свободный и диагностика может быть проведена на любом достаточно полном фрагменте речи пациента, вне зависимости от темы разговора. Препринт статьи с результатами исследований выложен на сайте института.
Обычно диагностика депрессии проходит с помощью бесед с психиатром, которые включают в себя стандартные вопросы об истории психических расстройств и зависимостей в семье и динамике настроений и самочувствия пациента за определенный период. Согласно МКБ-10, депрессивный эпизод характеризуется пониженным настроением, неспособностью радоваться и получать удовольствие, потерей интереса к привычным видам деятельности, усталостью, проблемами с аппетитом (или его потерей, или наоборот — перееданием) и сном (гиперсомнией или бессонницей). Распознать пониженное настроение и потерю интереса при этом не так просто: часто пациенты могут, к примеру, отрицать наличие проблемы или не любить говорить о себе и своих чувствах. В этом случае диагностировать депрессию (или другое аффективное расстройство) может только очень опытный специалист.
Разумеется, существуют и стандартизированные методы диагностики депрессии. Так, с 60-х годов прошлого века для этого применяют шкалу депрессии Бека, для самостоятельной диагностики используется аналогичная шкала Занга, а Американская психологическая ассоциация уже несколько десятков лет разрабатывает и дополняет Опросник здоровья пациента (Patient Health Questionnaire — PHS).
С развитием технологий искусственного интеллекта появилась возможность автоматической диагностики психических заболеваний. Чаще всего материалом для диагностики служит устная речь пациента: например, зимой этого года исследователи придумали метод диагностики психоза. Сейчас исследователи из Массачусетского технологического института под руководством Джеймса Гласса (James Glass) разработали аналогичный алгоритм и для распознавания депрессии. Для этого они взяли данные из DAIC (Distress Analysis Interview Corpus) — корпуса интервью с людьми с симптомами депрессиями, а также здоровыми людьми. Всего ученые использовали беседы со 142 участниками, психическое состояние которых было заранее известно на основе результатов опросника PHQ: из всех использованных записей 20 процентов (это 28 интервью) были проведены с людьми с диагностированной клинической депрессией.
Собранные данные были использованы для обучения нейросети с долгой краткосрочной памятью: такая архитектура хорошо подходит для решения задачи классификации при достаточном количестве исходных параметров. В анализе человеческой речи выбранные параметры зависят от формы разговора (диалога или монолога), а также от того, письменная речь или устная. Для обучения исследователи взяли как аудиозаписи, так и их расшифровки. В первом случае учитывались пространственные и временные параметры речи: паузы, высота голоса и среднее время, потраченное на произнесение одного слова, — а во втором были построены векторные модели произнесенного, по которым потом вычислялись самые частотные слова и словосочетания, употребляемые людьми с разным диагнозом. На основе этих параметров нейросеть выдавала «диагноз» — балл от 0 до 27: оценка в промежутке от 0 до 4 означала отсутствие депрессивных симптомов, а от 20 до 27 — тяжелую депрессию.
Для тестирования исследователи использовали 47 интервью людей с разным диагнозом. Полнота (доля правильно распознанных объектов из числа всех положительных) диагноза составила 83 процента, а точность (доля правильно распознанных объектов из всех распознанных) — 71 процент. Средняя точность автоматической диагностики составила 77 процентов. Интересно, что эффективность диагностики зависела от входных данных: для того, чтобы поставить диагноз на основе текста, достаточно было семи реплик, а диагностика по аудио требовала тридцати.
Разработанный алгоритм — не первый в автоматической диагностике депрессии по речи пациентов. Однако по словам авторов это первый контекстно-свободный алгоритм: при обучении нейросети исследователи не учитывали то, на какие именно вопросы и реплики отвечали участники. Этот подход, таким образом, может быть использован для диагностики аффективных расстройств по любому разговору — необязательно в формате общения пациента с врачом.
На протяжении последних тридцати пяти лет самые популярные методы лечения депрессии — психотерапия и препараты, работающие по принципу селективного ингибирования обратного захвата серотонина (СИОЗС). Однако предсказать эффективность каждого из них для отдельного пациента не так просто: тем не менее, недавно ученые научились делать это с помощью анализа данных электроэнцефалограммы головного мозга.
Автор: Елизавета Ивтушок