Американские ученые использовали образцы устной речи подростков из группы риска развития психоза для обучения алгоритма предсказания появления этого состояния.
Программа, описанная в статье в World Psychiatry, работает на основе методов автоматической обработки естественного языка и предсказывает развитие психоза с точностью в 83 процента.
Одним из признаков развития психоза (характерное для многих психических расстройств состояние, при котором утрачивается «связь» с реальным миром, и человек начинает видеть, слышать и ощущать то, чего на самом деле нет) является нарушение процесса мышления. Оно, в свою очередь, может выражаться в нарушении речи. Так, в речи больных шизофренией наблюдаются нарушения как семантической, так и синтаксической составляющих: например, бедность (использование простых конструкций и понимание только закрытых типов вопросов) и запутанность (нарушение связности речи) речи.
При психиатрической диагностике врачи могут использовать беседу с пациентом как способ выявления наличия или признаков развития психоза. Методы автоматической обработки естественного языка, однако, могут быть более эффективны для таких целей, в частности — для выявления характерных для такого нарушения речи паттернов.
Группа ученых под руководством Гильермо Чекки (Guillermo A. Cecchi) из Исследовательского центра Томаса Уотсона в Нью-Йорке ранее уже использовала методы автоматической обработки естественного языка для анализа речи людей в группе риска развития психоза. Тогда ученым удалось выявить характерные для такого нарушения речи семантические и синтаксические маркеры: минимальная семантическая связность (запутанность повествования, уход от темы), уменьшенная длина предложений и сокращение использования указательных местоимений. В своей новой работе авторы использовали эти данные для обучения классификатора, который сможет определить вероятность дальнейшего развития психоза у людей в группе риска.
Для этого авторы использовали часовые интервью и пересказы историй 93 подростков и молодых людей из группы риска; у 24 из них в течение последующих двух с половиной лет после начала исследования наблюдался психоз. Полученные образцы устной речи разбили на токены, присвоили им теги частей речи, а также построили семантические векторы, указывающие на смысловую схожесть двух часто встречающихся друг с другом слов. Семантическую связность, таким образом, можно оценить, сравнив косинусы между двумя векторами: бóльший показатель будет указывать на бóльшую семантическую связность в предложении.
Ученым удалось автоматически определить развитие психоза по анализу текста людей из группы риска с точностью в 83 процента, а отличить речь людей с психозом от участников из контрольной группы — с точностью в 72 процента.
В будущем авторы планируют испробовать метод определения вероятности начала психоза на большей популяции — а также попытаться адаптировать его для других языков помимо английского. В целом, предложенный учеными метод может быть использован для улучшения предупреждения обострения психических заболеваний.
Автор: Елизавета Ивтушок