Американские разработчики научились предсказывать развитие психоза у пациента. Для этого они использовали алгоритм автоматического анализа речи, в который вошли две метрики: оценка семантической наполненности речи и использование слов, связанных со звуками.
Оказалось, что те пациенты, у которых вскоре после интервью развился психоз, отличались бедностью словарного запаса и частым использованием слов вроде «звук» и «шепот». Точность такой диагностики, как сообщается в статье, опубликованной в npj Schizophrenia, составила 93 процента.
Многие психические расстройства (включая, например, шизофрению и биполярное расстройство) сопровождает психоз — измененное состояние психики, при котором теряется связь с объективным внешним миром, и человек начинает видеть, слышать и чувствовать то, чего на самом деле не происходит. Как такового лечения психоза не существует: в зависимости от сопровождающего диагноза помочь могут антипсихотические препараты или терапия, но избавиться от состояния навсегда с помощью них удается редко.
При этом психоз необязательно возникает вследствие развития какого-то заболевания и входит в его патогенез, а может и вовсе быть первичным синдромом. Психоз в легкой форме контролировать можно, за счет чего удается избавиться от последующего ухудшения психического состояния. Для облегчения диагностики психоза сейчас активно разрабатываются автоматические методики: многие из них направлены на то, чтобы определить вероятность развития психоза по речи человека, которая меняется по причине изменения психического состояния. В январе прошлого года разработчикам, к примеру, удалось с помощью автоматического анализа речи выявить ряд факторов, сигнализирующих о вероятном развитии психоза (нарушение семантической связности, уменьшение длины предложений, отсутствие указательных местоимений) и добиться точности предсказания в 83 процента.
Новый подобный метод предложили ученые под руководством Филлипа Вулффа (Phillip Wolff) из Университета Эмори (Атланта, США). В отличие от своих предшественников, они сосредоточились на семантике, а точнее — на двух аспектах речи людей, которые отвечают за значение сказанного и могут сигнализировать о риске развития психоза.
Первый аспект — семантическая бедность речи: наличие навязчивых мыслей, отсутствие связи с реальностью может приводить к тому, что речь человека обедняется, используемый словарь сильно уменьшается, появляются определенные повторяющиеся паттерны. Второй аспект связан напрямую с одним из наиболее ярких симптомов психоза — слуховых галлюцинациях: их появление, разумеется, не проходит незамеченным, из-за чего человек, переживающий их, может чаще рассказывать о том, что он слышит, употребляя слова, связанные со звуками и голосами.
В своем исследовании ученые использовали вырезки из интервью 40 человек, которые в течение двух лет наблюдались у университетского психиатра: из них у 12 человек во время наблюдений (и после интервью) был диагностирован психоз. Исследователи воспользовались алгоритмом word2vec, с помощью которого каждое слово представляется в виде вектора в многомерном пространстве; в нем близость двух векторов друг к другу указывает на семантическую близость двух слов.
Для того, чтобы определить некоторое поле семантической нормы обычных бесед и, соответственно, предварительно обучить модель, ученые составили векторное представление слов из постов на Reddit 30 тысяч пользователей. После векторного представления каждого слова алгоритм составляет векторное представление каждого предложения, суммируя значения обозначающих слова в нем векторов, на основе чего выделяется основная идея-предложение, которое также представляется в виде вектора, соответствующего определенному слову в предложении. Например, объединяющее и основное значение предложений «я хочу яблоко», «он хочет жить» и «они хотят свободы» — значение нужды в чем-либо, которое выражается в глаголе «хотеть». Семантическая наполненность использованных предложений высчитывается с помощью расчета близости основного слова в нем ко всем остальным. Эту же модель использовали для того, чтобы выделить семантическое поле слов, связанных со звуками: в него вошли, к примеру, слова «шепот», «слышать», «громкий», «голос» и «звук».
На основе обеих моделей затем натренировали классификатор, который на основе показателя семантической наполненности и наличия слов, связанных со звуками, определяет, попадает ли человек в группу людей, у которых развился психоз. Оказалось, что и тот, и другой показатель коррелирует с тем, будет ли у человека диагностирован психоз. Совместный анализ интервью пациентов с помощью двух метрик позволил правильно предсказать появление психоза с точностью в 93 процента.
Несмотря на то, что использованный алгоритм работает на основе анализа речи — точно так же, как работает диагностика психиатром — новый метод может быть намного эффективнее: объективный статистический анализ семантических параметров речи основан на работе с бóльшим количеством материала. Это также означает, что два отдельных возможных маркера развития психоза — использование слов, связанных со звуками, и бедность словаря — в психотерапевтической практике не могут быть использованы для постановки диагноза.
Психоз — не единственное, что сейчас умеют диагностировать с помощью автоматического анализа речи. Осенью американские разработчики, к примеру, представили алгоритм, который по анализу речи определяет депрессию с точностью 77 процентов.
Автор: Елизавета Ивтушок