Всё сочувствие, на которое мы решились
 

Шизофрения: Безумие в наследство — 2

Как развитие технологий позволило нащупать «топологическое решение» загадки шизофрении.

безумие в наследство — 2

Шизофрения — одна из самых загадочных и сложных болезней человека. Уже более ста лет ученые пытаются понять причины ее возникновения и найти ключ к терапии. Пока эти усилия не слишком успешны: до сих пор нет ни препаратов, которые могли ли бы ее по-настоящему лечить, ни даже твердого понимания того, какие молекулярные и клеточные механизмы ведут к ее развитию. О том, как ученые бьются с «загадкой шизофрении» мы уже неоднократно писали: сначала с точки зрения истории психиатрии, затем с позиции классической генетики (читателю, который действительно хочет вникнуть в суть проблемы, будет очень полезно сначала прочитать хотя бы последний текст). На этот раз наш рассказ будет посвящен новым молекулярно-биологическим методам исследования, которые появились в распоряжении ученых буквально в последние несколько лет. Несмотря на сырость методик и предварительность результатов, уже сейчас с их помощью получены важнейшие данные, впервые раскрывающие механизм шизофрении на молекулярном уровне.

В первой части рассказа о генетике шизофрении мы разобрались с тем, как ученые находят наследственные особенности, ассоциированные с ее развитием. Если кратко просуммировать историю этих исследований, то она сводится к существованию двух подходов к общей «архитектуре» наследственности: модели «распространенная болезнь — распространенная изменчивость» («common disease — common variants», CV) и модели «распространенная болезнь — редкие варианты» («common disease — rare variants», RV).

Если совсем просто, то в первом случае мы предполагаем, что болезнь — что-то вроде лотерейного билета, она развивается у только у тех людей, в геноме которых в результате случайного совпадения оказалось критическое число условных «мутаций» (правильнее говорить — полиморфизмов), которые сами по себе не уникальны, давно существуют в генофонде и встречаются почти у всех людей. Во втором случае предполагается, что шизофрения возникает в результате возникновения редких мутаций (тут уже без кавычек) в конкретной семье, где прослеживается история наследственной передачи заболевания. Подразумевается, что эти редкие мутации хоть и возникают независимо и непохожи друг на друга, приводят к одной и той же клинической картине психического заболевания.

Спор о том, какая модель более правильная, длится уже несколько десятилетий и кое-где продолжается до сих пор. По сути правыми оказали и сторонники первой, и энтузиасты второй модели — сейчас уже ясно, что «разные шизофрении» наследуются по-разному. Но если не вдаваться в детали, то на сегодняшний момент первая модель, так называемая CV («распространенная болезнь — распространенная изменчивость»), описывает гораздо больше случаев — именно она отвечает за львиную долю статистики.

Однако для сдвигов в лечении и профилактике болезни необходимо не просто знание генетических механизмов наследования, а прежде всего представление о механизме, — понимание того, нарушение каких именно процессов приводит к болезни. Положение регионов GWAS должно было бы указывать на молекулярную первопричину болезни: конкретные гены, нарушения в работе которых индуцируют болезнь. Но все не так просто.

В реальности кроме того, что феномен неравновесного сцепления упрощает генотипирование (примерно на порядок уменьшая количество маркерных SNP, непосредственно определяемое на микрочипах), он еще и усложняет интерпретацию результатов, получаемых в GWAS. Как уже говорилось выше, за счет сцепления порог значимости обычно превышается в данном регионе не одним полиморфизмом, а десятками сцепленными между собой вариантов.

Шизофрения: Безумие в наследство — 2
Увеличенный участок манхэттенского графика, показывающий локус MHC на 6-й хромосоме, наиболее сильно ассоциированный с шизофренией. Порог значимости обозначен пунктиром. Видно, как в результате LD его пересекают сотни полиморфизмов в регионе размером порядка 7 Mb (1Mb — 1 миллион пар нуклеотидов).

Эти полиморфизмы обычно покрывают область в несколько десятков тысяч пар нуклеотидов (одна тысяча пар обычно называется килобазой, от английского base — основание), а в некоторых случаях и значительно бóльшую. Так, средний размер региона GWAS в последнем исследовании PGS равен 40 килобазам, а самый большой регион в локусе MHC покрывает участок размером более 7000 килобаз (напомним, что геном человека имеет размер около трех миллионов килобаз).

Чисто генетическими методами обычно невозможно определить, какой из полиморфизмов в данном регионе GWAS является каузальным (то есть является механистической причиной болезни). Дополнительно осложняет интерпретацию результатов GWAS тот факт, что очень малая часть распространенной изменчивости влияет на структуру белков (замена аминокислот или их укорочение). По оценкам ученых, только незначительная часть предрасположенности к шизофрении определяется такими структурными SNP. Основная часть каузальной изменчивости, по всей видимости, влияет не на структуру белков, а на их количество, место или время экспрессии в организме. Другими словами, она располагается в некодирующей ДНК, составляющей более 95 процентов генома человека.

В этом безбрежном океане бессмысленных последовательностей присутствуют небольшие островки регуляторных элементов — некодирующих областей генома размером в несколько сотен пар оснований, определяющих место, время и уровень экспрессии генов в организме. Считается, что изменения в этих последовательностях и становятся причиной патологических процессов при шизофрении. Большая часть регуляторных последовательностей располагаются на значительном расстоянии от регулируемых генов, это могут быть десятки и сотни килобаз, и такие регуляторные элементы носят название удаленных (УРЭ — удаленные регуляторные элементы). Еще больше запутывает ситуацию то, что УРЭ далеко не всегда регулируют ближайший к ним ген и по положению такого элемента в целом невозможно определить, какую функцию он выполняет.

Таким образом, каузальная изменчивость, располагающаяся в регионах GWAS, обычно нарушает регуляцию генов, причем регулируемые ею гены могут располагаться как внутри региона, так и за несколько сотен килобаз от их границ. Обычно в такую область потенциального регуляторного влияния (регион GWAS + область в радиусе 1000 килобаз от его границ) входят более десятка генов. В редких случаях, несмотря на описанные сложности, все же возможно с достаточной уверенностью сказать, какой ген отвечает за ассоциацию данного участка генома с шизофренией. Так, ген DRD2, кодирующий дофаминовый рецептор типа D2, располагается в одном из регионов GWAS. Как уже говорилось, этот белок является основной мишенью антипсихотической терапии вот уже на протяжении более чем полувека. Естественно предположить, что нарушения в регуляции именно этого гена связаны с повышением риска заболеть шизофренией.

Кроме того в нескольких случаях внутри или в непосредственной близости от регионов GWAS располагаются гены, участвующие в глутаматной системе передачи сигналов, среди них гены GRM3, GRIN2A, SRR и GRIA1. Они также, по всей видимости, являются мишенью УРЭ, в которых располагается каузальная изменчивость. Так, две основные нейрохимические гипотезы патофизиологии шизофрении — катехоламиновая и глутаматная — находят подтверждение в данных GWAS. Кроме того, несколько пиков GWAS, по всей видимости, соответствуют генам, ответственным за кальциевый сигналлинг, нарушения которого также еще до генетических данных рассматривались в качестве одного из механизмов шизофрении. Примерами таких генов являются гены CACNA1C, CACNB2 и CACNA1I, кодирующие субъединицы кальциевых каналов.

Тем не менее еще раз повторим, что такие случаи, в которых легко однозначно интерпретировать пик GWAS в данном месте генома, редки и большая часть из более чем сотни обнаруженных к настоящему времени PGC регионов, ассоциированных с шизофренией, изначально являлась загадкой. Таким образом, по результатам GWAS невозможно однозначно определить ни каузальную изменчивость, ни гены, на работу которых эта изменчивость влияет. Для расшифровки того, что означают пики GWAS в тех или иных областях генома, необходимы дополнительные исследования.

Недавним примером успешной расшифровки того, как конкретная область, ассоциированная с шизофренией по данным GWAS, влияет на молекулярный фенотип клеток и в конечном счете на физиологию мозга, является работа ученых из Массачусетса (институт Broad Institute), опубликованная в начале этого года. В ней приводятся убедительные доказательства того, что значительная часть риска шизофрении, ассоциированного с чрезвычайно протяженным локусом MHC, связана со структурными вариантами гена, кодирующего компонент комплемента C4. Оказалось, что этот ген, являющийся одним из приблизительно 400 генов, входящих в локус MHC, может присутствовать в хромосоме в одном из четырех вариантов, каждый из которых детерминирует более или менее высокий уровень экспрессии ключевой изоформы С4A. По всей видимости, именно количество этого белка определяет предрасположенность к болезни носителей определенных распространенных структурных вариантов внутри локуса MHC.

Но это еще не все. Довольно давно известно, что некоторые из белков комплемента участвуют в синаптическом прунинге — процессе удаления лишних синапсов в ходе развития мозга. Кроме того, известно, что у больных шизофренией снижено общее число синаптических контактов в мозге. С другой стороны, для людей как биологического вида характерен очень растянутый по времени прунинг, протекающий после рождения на протяжении приблизительно 30 лет. Этот промежуток времени обычно как раз совпадает с первыми проявлениями шизофрении. Все эти данные позволили исследователям выдвинуть, а затем и подтвердить гипотезу, согласно которой белок C4A играет важную роль в процессе синаптического прунинга и увеличение уровня его экспрессии может иметь драматические последствия для нормального развития мозга.

Итак, описанная работа — образец того, как тонкий анализ изменчивости внутри области генома, влияющей на развитие болезни по генетическим данным, может приблизить нас к пониманию биологии болезни. Но, вероятно, случай гена C4, когда анализ скрытой от GWAS распространенной изменчивости привел к расшифровке значения одного из пиков GWAS, — исключительный. Такой путь имеет мало шансов стать общей стратегией.

Учитывая ключевую роль генетической вариабельности регуляторных элементов в формировании предрасположенности к болезни, предполагается, что магистральным путем расшифровки данных GWAS будет картирование УРЭ в клетках, связанных с патогенезом шизофрении (различных типах нейронов и глии), нахождение регулируемых ими генов и оценка влияния распространенной изменчивости внутри них на уровень этой экспрессии. Существует по крайней мере три принципиальных подхода, позволяющих решать подобную задачу.

Во-первых, исследователи могут использовать уже имеющийся пул данных о так называемых eQTL. Это такие SNP, генотип в которых ассоциирован с экспрессией тех или иных генов в определенных тканях. Например, в данном месте генома есть SNP, в котором у части людей в популяции аденин, а у оставшейся части тимин. Может оказаться, что у тех людей, у которых на месте SNP — аденин, белок X в печени экспрессируется активнее, чем у носителей варианта с тимином. Это означает, что данный SNP является eQTL для белка X в печени.

eQTL располагаются на расстоянии несколько десятков или сотен килобаз от регулируемых ими генов, и предполагается, что они маркируют положение УРЭ. Следует отметить, что к настоящему моменту в мозге картировано не так уж и много eQTL, однако в последнее время число картированных нейрональных eQTL быстро растет, не в последнюю очередь благодаря работе крупных международных консорциумов, таких как GTEx, UKBEC и CommonMind. Тем не менее даже незначительные данные по eQTL мозга, имеющиеся сейчас, позволяют находить внутри регионов GWAS потенциальные каузальные варианты и их гены-мишени.

В принципе, любая пара, состоящая из нейрон-специфического eQTL, располагающегося внутри региона GWAS, и регулируемого им гена, представляет собой вероятное объяснение ассоциации данной области генома с шизофренией.

Другая возможность для обнаружения каузальных вариантов внутри локусов GWAS — это привлечение эпигеномных данных. Усовершенствование технологий секвенирования привело к лавинообразному накоплению информации о так называемых эпигенетических характеристиках хроматина. К ним относятся связывание с различными участками генома специфических белков — транскрипционных факторов, посттрансляционные модификации базовых белков хроматина — гистонов, а также распределение этих самых гистонов по геному.

Все эти характеристики не являются константными для всех клеток данного индивида, обычно клетки каждого типа имеют свой уникальный паттерн распределения эпигенетических характеристик хроматина: один и тот же участок генома может связываться с каким-либо транскрипционным фактором в нейронах, но не в гепатоцитах или фибробластах. То же относится и к гистоновым модификациям и к плотности гистонов. Для функциональной генетики и для интерпретации результатов GWAS важно то, что УРЭ, активные в данном клеточном типе, обычно имеют характерный набор эпигенетических характеристик хроматина.

Таким образом, зная структуру хроматина по всему геному в данном клеточном типе, можно с большой долей уверенности предсказать положение УРЭ. Считается, что каузальную изменчивость в первую очередь следует искать внутри обнаруженных таким методом в регионах GWAS нейрональных УРЭ. Как и в случае с eQTL, для поиска УРЭ может использоваться информация о хроматине, полученная специализированными консорциумами типа ENCODE или Roadmap Epigenomics. Учитывая важность аннотации регуляторной части генома нейрональных клеток для понимания психических болезней, совсем недавно был создан консорциум PsychENCODE, работа которого специально посвящена хроматину различных клеточных типов мозга.

Недостатком такого подхода по сравнению с предыдущим является то, что он позволяет обнаружить лишь потенциальную каузальную изменчивость, но не гены, на которые эта изменчивость влияет. Для поиска генов-мишеней обнаруженных УРЭ нужно привлечение дополнительных данных. Существует довольно большой набор функциональных подходов, позволяющих определить, какой именно ген контролируется данным регуляторным элементом (в том числе и с использованием бурно развивающейся технологии редактирования генома CRISPR/Cas9). Однако есть проблемы с их масштабированием: довольно редко с их помощью возможно в одном эксперименте найти гены-мишени десятков УРЭ из разных областей GWAS.

Этот недостаток отсутствует у другого вспомогательного метода — картирования пространственной укладки ДНК в ядрах с использованием так называемых С-методов. Идея состоит в том, что удаленные в линейной последовательности генома от своих генов регуляторные элементы сближены с ними в трехмерном пространстве ядра. Таким образом, определяя пространственную укладку ДНК в ядрах, можно найти гены, взаимодействующие с нейрон-специфическими УРЭ, находящимися в регионах GWAS. Эти гены будут являться наиболее вероятными мишенями для каузальной изменчивости, найденной в нейрональных УРЭ.

Полногеномные варианты С-методов, обнаруживающие сразу все пары участков генома, сближенные в пространстве, сами по себе (без всяких предварительных данных о структуре хроматина) являются третьим мощным инструментом поиска пар «каузальная изменчивость — регулируемый ген». При использовании такой стратегии фактически все гены, пространственно сближенные с какими-либо участками ДНК внутри регионов GWAS, становятся кандидатами на роль генов, чья экспрессия влияет на предрасположенность к шизофрении. А те участки регионов GWAS, с которыми взаимодействуют гены-кандидаты, являются их потенциальными УРЭ, внутри которых нужно искать каузальную изменчивость.

Следует оговориться, что пространственная сближенность, обнаруживаемая при помощи С-методов, не гарантирует функционального влияния УРЭ на взаимодействующие с ними гены. После обнаружения с помощью С-методов пар «кандидатный ген — потенциальная каузальная изменчивость» в любом случае необходима дополнительная функциональная проверка. Так, довольно простые эксперименты с использованием С-методов позволяют получить расширенный список потенциально значимых взаимодействий. В этом списке при помощи более трудоемких функциональных подходов впоследствии должны быть обнаружены те гены, чья экспрессия нарушается у больных шизофренией, а также та генетическая изменчивость внутри УРЭ, которая влияет на эту экспрессию.

Топологическое решение

Все С-методы основаны на принципе лигирования по сближенности (proximity ligation). Если разрезать ДНК в ядрах клеток на очень мелкие фрагменты специальными ферментами рестриктазами (такие фрагменты носят название рестриктных и имеют размер порядка 1 килобазы), а затем сшить (слигировать) их между собой обратно, мы получим сложную смесь новых «химерных» молекул ДНК. Химерными они являются по той причине, что рестриктные фрагменты не сшиваются обратно в первоначальные молекулы хромосомной ДНК, а образуют в каждом отдельном ядре уникальные длинные линейные молекулы.

Эти химерные продукты, как из лоскутков, состоят из перекомбинированных (по сравнению с молекулами изначальной геномной ДНК) рестриктных фрагментов. Порядок, в котором рестриктные фрагменты сшиваются между собой, не совсем случаен. У каждого из них есть определенные предпочтительные партнеры по лигированию. Принцип лигирования по сближенности как раз и заключается в том, что основным фактором, определяющим вероятность сшивания двух рестриктных фрагментов, является их близость между собой в трехмерном пространстве ядра. Далекие друг от друга в линейной последовательности генома фрагменты могут предпочтительно сшиваться между собой, если они сближены, образуя что-то наподобие петли.

Шизофрения: Безумие в наследство — 2
Принцип лигирования по сближенности в С-методах. Показан небольшой участок генома, в котором есть петля, поддерживаемая неким белковым комплексом (зеленый шарик). Пространственно сближенные рестриктные фрагменты (красный и синий участки генома) с большой вероятностью сшиваются между собой в ходе процедуры. В дальнейшем количество продуктов сшивки оценивается тем или иным способом.

Впервые этот незамысловатый подход был применен в середине 90-х годов для анализа пространственной организации области генома крысы, содержащей ген пролактина. Однако широкое распространение получила модификация, появившаяся в начале 2000-х, в которой для оценки частоты лигирования между двумя определенными рестриктными фрагментами стала использоваться количественная ПЦР. Этот модифицированный метод получил название 3С (chromosome conformation capture). Дальнейшее развитие способов количественной оценки частот лигирования привел к появлению целого семейства С-методов: 4С (circular 3C), 5С (3C carbon copy), Hi-C (high-throughput 3C), ChIA-PET (Chromatin interaction analysis by paired-end tag sequencing) и другие.

С момента появления 3С в науке окончательно утвердилась точка зрения, согласно которой удаленные регуляторные элементы сближены в пространстве (образуя петли) с промоторами регулируемых ими генов. Такие контакты обычно тканеспецифичны и реализуются в клетках, в которых данный ген транскрибируется, или в их непосредственных предшественниках.

Наиболее масштабным С-методом, позволяющим количественно оценивать частоту всех возможных парных комбинаций сшивающихся рестриктных фрагментов генома, является Hi-C. Для подсчета того, с какой частотой каждая из миллионов потенциально возможных комбинаций реализуется (геном разрезается на порядка 106 фрагментов, из них можно составить порядка 1012 парных комбинаций), используется высокопроизводительное секвенирование.

Шизофрения: Безумие в наследство — 2
Полногеномная Hi-C карта клеток человека линии GM12878. Вдоль осей обозначены отдельные хромосомы — видно, что на карте они образуют яркие квадраты вдоль диагонали. Участки одной хромосомы предпочитают взаимодействовать между собой.

Для представления результатов Hi-C часто строятся двумерные графики, называемые тепловыми картами (heat maps) Hi-C, или просто Hi-C картами. На таких графиках вдоль каждой из осей отложены геномные координаты. Соответственно, каждая точка, на плоскости имеющая две координаты, соответствует комбинации двух рестриктных фрагментов. Частота лигирования между двумя этими фрагментами обозначена цветом.

Для Hi-C карт используются разные цветовые шкалы, но наиболее часто встречается красная, в которой белому цвету соответствует отсутствие лигирования между данными рестриктными фрагментами, а красному — максимальная частота лигирования. Таким образом увеличение насыщенности красного цвета отражает увеличение частоты лигирования.

Так как частота лигирования фрагмента a с фрагментом b (точка с координатами a;b на Hi-C карте) тождественно равна частоте лигирования фрагмента b с фрагментом a (точка с координатами b;a на Hi-C карте), в целом карта имеет ось зеркальной симметрии, направленную под углом 45 градусов. Вдоль диагонали обычно располагается область наибольшей частоты контактов, что логично, так как именно здесь находятся пары фрагментов, располагающиеся недалеко друг от друга в линейной последовательности генома. Эти фрагменты всегда имеют тенденцию быть недалеко друг от друга и в пространстве, а следовательно, довольно часто лигироваться между собой.

Иногда на довольно большом расстоянии от диагонали можно увидеть яркие пятна — это и есть пространственно сближенные между собой регуляторные элементы (часто это именно промоторы генов, взаимодействующие со своими УРЭ), чьи координаты можно узнать, опустив перпендикуляры на оси. Далеко не всегда контакты можно различить глазом на Hi-C карте, и тогда для поиска взаимодействий используются дополнительные биоинформатические алгоритмы.

Шизофрения: Безумие в наследство — 2
Увеличенные участки Hi-C карт небольших регионов на 8-й, 10-й и 1-й хромосомах в клетках человека линии HAP1. Кружками на одной из зеркальных половин карт обозначены пространственные контакты между удаленными участками ДНК. Над картами эти же контакты обозначены дугами, основания которых соответствуют координатам взаимодействующих участков.

В последние несколько лет с помощью Hi-C и родственных ему методов (несмотря на высокую «эзотеричность») удалось установить много поразительных закономерностей пространственной организации ДНК в клетках млекопитающих. Постепенно мы приходим к пониманию того, какие правила определяют эту организацию и как она связана с регуляцией экспрессии.

Одним из важнейших прикладных применений Hi-C и других C-методов является поиск УРЭ, влияющих на экспрессию тех или иных генов. В последние годы C-методы набирают все большую популярность как инструмент для интерпретации результатов GWAS.

Именно в качестве такого инструмента Hi-C был использован группой ученых из Университета Калифорнии Лос-Анджелес (UCLA). Результаты их работы были описаны в статье, озаглавленной «Chromosome conformation elucidates regulatory relationships in developing human brain», вышедшей в октябре 2016 года в журнале Nature.

С помощью Hi-C учеными была создана карта пространственной организации ДНК в нейронах развивающейся коры головного мозга. Для исследования были взяты клетки коры на 17-18 неделе эмбрионального развития, как раз во время пика активности нейрогенеза. Ткани эмбриональной коры были разделены на кортикальную пластинку (КП), содержащую постмитотические (неделящиеся дифференцированные) нейроны, и герминальную зону (ГЗ), в которой преобладают делящиеся предшественники нейронов.

Пространственная организация ДНК была проанализирована в двух этих клеточных типах по отдельности. Биоинформатический анализ позволил аннотировать тысячи пар контактирующих участков ДНК — как общие для этих клеточных типов, так и уникальные для каждого из них. Одной из главных целей авторов работы, как уже говорилось, было использовать данные о пространственной организации ДНК для интерпретации последнего GWAS на шизофрению, опубликованного в 2014 году.

Среди исследователей довольно давно существует мнение, что по крайней мере некоторые из процессов, нарушаемых у больных шизофренией, проходят как раз в ходе эмбрионального развития мозга. Поэтому авторы статьи посчитали, что их клеточная модель очень хорошо подходит для сопоставления результатов GWAS и данных о пространственной укладке ДНК.

Авторы выбрали около 10 000 SNP, находящихся внутри 108 регионов GWAS и потенциально являющихся каузальными вариантами. Далее они проанализировали паттерн их пространственных контактов. Было обнаружено около 900 генов, взаимодействующих с тем или иным потенциальным каузальным вариантом хотя бы в одном из исследованных клеточных типов. Очевидно, что далеко не все из обнаруженных пар «потенциальный каузальный SNP — взаимодействующий с ним в эмбриональной коре ген» играют какую-либо роль в развитии болезни.

Однако в подтверждение того, что в их данных много информации, ценной для понимания молекулярных основ шизофрении, авторы приводят ряд аргументов.

Во-первых среди обнаруженных генов есть несколько, чья роль в этиологии шизофрении не вызывает сомнений: это уже упоминавшиеся гены DRD2, GRIA1, GRIN2A и CACNA1C. Данные о пространственной укладке показывают, какие именно полиморфизмы внутри регионов GWAS могут влиять на экспрессию этих генов. Кроме того, пул из 900 генов, взаимодействующих с полиморфизмами внутри регионов GWAS, обогащен генами ацетилхолиновых рецепторов (CHRM2, CHRM4, CHRNA2, CHRNA3, CHRNA5 и CHRNB4) и генами, продукты которых принимают участие в нейрогенезе и дифференцировке клеток разных слоев коры мозга (FOXG1, EMX1, TBR1, SATB2, CUX2 и FOXP1).

Очевидно, что такое обогащение не случайно и регуляция по крайней мере некоторых из этих генов нарушена при шизофрении. Важно, что ацетилхолиновые рецепторы уже являются мишенями для разрабатываемых антипсихотических препаратов.

Данные, полученные в этой работе, вероятно, привлекут к ним еще больший интерес.

И наконец, последнее подтверждение значимости своих результатов исследователи нашли, сравнивая пул из обнаруженных ими 900 генов с теми генами, чья экспрессия нарушена в мозге больных шизофренией по данным консорциума CommonMind. Оказалось, что две этих группы генов статистически достоверно пересекаются.

В качестве доказательства того, что их данные являются надежной основой для дальнейших исследований, авторы подтвердили функциональное значение одного из обнаруженных ими пространственных взаимодействий. Для изучения был выбран SNP rs1191551, располагающийся в одном из регионов GWAS и взаимодействующий с геном FOXG1, находящимся на расстоянии 750 килобаз (!!!) от rs1191551.

В предшествующих работах почти не обсуждалась связь этого гена с шизофренией, однако было известно, что он участвует в развитии мозга, а некоторые мутации в нем приводят к тяжелым когнитивным нарушениям. С помощью так называемого люциферазного теста авторы показали, что последовательность, содержащая rs1191551, проявляет активность УРЭ, причем один из аллелей rs1191551 активирует транскрипцию значимо лучше другого.

Затем с использованием технологии CRISPR/Cas9 ученые удалили небольшую область генома, содержащую rs1191551. Удаление этой последовательности приводило к ощутимому снижению транскрипции гена FOXG1. Это подтвердило, что rs1191551 находится внутри УРЭ, контролирующего экспрессию гена FOXG1. Таким образом, есть все основания полагать, что один из вариантов rs1191551 приводит к уменьшению экспрессии гена FOXG1 в эмбриональном мозге, что приводит к увеличению предрасположенности носителей этого варианта к шизофрении.

Исследователи из Калифорнии наглядно продемонстрировали, как изучение пространственной укладки ДНК в релевантных клетках может служить основой для расшифровки результатов генетических исследований сложных наследственных заболеваний, в частности шизофрении.

Наложение данных Hi-C на результаты GWAS дает лишь ориентировочный список генов-кандидатов и соответствующих им каузальных полиморфизмов. Нет никаких сомнений в том, что многие среди найденных генов-кандидатов пространственно сближены с регионами GWAS по случайности. Только последующие функциональные исследования помогут подтвердить роль некоторых из обнаруженных генов в развитии шизофрении.

Тем не менее огромная роль подобных работ заключается в сужении потенциально бесконечного пространства для поиска каузальных полиморфизмов и регулируемых ими генов до в общем-то весьма ограниченного набора. Функциональный анализ уже в самом ближайшем будущем выделит из этого набора гены, дисрегуляция которых играет действительно важную роль в развитии болезни. Этот шорт-лист станет базой для поиска молекулярных каскадов и физиологических процессов, изменяющихся при шизофрении. Без нахождения этих каскадов и процессов едва ли стоит ожидать значимых успехов в лекарственной терапии болезни.

Автор: Аркадий Голов

Ссылка на источник