Последовательность ДНК человека определена практически целиком. Но она более чем наполовину состоит из ДНК одного определенного человека и не отражает всего генетического разнообразия людей.
Такая база начала наполняться лишь недавно. Пангеном включает данные для жителей всех населенных континентов, представителей разных народов и этнических групп.
Цвет глаз и рост, склонность к развитию сердечно-сосудистых заболеваний и диабета, оптимальные методы лечения рака — все это определяется наследственностью и активно исследуется. Однако в таких работах ученые обычно опираются на референсный геном, который составлен из ДНК небольшого числа людей и не отражает реального генетического разнообразия. Лишь недавно был сделан первый важный шаг к созданию подобной базы. Международный консорциум представил первую версию пангенома, включающего разные варианты генов, встречающиеся у людей из разных регионов мира. Статья об этом опубликована в журнале Nature.
Напомним, секвенирование генома человека в целом завершили еще в 2001 году, оно потребовало нескольких лет работы сотен ученых из десятков научных институтов. В нем не хватало примерно восьми процентов — участков, работа с которыми оказалась слишком сложна для технологий того времени. С тех пор референсный геном GRCh38 понемногу пополняется недостающими фрагментами, последний из которых добавили в 2022 году.
Эта практически полная версия называется T2T-CHM13. Она охватывает почти 100 процентов человеческой ДНК, но не отражает настоящей генетики человека. Ведь один и тот же ген у разных людей встречается в различных состояниях (аллелях), и даже некоторые участки, которые не кодируют белки, а выполняют структурную функцию в организации хромосом, могут различаться.
Более того, GRCh38 и T2T-CHM13 собрали из фрагментов, полученных всего у 20 человек, причем более 70 процентов референсных геномов принадлежат лишь одному из них. Да и остальные представляют потомков жителей Европы и Африки и не несут информации о генетических особенностях представителей других групп.
Все это стимулировало запуск очередного масштабного международного проекта: в рамках него консорциум Human Pangenome Reference Consortium (HPRC) ведет работу над пангеномом — базой, которая отражала бы все разнообразие геномов человечества. Для этого запустили отдельный проект 1000 Genomes, цель которого — сбор образцов ДНК, оптимально отражающих это разнообразие. И лишь недавно ученые представили первые результаты своей работы. Они включают данные полного секвенирования ДНК для 47 добровольцев со всех континентов, не считая Антарктиды.
Помимо этого, ученые собирали генетический материал у их родителей, определив, от кого именно был позаимствован тот или иной участок ДНК. Работа позволила дополнить GRCh38 новыми 119 миллионами пар оснований, которые прежде секвенировать не удавалось, — вдобавок к 3,2 миллиарда, определенным ранее. Ученые HPRC также определили более 1100 дупликаций — удвоений участков ДНК, играющих огромную роль в эволюции. Но главное в том, что пангеном позволяет рассмотреть вариативность генома человека, чтобы лучше понять, как эти различия влияют на организм и состояние здоровья.
Консорциум HPRC лишь начал работу и планирует дополнять пангеном человечества результатами секвенирования ДНК все новых и новых людей. Уже сейчас к нему добавляют данные еще 123 человек, а в следующем году ученые надеются довести общее число участников до 350. Особое внимание уделят жителям регионов, плохо охваченных подобными исследованиями, включая Юго-Восточную Азию и Ближний Восток.
Автор: Сергей Васильев