Считается, что гены в эволюции возникают преимущественно из других генов. Например, когда клетка делится, она обязательно делает копию собственной ДНК.
Молекулярная машина, которая занимается копированием ДНК, может дважды скопировать какой-то участок старой ДНК в новую ДНК, в результате одна или даже две дочерние клетки могут получить дополнительную копии какого-то гена. Одна из его копий будет заниматься тем же, чем и всегда, а вторая станет эволюционным полигоном – в ней могут накапливаться мутации, меняющие функции гена. Он, конечно, может либо испортиться, но может, наоборот, начать выполнять какую-то новую работу в клетке.
Другой вариант – когда два гена обмениваются своими фрагментами. Это называется рекомбинацией – процесс довольно сложный с молекулярной точки зрения, но, так или иначе, перед нами появляются новые гены, смонтированные из других генов. И для первого, и для второго варианта можно найти многие примеры в геномах живых существ. Но что насчёт появления гена, так сказать, с нуля, без помощи генов-предшественников? Ген в таком случае должен появиться из какой-то последовательности генетических букв в ДНК, которая раньше была бессмысленной, а потом вдруг обрела смысл.
В геномах животных, растений, грибов и пр. в изобилии встречаются такие куски, которые ничего не кодируют, ни белков, ни служебных молекул РНК, и которые не заключают в себе никаких регуляторных элементов, которые бы влияли на активность других генов; собственно, у многих видов бессмысленная ДНК составляет большую часть генома. В таких последовательностях тоже накапливаются мутации, и можно представить, что мутации могут превратить подобную последовательность в настоящий ген, кодирующий какой-нибудь белок. Что для этого нужно?
Во-первых, необходимо, чтобы на последовательность обратили внимание ферменты транскрипции, которые копируют генетическую информацию из ДНК в РНК – потому что белок-синтезирующие машины могут работать только с РНК. Значит, в последовательности, которая хочет превратиться в ген, должны появиться сигналы для транскрипции. Во-вторых, в ней должны появиться сигналы для трансляции, то есть для синтеза белка: РНК должна как-то приманить к себе белки и молекулярные комплексы, выполняющие трансляцию.
Наконец, новорождённый ген не должен кодировать ничего неприятного: тот белок, который белок-синтезирующие машины сделают на РНК, должен как минимум не мешать другим белкам и прочим биомолекулам выполнять свою работу. Но вообще белку хорошо бы иметь какую-то полезную функцию – потому что если её не будет, если белок и его ген окажутся бесполезны, то ген довольно быстро обессмыслится. То есть если это будет признак, который никак не меняет шансы выжить и оставить потомство, то в гене накопятся мутации, которые его просто отключат, а вид в целом выключения гена никак не почувствует. (Если же это будет вообще что-то вредное, то благодаря отбору такой ген исчезнет ещё быстрее.)
Чтобы найти такие «независимые» гены, нужно сравнить несколько очень тщательно прочитанных геномов близких эволюционных родственников. Если мы хотим убедиться в том или ином происхождении гена, нужно проследить его генеалогию у близкородственных видов, и в случае генов с предполагаемым происхождением эту генеалогию нужно восстанавливать особенно тщательно. Часто оказывалось, что у генов, которые возникли как будто сами по себе, на самом деле были предшественники, просто некоторые звенья их развития впоследствии выпали в ходе эволюции. Поэтому часто говорят, что гены, возникшие сами по себе, появились очень, очень давно, и с какого-то момента новые гены стали появляться так, как мы говорили в начале.
Но вот исследователи из Чикагского университета, Аризонского университета и геномного центра BGI в Шэньчжэне опубликовали в Nature Ecology and Evolution статью, в которой описывают настоящие «независимые» гены у 11 близкородственных видов риса. Таких генов насчитали как минимум 175, и их нашли, не только сравнивая геномы (то есть последовательности ДНК разных видов) – на этих генах синтезировалась РНК, и более половины генов давали какие-то белки. Если учесть, что общее число генов у разных видов риса превышает 35.000, то число «независимых» генов кажется небольшим. С другой стороны, те виды риса, чьи геномы анализировали, с эволюционной точки зрения совсем молоды, им всего 3–4 млн лет. То есть их гены, появившиеся «с нуля», появились вовсе не в незапамятные времена, а очень недавно.
С другой стороны, пока неизвестно, что делают те белки, которые закодированы в этих рисовых генах. Авторы работы говорят, что собираются исследовать их в самое ближайшее время, но одновременно отмечают, что большинство «независимых» генов пока ещё не слишком почувствовали давление отбора. Те мутации, которые в них происходят, по тем или иным причинам не влияют (или не очень сильно влияют) на шансы растения выжить и оставить потомство; возможно, какой-то эволюционный вердикт им ещё предстоит в будущем.
Автор: Кирилл Стасевич