Бактерии могут жить с пятьюдесятью семью комбинациями генетических букв вместо обычных шестидесяти четырёх.
Генетический код – это тройные комбинации генетических букв, соответствующих белковым аминокислотам. Генетическими буквами неформально называют нуклеотиды – сложные молекулы, состоящие из азотистых оснований, углеводного остатка и остатка фосфорной кислоты и образующие длинные полимеры ДНК и РНК.
В ДНК это основания аденин (А), тимин (Т), гуанин (G), цитозин (С); в РНК тимин заменён на урацил (U), но по смыслу получается, что их всё равно четыре. Тройных комбинаций (триплетов или кодонов) из четырёх оснований получается 64, а аминокислот, из которых состоят белки, всего 20. Говоря точнее, это те аминокислоты, которые называют протеиногенными – из них строится полипептидная цепь в процессе трансляции, когда сложный молекулярный аппарат читает тройками последовательность нуклеотидов РНК (которая, в свою очередь, была «списана» с ДНК), переводя её в последовательность аминокислот. Уже потом, после того, как белок синтезировался, аминокислоты в его составе могут модифицироваться, но такие модификации не связаны с чтением генетического кода. В последнее время к протеиногенным аминокислотам добавляют ещё две (селеноцистеин и пирролизин), так что их число увеличивается до 22.
Но пусть их будет не 20, а 22, всё равно число возможных триплетных комбинаций генетических букв намного больше. Белоксинтезирующей машине нужно знать, где начинать синтез и где заканчивать – для этого в коде есть старт- и стоп-кодоны. Однако 64 комбинации генетических букв всё равно намного превышают число аминокислот вместе со старт- и стоп-кодонами. Это не значит, что есть неработающие кодоны, просто большинство аминокислот кодируется двумя, четырьмя и даже шестью кодонами. Собственно, по одному кодону досталось только двум аминокислотам, метионину и триптофану. Для старта и финиша тоже выделено по несколько кодонов (у них разная «популярность» и они по-разному используются в разных геномах, иногда даже становясь аминокислотными кодонами, но эти подробности сейчас неважны). Поэтому про генетический код говорят, что он триплетен, однозначен (каждый кодон может кодировать только одну аминокислоту) и вырожден – одна и та же аминокислота может кодироваться разными кодонами. Что до универсальности или неуниверсальности конкретных кодон-аминокислотных пар, то у микроорганизмов бывают свои отклонении от общего словаря.
Играет ли вырожденность генетического кода какую-то биологическую роль? Ответить на этот вопрос можно, лишив клетку какого-нибудь из избыточных кодонов. Лишив – не значит вырезав: на место одного кодона нужно поставить другой, идентичный ему по смыслу. Например, глутаминовую аминокислоту кодируют тройки GAA и GAG. Если мы хотим получить геном, в котором нет GAG, то во всех кодонах GAG нужно заменить последний G на А, чтобы этому место в геноме всё равно соответствовала та же глутаминовая аминокислота. Учитывая размеры геномов, можно понять, какая непростая работа ждёт того, кто захочет поставить подобный эксперимент. Тем не менее, несколько лет назад геном кишечной палочки удалось избавить от двух избыточных аминокислотных кодонов и одного избыточного стоп-кодона – вместо 64 комбинаций букв в геноме осталась 61. Это потребовало внести в бактериальную ДНК более 18 тыс. исправлений. Модифицированные кишечные палочки жили и размножались, пусть и слегка медленнее, чем немодифицированные. Самочувствие бактерии, впрочем, было не главным предметом интереса – результат говорил в первую очередь о том, что подобная задача решаема.
Недавно уже другие исследователи опубликовали в Science описание кишечной палочки, у которой в кодирующей части генома осталось 57 триплетных комбинаций: авторы работы устранили шесть аминокислотных (смысловых) кодонов и один стоп-кодон, заменив их синонимичными кодонами. Новые бактерии росли ощутимо медленнее – в 4 раза медленнее, чем немодифицированные. Кроме того, у них менялась активность генов. Что всё это значит, станет ясно в дальнейшем, а пока что можно констатировать, что и такое сокращение словаря клетка в принципе способна выдержать (по крайней мере, если мы говорим о бактериях). Мы писали о похожей работе около десяти лет назад, но исследователи тогда, устранив из генома кишечной палочки семь лишних кодонов, целиком всю версию генома на живых клетках не проверяли. То есть полная отредактированная версия генома существовала отдельно, а на клетках проверяли какие-то его куски. Ну, а в новой работе, повторим ещё раз, речь идёт о том, что бактерии в принципе способны жить без семи кодонов.
С одной стороны, несколько кодонов на одну аминокислоту уменьшают вероятность опасных точечных мутаций, когда одна буква меняется на другую – мутация случится, но ничего плохого не сделает. Тут нужно оговориться, что у букв в триплетах-кодонах разная значимость, и всё зависит от того, какая именно буква в триплете будет мутирована. С другой стороны, можно представить, что исчезновение лишних кодонов в клеточном геноме усложнит жизнь вирусам, которые используют все кодоны. На свете есть вирусы-бактериофаги, которые освоили альтернативный генетический алфавит, чтобы обмануть защитные противовирусные системы бактерий – почему и бактериям не поиграть со своим генетическим кодом, чтобы обмануть вирусы?
Есть косвенные данные, что избыточные кодоны не так уж избыточны. Три года назад в Nature была опубликована статья, авторы которой меняли у дрожжей одни синонимичные кодоны на другие, то есть вносили в ДНК мутации вроде тех, которые выше упоминались для глутаминовой кислоты: кодон меняется, но аминокислота остаётся той же. Эту процедуру проводили не для всего генома (который у пекарских дрожжей в три раза больше, чем у кишечной палочки), а для какого-то одного определённого гена. Эффект от мутаций оценивали по росту и размножению дрожжей, и мы тогда писали, что 75,9% синонимичных мутаций оказались для дрожжей вредны, хотя в теории все они должна были быть нейтральными. Тогда исследователи пришли к выводу, что псевдонейтральные синонимичные мутации влияют на уровень активности гена: они не меняют аминокислоты в нём, но они как-то влияют на скорость синтеза белка. Впрочем, эксперименты тут ставили всё-таки на дрожжах, семь кодонов вычеркнули у бактерий, а грибы и бактерии – это всё-таки разные домены жизни.
Автор: Кирилл Стасевич