У всех живых организмов, от бактерий до человека, генетический алфавит состоит из четырех молекулярных букв – А, Т, Г, Ц. Буквы эти – азотистые основания аденин, тимин, гуанин и цитозин.
В двуцепочечной молекуле ДНК они пришиты к длиннейшим сахарофософатным «перилам» и смотрят друг на друга – то есть в пространство между цепочек, причем напротив А всегда должен стоять Т, а напротив Г – Ц.
Но сами по себе буквы ничего не значат – они должны складываться в слова. Слова в генетическом коде земной жизни состоят из трех букв, образующих между собой разные комбинации. Такие слова-триплеты соответствуют аминокислотам, и когда идет синтез белка, то специальные машины читают код тройками, и в соответствии с последовательностью троек строят последовательность аминокислот. (Там есть особенности с передачей информации от ДНК через матричную РНК к белоксинтезирующим машинам, но эти подробности мы сейчас опустим.)
Если посчитать, сколько комбинаций-триплетов можно получить, имея на руках четыре буквы, то мы получим 64 комбинации. Между тем в синтезе белков участвуют всего 20 аминокислот. То есть код сильно избыточен, и потому одной аминокислоте часто соответствуют два, три и больше генетических слов.
Рано или поздно биологам должны была прийти в голову мысль, что генетический код можно отредактировать на фундаментальном уровне, то есть приписать каким-то словам новые значения, а то и вовсе расширить алфавит и словарь. Смена значений слов кажется более сложной задачей, ведь тут нужно сначала лишить триплет прежнего значения (о том, как это делают, мы как-то писали), а уж потом приписать ему новое.
Тем не менее, несколько лет назад в Science вышла статья, в которой описывалось, как у бактерий кишечной палочки удалось присвоить одному из избыточных триплетов значение абсолютно новой аминокислоты. Поскольку аминокислоты к белоксинтезирующей машине подвозят специальные транспортные РНК (тРНК), то пришлось создать и новую тРНК, которая носила бы с собой новую аминокислоту и распознавала бы ее код во время синтеза полипептидной цепи.
Но тРНК не сами хватают свои аминокислоты, для этого есть специальные ферменты – аминоацил-тРНК-синтетазы, которые узнают только свои аминокислоты и соответствующие им тРНК. Понятно, что авторам работы пришлось создать тут и новый фермент, который бы соединял новую аминокислоту с новой тРНК.
Но можно, как мы сказали, начать редактировать код еще раньше – с алфавита. Иными словами, что мы сначала должны создать новую букву, то есть новое азотистое основание. На самом деле, с химической точки зрения тут особо сложного ничего нет, и создать новую букву можно, просто модифицировав какую-нибудь старую. (Более того, клетки сами модифицируют «буквы», и порой довольно сильно, правда, код от этого не меняется.)
Но мало синтезировать новую «букву», она должна нормально встроиться в нуклеиновую кислоту и участвовать во всех необходимых молекулярных процессах. Впервые такие «буквы» появились в конце 80-х годов прошлого века, то были модификации гуанина и цитозина; ДНК с ними нормально удваивалась и на ней нормально синтезировалась молекула-посредник – матричная РНК, которая несет информацию о белке к белоксинтезирующему аппарату.
Флойд Ромесберг (Floyd Romesberg) и его коллеги из Института Скриппса за последние двадцать лет создали несколько сотен новых букв, однако расширить с их помощью генетический код удалось только сейчас. В своей последней работе исследователи вместе с сотрудниками биотехнологической компании Synthorx использовали два новых азотистых основания, которые для простоты лучше назвать X и Y.
В двуцепочечной молекуле ДНК они стоят друг напротив друга, но при этом соединяются они не так, как все остальные: если А и Т, Г и Ц держатся друг за друга водородными связями, то X и Y удерживаются друг напротив друга гидрофобными силами, что добавляет им странности. Тем не менее, пара X и Y не выбивается из ряда прочих «традиционных» пар, а значит, не нарушает структуру ДНК – ее физические параметры (расстояния между цепями, размер шага спирали и т. д.) остаются по всей длине прежними, что очень важно для взаимодействия с белками и вообще для целостности молекулы.
Поначалу, впрочем, бактерии с такой ДНК делились медленнее обычного и норовили заменить «нетрадиционную» ДНК нормальной. Однако исследователи все-таки доработали новые буквы, так что они перестали доставлять неудобство бактериям. Теперь осталось только сделать из них новые слова-триплеты, которые кодировали бы две аминокислоты. В качестве новых аминокислот выбрали модификации лизина и фенилаланина. Новые триплеты генетических букв оказались такими: AXC (то есть аденин-X-цитозин) и GYT (гуанин-Y-тимин). Их внедрили в ДНК, кодирующую зеленый флуоресцентный белок, а ДНК отправили в бактериальную клетку – и клетка засветилась зеленым. При этом, разумеется, у бактерий были вышеупомянутые ферменты и тРНК, чтобы обслуживать новые триплеты в коде и новые аминокислоты, а сами аминокислоты нужно было добавлять в питательную среду. Полностью результаты описаны в статье в Nature.
Возникает вопрос, зачем вообще нужно столь фундаментально вмешиваться в генетический алфавит и словарь. Здесь все просто: с новыми аминокислотами можно создавать новые белковые молекулы, сконструированные для конкретных задач. Конечно, белки модифицировали в лабораториях и раньше, но, внедрившись в генетический код, это можно проделывать намного эффективнее. И тут речь не только о белках, но и о полусинтетических организмах с новыми свойствами.
Причем не стоит забывать, что, добавив всего лишь две буквы, мы расширяем число возможных генетических слов до 216, и в результате получаем возможность кодировать еще 172 аминокислоты, вдобавок к прежним двадцати. Простор для биоинженерии, как видим, бескрайний.
Автор: Кирилл Стасевич