§ 23. Генетический код и его свойства

Как вы знаете, признаки и свойства каждого организма определяются прежде всего белками, которые синтезируются в его клетках. Белки выполняют самые разнообразные функции (вспомните какие), обеспечивая тем самым протекание процессов жизнедеятельности. Можно сказать, что именно от этих биополимеров в первую очередь и зависит существование организма. Однако время функционирования белков, как и многих других биомолекул, весьма ограничено. Поэтому синтез белков в организме должен осуществляться непрерывно. Этот процесс протекает во всех клетках одноклеточных и многоклеточных организмов.

Вам также известно, что хранителем наследственной (генетической) информации, т. е. информации о первичной структуре белков, является ДНК. Участок молекулы ДНК, содержащий информацию о первичной структуре одного белка, получил название ген. Кроме того, генами называют участки ДНК, хранящие информацию о строении молекул рРНК и тРНК.

В биосинтезе белков, который осуществляется в рибосомах, ДНК прямого участия не принимает. Передача генетической информации, содержащейся в ДНК, к месту синтеза белка происходит с помощью посредника. Этим посредником является матричная (информационная) РНК (мРНК, иРНК), которая синтезируется на одной из цепей молекулы ДНК по принципу комплементарности.

В молекулах ДНК и мРНК информация о первичной структуре белков «записана» в виде последовательности нуклеотидов. Сами же белки синтезируются из аминокислот. Значит, в природе существует особая система кодирования, на основании которой последовательность нуклеотидов расшифровывается в виде последовательности аминокислот молекул белков. Этот «шифр» называется генетическим кодом. Таким образом, генетический код — это система записи информации о первичной структуре белков в виде последовательности нуклеотидов ДНК (мРНК).

Генетический код обладает следующими свойствами.

1. Код является триплетным. Это значит, что каждая аминокислота кодируется триплетом (кодоном) — сочетанием трех последовательно расположенных нуклеотидов. В состав молекул ДНК и РНК входит по 4 типа нуклеотидов. Если бы за определенную аминокислоту «отвечал» один нуклеотид, можно было бы закодировать только 4 из 20 белокобразующих аминокислот. Дублетов (по два нуклеотида) хватило бы лишь на 42 = 16 аминокислот. Количество возможных триплетов (сочетаний трех нуклеотидов) составляет 43 = 64. Этого с избытком хватает для кодирования всех 20 видов аминокислот  (табл. 23.1).

Таблица 23.1. Генетический код, указаны нуклеотиды мРНК (иРНК)
(первый нуклеотид триплета берут из левого вертикального ряда, второй — из горизонтального ряда,
третий — из правого вертикального)

Обратите внимание, что 3 из 64 кодонов (в молекулах мРНК — УАА, УАГ и УГА) не кодируют аминокислоты. Это так называемые стоп-кодоны *или нонсенс-кодоны (от англ. nonsense — бессмыслица)*, они служат сигналом окончания синтеза белка. *Остальные триплеты называются смысловыми.*

*Генетический код расшифровали американские биохимики Р. Холли, Х. Г. Корана и М. Ниренберг в середине прошлого века. Работа стартовала в 1961 г. В бесклеточные системы, содержащие все необходимые компоненты для синтеза белка (рибосомы, аминокислоты, тРНК и др.), ученые сначала вводили искусственно синтезированные мРНК, состоящие только из одного типа нуклеотидов. Было выяснено, что в присутствии, например, полицитидиловой мРНК (ЦЦЦЦЦЦ...) синтезируется полипептид, состоящий только из остатков аминокислоты пролина, в присутствии полиуридиловой (УУУУУУ...) — из фенилаланина. Стало понятно, что кодону ЦЦЦ соответствует пролин, а триплет УУУ кодирует фенилаланин. К 1965 г., благодаря использованию искусственно синтезированных молекул мРНК с известными повторяющимися последовательностями нуклеотидов, удалось расшифровать все остальные триплеты. В 1968 г. это открытие было удостоено Нобелевской премии.*

2. Код однозначен — каждый триплет кодирует только одну аминокислоту.

3. Как уже отмечалось, число триплетов превышает количество кодируемых аминокислот. Поэтому генетический код является избыточным (вырожденным) — одна и та же аминокислота может кодироваться разными триплетами. Например, в мРНК цистеин (Цис) может быть закодирован триплетом УГУ или УГЦ, треонин (Тре) — АЦУ, АЦЦ, АЦА или АЦГ. Некоторые аминокислоты, например лейцин (Лей), кодируются шестью различными триплетами, в то же время метионину (Мет) и триптофану (Трп) соответствует только по одному кодону (проверьте по таблице генетического кода).

4. Код не перекрывается — один и тот же нуклеотид не может одновременно входить в состав двух соседних триплетов.

5. Код непрерывен. В полинуклеотидной цепи нуклеотиды располагаются непрерывно и соседние триплеты ничем не отделены друг от друга. Это значит, что фактически деление на триплеты условно — все зависит от того, с какого именно нуклеотида начинается их считывание. Поэтому в клетках считывание информации, содержащейся в генах, всегда начинается со строго определенного нуклеотида.

Если в составе гена происходит изменение количества нуклеотидов (их выпадение или вставка) на число, не кратное трем, наблюдается так называемый сдвиг рамки считывания (рис. 23.1). Это приводит к существенному изменению последовательности аминокислот в белке, который кодируется измененным геном. В некоторых случаях сдвиг рамки считывания приводит к возникновению стоп-кодонов, из-за чего синтез белка обрывается. 

*Суть происходящего при сдвиге рамки считывания можно понять на следующем примере. Прочитайте предложение, составленное из трехбуквенных слов (аналогично триплетам):

ЖИЛ БЫЛ КОТ ТИХ БЫЛ СЕР МИЛ МНЕ ТОТ КОТ.

В этом предложении заключен определенный смысл, понять который можно и без знаков препинания. Выпадение одной буквы аналогично выпадению одного нуклеотида. Оно приводит к изменению порядка считывания и потере смысла:

ЖЛБ ЫЛК ОТТ ИХБ ЫЛС ЕРМ ИЛМ НЕТ ОТК ОТ — выпадение второй буквы.

То же самое произошло бы и после вставки лишней буквы. В случае замены одной буквы либо при изменении их количества на три смысл предложения меняется не столь значительно. Например:

ЖИВ БЫЛ КОТ ТИХ БЫЛ СЕР МИЛ МНЕ ТОТ КОТ — замена третьей буквы;

БЫЛ КОТ ТИХ БЫЛ СЕР МИЛ МНЕ ТОТ КОТ — выпадение первых трех букв.

Однако смысл предложения (в нашей аналогии — первичная структура белка) во многом зависит от положения измененных букв (нуклеотидов). Так, смысл может существенно исказиться:

ЖИЛ БОТ ТИХ БЫЛ СЕР МИЛ МНЕ ТОТ КОТ — выпадение пятой, шестой и седьмой букв.

Аналогичная ситуация наблюдается и с белками. В зависимости от расположения замененной (утраченной, добавленной) аминокислоты молекула белка может сохранить пространственную конфигурацию и функции, частично изменить их или же полностью утратить свои исходные характеристики.*

Как уже отмечалось, правильное считывание генетической информации обеспечивается только тогда, когда оно начинается со строго определенной позиции. У эукариот стартовым кодоном молекулы мРНК является триплет АУГ. Именно с него и начинается считывание.

6. Код универсален — у всех живых организмов одним и тем же триплетам соответствуют одни и те же аминокислоты. Иными словами, у всех организмов генетический код расшифровывается одинаково (за редким исключением). Это свидетельствует о единстве происхождения живых организмов.

*Некоторые вариации генетического кода обнаружены у бактерий, инфузорий, дрожжей, в коде митохондриальной ДНК и т. д. Например, у бактерий триплет мРНК ГУГ может играть роль стартового кодона, а у эукариот он предназначен только для кодирования аминокислоты валин. В митохондриях млекопитающих триплет УГА кодирует триптофан, в то время как в матричной РНК, синтезированной в ядре клетки, он служит стоп-кодоном. И наоборот, в коде митохондрий триплеты АГА и АГГ являются сигналами окончания синтеза белка, а в «основной версии» генетического кода им соответствует аминокислота аргинин.*