Открытие генетического кода



Генети́ческий код — свойственный всем живым организмам способ кодирования аминокислотной последовательности белков при помощи последовательности нуклеотидов. Белки практически всех живых организмов построены из аминокислот всего 20 видов. Эти аминокислоты называют каноническими. Каждый белок представляет собой цепочку или несколько цепочек аминокислот, соединённых в строго определённой последовательности. Эта последовательность определяет строение белка, а следовательно все его биологические свойства.

Реализация генетической информации в живых клетках (то есть синтез белка, кодируемого геном) осуществляется при помощи двух матричных процессов:транскрипции (то есть синтеза мРНК на матрице ДНК) и трансляции генетического кода в аминокислотную последовательность (синтез полипептидной цепи на мРНК). Для кодирования 20 аминокислот, а также сигнала «стоп», означающего конец белковой последовательности, достаточно трёх последовательных нуклеотидов. Набор из трёх нуклеотидов называется триплетом.

В ДНК используется четыре азотистых основания — аденин (А), гуанин (G), цитозин (С), тимин (T), которые в русскоязычной литературе обозначаются буквами А, Г, Ц и Т. Эти буквы составляют алфавитгенетического кода. В РНК используются те же нуклеотиды, за исключением нуклеотида, содержащего тимин, который заменён похожим нуклеотидом, содержащим урацил, который обозначается буквойU (У в русскоязычной литературе). В молекулах ДНК и РНК нуклеотиды выстраиваются в цепочки и, таким образом, получаются последовательности генетических букв.

Знания о белках и нуклеиновых кислотах накапливались в течение длительного времени. К середине XX века их стало достаточно для того, чтобы выдвинуть первые идеи о природе генетического кода. К1953 году было известно, что отдельные белки имеют уникальные аминокислотные последовательности и что, по-видимому, не существует никаких ограничений на порядок аминокислот в полипептиде[1]. Имелись данные о том, что белки состоят примерно из 20—23 различных аминокислот, однако списки различались у разных авторов. В генетике была сформирована концепция «один ген — один фермент» (более точно «один ген — один полипептид»), также было установлено, что гены это ДНК, а не белки.

В 1953 году Уотсон и Крик опубликовали две работы: в первой говорилось о вторичной структуре ДНК[3], а во второй — о возможном механизме копирования ДНК путём матричного синтеза. В последней работе, они указали на то, что определённая последовательность оснований является кодом, который несёт генетическую информацию. Теперь предстояло решить вопрос о том, как эта последовательность оснований определяет последовательность аминокислот в белках.

Хотя некоторые предположения о механизме кодирования высказывались и раньше, первым кто предложил абстрактную гипотезу кодирования, а также способ её проверки, был советский и американский физик-теоретик Георгий (Джордж) Гамов. В 1954 году Гамов опубликовал свою работу, в которой предложил в качестве механизма кодирования установление соответствия между боковыми цепями аминокислот и ромбовидными «дырами», образованными четырьмя нуклеотидами ДНК. Позднее этот код был назван ромбическим или бубновым. Исходя из своей модели Гамов предположил, что код может быть триплетным. Несмотря на все очевидные недочёты этой гипотезы (например, идея о том, что структура белка напрямую кодируется ДНК) она стала первой среди многих более и менее абстрактных гипотез о природе кода. Гамов был первым, кто представил проблему кодирования не как биохимическую, а просто как задачу перевода из четырёхзначной системы в двадцатизначную.

За несколько последующих лет было предложено большое количество разных моделей. Все предложенные коды можно разделить на две категории: перекрывающиеся (один нуклеотид входит в состав более чем одного кодона) и неперекрывающиеся. К перекрывающимся кодам относятся треугольный, мажорно-минорный и последовательный коды Гамова с коллегами. По мере накопления данных об аминокислотных последовательностях белков, стало ясно, что порядок аминокислот в них может быть любым, поэтому нужно отдавать предпочтение неперекрывающимся кодам. Наиболее известными неперекрывающимися кодами являются комбинационный код Гамова и Ичаса и «код без запятых» Крика, Гриффита и Оргела. Согласно комбинационному коду аминокислоты кодируются триплетами нуклеотидов, при этом значение имеет не порядок нуклеотидов в триплете, а его состав (например, триплеты ТТА, ТАТ и АТТ кодируют одну и ту же аминокислоту). «Код без запятых» даёт объяснение тому, как выбирается рамка считывания. Согласно этой модели, некоторые триплеты имеют смысл (соответствуют аминокислотам), а некоторые — нет. При этом код устроен таким образом, что если расположить любые значащие триплеты друг за другом, то триплеты в другой рамке считывания будут бессмысленными. Крик с соавторами показали, что можно подобрать триплеты, удовлетворяющие этим требованиям, и что их ровно 20. Несмотря на то что сами авторы сомневались в обоснованности этой модели, она получила признание и господствовала в течение следующих пяти лет.

Тем не менее в начале 60-х годов XX века новые данные обнаружили несостоятельность гипотезы «кода без запятых». Тогда эксперименты показали, что кодоны, считавшиеся Криком бессмысленными, могут провоцировать белковый синтез в пробирке, и к 1965 году был установлен смысл всех 64 триплетов. Оказалось, что некоторые кодоны просто-напросто избыточны, то есть целый ряд аминокислот кодируется двумя, четырьмя или даже шестью триплетами.


Дата добавления: 2016-01-05; просмотров: 96; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!