Меню Сайта

Календарь






Теги

Категории
Медицина , Наука Ппрочее [22]

Чат

Советы недели

Опрос

Оцените Мой Сайт

Всего ответов: 16

Лидеры

Наши кнопки





Статистика
Рейтинг@Mail.ru
Онлайн всего: 1
Гостей: 1
Пользователей: 0

Главная » Статьи » Наука » Медицина , Наука Ппрочее

ГЕНЫ — ОСНОВНОЙ ТЕКСТ ГЕНОМА

Конечно же, в секвенированном ДНКовом тексте генома человека в первую очередь внимание ученых было обращено на участки, кодирующие белки, то есть на белок-кодирующие гены. Отметим, что первый ген человека — ген, кодирующий белок со сложным названием хорионный соматомаммотропин, — был секвенирован еще в 1977 году. А что же выяснилось в результате секвенирования всего генома человека? Оказалось, что в геноме человека нуклеотидные последовательности, кодирующие белки (экзоны), занимают лишь 1,1–1,4% от длины всех молекул ДНК. Но именно эти мизерные проценты ДНКового текста человека и стали объектом пристального внимания. Для сравнения отметим, что у червя C. elegans доля таких последовательностей в геноме составляет 27%, у мухи дрозофилы — 20%, у дрожжей — 70%, а у бактерий — 86%. То есть, просматривается закономерность: по мере усложнения организмов доля кодирующих белки участков ДНК в их геномах резко падает.

Генам при их открытии, как людям при рождении, сразу же присваивают различные имена. Без этого невозможно было бы разобраться, о чем идет речь и что изучают разные ученые в каждом конкретном случае. Правда, путаница в этом вопросе пока еще существует, особенно если ген одновременно открывают в разных лабораториях и при этом называют по-разному. Известно, что в лингвистике существует целая наука об именах людей — ономастика. Эта наука давно уже отметила влияние разных факторов и причин на формирование имен, связь с историей, географией и многими другими науками, а также процессами, протекающими в обществе. Так, в постреволюционные годы появились имена Вилен (В. И. Ленин), Даздраперма (Да здравствует первое мая), при Б. Ельцине появились Борели, а при В. Путине уже официально зарегистрированы такие имена, как Путилла, Владпут и даже Затерсор (замочим террористов в сортире).

Конечно, и на имена, присваиваемые генам, также влияют разные обстоятельства. Но вообще-то этот процесс довольно стихийный. Нередко наименование гена связывают с выполняемой им функцией (например, дистрофин — ген, мутации в котором ответственны за дистрофию мышц). В других случаях используют особенности структуры гена (например, присутствие специфической последовательности в гене, называемой homeo box, автоматически приводит к имени Hox). Иногда авторы напрягают свою фантазию, и тогда появляются такие экзотические имена, как харакири (ген-самоубийца),икарус, vang (по имени художника ван Гога) или indy (первые буквы от слов I'm not dead yet — я еще не умер — название для гена, который влияет на продолжительность жизни). Ген SHH назван в честь популярной видеоигры Соника Хеджхога, (англ. hedgehog — ежик). Некоторые гены называются именами богов (например, гефестин — от греческого бога огня и кузнечного дела Гефеста). На практике генетики используют сокращенные обозначения генов, состоящие обычно из 3–5 латинских букв. Поскольку функции многих генов еще не известны, а удается только определить, что какая-то конкретная область генома человека способна теоретически кодировать белок, то часто пока еще перед названиями генов появляется слово «гипотетический».

Анализ генома человека позволил на конец 2002 года обнаружить порядка 30 000–40 000 генов, кодирующих белки. Эти гены сильно отличаются друг от друга по размерам. Подсчитано, что средняя длина гена у человека составляет около 27 тыс. п. н. Такой усредненный ген содержит 9 экзонов (средний размер каждого около 150 п. н.) и 8 интронов (средний размер каждого чуть меньше 3400 п.н.). Но это лишь средние значения. Самые короткие гены содержат всего два десятка букв-нуклеотидов, например, гены эндорфинов — полипептидов, вызывающих ощущение удовольствия. В то же время самый длинный ген, кодирующий один из белков мышц, — миодистрофин содержит 2,4 млн. п. н.

Кроме того, гены не равномерно распределены между разными хромосомами. При средней плотности один ген на 100 т. п. н. генома их содержание в хромосоме 19 составляет около 2 на 100 т. п.н., а в хромосомах 2, 13 и Y-хромосоме — от 0,15 до 0,7. Если сравнить плотность генов с плотностью расселения людей, то Y-хромосома напоминает нашу Сибирь, а хромосома 19 — Европейскую часть России. Для сравнения: в геноме бактерий содержится свыше 1000 генов на 1,0 млн. п. н., у дрожжей около 450 генов на 1,0 млн. п. н., а у червя C. elegans — около 200. Следовательно, плотность расположения генов на единицу длины генома заметно падает по мере эволюционного усложнения организмов.

«Жи, ши — пиши через и»

После секвенирования генома человека и ряда других организмов был проведен детальный компьютерный анализ нуклеотидных последовательностей. Подсчитано, например, сколько в ДНК может идти подряд букв А, или как часто Г встречается после Ц. И тут выяснилось, что в генах эти сочетания подчиняются определенным правилам, тогда как в промежутках между генами, там, где ничего существенного в ДНК не записано, частота сочетаний разных нуклеотидов близка к случайной. Где много генов, там много букв Г и Ц, а где генов нет, там много букв А и Т. Здесь опять можно провести параллель с обычным текстом. По правилам грамматики русского языка, которые мы учили в школе, «жи, ши — пиши через и», в словах после букв ж и ш буква ы не встречается. Нечто подобное характерно и для генетических текстов — в кодирующих участках некоторые сочетания нуклеотидов практически не встречаются, а распределение других сочетаний сильно отличается от случайного. Это был один из первых, но далеко не единственный результат анализа ДНК.

Знаки препинания (Генетическая пунктуация)

Как в письменном языке пунктуация (точки, запятые, тире и т.д.) используется для членения и графической организации текста, так и в ДНКовом тексте существуют всевозможные знаки-сигналы, обозначающие границы отдельных функциональных элементов. Без таких сигналов генетическая информация не может быть правильно считана с носителя. Классический пример из лингвистики — предложение «Убить нельзя помиловать». Если не поставить запятую, то остается непонятным, то ли убить, то ли помиловать. Так и в гене. Знаки препинания, в отличие от генетического кода, не так универсальны в живом мире. Часть из них у низших организмов (прокариот) существенно отличаются по сравнению с высшими (эукариотами), включая человека.

Вот как выглядит, например, одна из страниц ДНКового текста, содержащаяся в томе (хромосоме) 11 человека (рис. 17).

Рис. 17. Страница Энциклопедии человека, на которой записана последовательность нуклеотидов ДНК человека, кодирующая белок альфа-интерферон. Ген интерферона выделен курсивом. Подчеркнут участок, кодирующий белок, состоящий из 188 аминокислот. Жирным шрифтом выделены знаки пунктуации в этом гене, обеспечивающие его правильную транскрипцию с образованием мРНК и последующую правильную трансляцию этой мРНК

Глядя на этот рисунок, даже специалисту сразу трудно что-то понять. Однако простая компьютерная программа быстро позволяет найти здесь участок, кодирующий белок интерферон. Это осуществляется в результате того, что в генах имеются специальные сигналы-ярлычки, которые можно рассматривать как знаки препинания в ДНКовом тексте. И компьютер способен их различить. Рассмотрим главные их них.

Так, в генах человека, как и у других высших организмов, имеются специальные последовательности-сигналы, которые определяют начало и конец процесса транскрипции, то есть синтеза мРНК.

Фермент, называемый РНК-полимеразой, узнает эти сигналы и осуществляет синтез «правильных» молекул мРНК (со строго запрограммированными в геноме концами). Одним из таких знаков препинания в ДНКовом тексте, отмечающим начало процесса транскрипции, служит короткая последовательность нуклеотидов: ТАТА (как пример, см. рис. 17).

Для процесса трансляции, то есть синтеза белка на мРНК, также имеются свои специальные знаки препинания. Таковыми являются отдельные тройки нуклеотидов (триплеты). На рис. 17 они выделены жирным шрифтом. Место, с которого начинается кодирование белка, — старт-сигнал — триплет АУТ. Далее следуют триплеты, которые кодируют аминокислоты в белке. А в конце текста имеется специальный стоп-сигнал (триплет УГА).

Но это еще не все. ДНК иногда претерпевает некоторые химические изменения. Известна такая химическая модификация ДНК, как метилирование, которая происходит строго по динуклеотидам-сигналам, представляющим собой пару нуклеотидов, в которой первым идет Г, а за ним Ц. Наконец, важными сигналами в генах являются участки, определяющие такой важный процесс, как сплайсинг, который происходит уже после образования РНК на гене. Об этом и пойдет речь дальше.

Гены построены из кусков

Успехи в изучении генома человека, а еще ранее — проведенный анализ отдельных генов других высших организмов, привели к ряду принципиально новых и совершенно неожиданных для генетиков результатов в отношении устройства генов, особенно тех, которые кодируют белки. Со времени появления центральной догмы молекулярной биологии думали, что непрерывная линейная последовательность нуклеотидов в ДНК с помощью триплетов нуклеотидов кодирует непрерывную последовательность нуклеотидов в мРНК, а последняя как посредник передает эту информацию на рибосомы, которые, считывая ее, осуществляют синтез линейных молекул белков. Это соответствовало ситуации, которую первоначально наблюдали при изучении генов у бактерий. Однако у высших организмов, включая человека, (и даже у некоторых низших) картина оказалась более сложной.

Когда сравнивали мРНК и соответствующий белок, то действительно обнаруживали непрерывность их нуклеотидных и аминокислотных последовательностей. То же наблюдали и при сопоставлении последовательностей аминокислот в белках и нуклеотидов в геномах вирусов. Однако с появлением возможности секвенировать протяженные участки ДНК (т. е. непосредственно генов) как у некоторых вирусов, так и у высших организмов получили совершенно неожиданные результаты. Внутри нуклеотидных последовательностей ДНК, кодирующих белок, были обнаружены какие-то иные, ничего не кодирующие участки. Чудеса, да и только! В чем же дело? Оказалось, что многие гены «расчленены» на отдельные куски. Одни из этих кусков, как и положено, кодируют белок (их назвали экзонами), а другие никакие белки кодировать не способны (их назвали интронами) и расположены между экзонами. Таким образом, в гене кодирующие и не кодирующие участки перемежаются друг с другом (рис. 18). Так устроено большинство белок-кодирующих генов. Хотя имеются и исключения. В этих случаях говорят, что ген устроен из одного экзона и интронов не содержит.

Рис. 18. Схематическое изображение экзон-интронного строения некоторых генов человека. Экзоны — прямоугольнники, интроны — линии между прямоугольниками. Темные прямоугольники — участки генов, кодирующие белок, белые прямоугольники в первом и последнем экзонах — специальные участки гена, кодирующие мРНК, но не кодирующие белок

Такое разорванное (экзон-интронное) строение оказалось характерным для подавляющего большинства (хотя и не для всех) генов человека. Вместе с тем у большинства простейших организмов интроны не обнаружены.

Размеры интронов часто значительно превышают размеры экзонов, что существенно увеличивает общую длину нуклеотидных последовательностей ДНК, образующих ген. При этом в геноме человека интроны в целом существенно длиннее, чем у других организмов.

Каким же образом разорванный ДНКовый текст реализуется в клетках в виде неразорванного РНКового, а затем белкового? Выяснилось, что первоначально при транскрипции гена синтезируется большой РНК-предшественник, копия ДНКового текста (с экзонами и интронами вместе). Далее в результате работы специфических ферментов происходит нарезание РНК-предшественника на куски. Те из них, которые ничего не кодируют (интроны), отбрасываются, а кодирующие куски (экзоны) соединяются между собой, обычно в том же порядке, как они располагались исходно в ДНК. В результате формируется зрелая молекула мРНК. Этот сложный процесс и получил название сплайсинга (рис. 19).

Рис. 19. Образование молекул мРНК на РНК-предшественнике в результате сплайсинга. Из РНК-предшественника вырезаются фрагменты, синтезированные с интронных последовательностей гена, а участки, синтезированные на экзонах, соединяются друг с другом, что в конечном итоге приводит к формированию зрелой функционально активной мРНК

В интронах содержатся особые сигналы, которые узнаются специальными ферментами, осуществляющими сплайсинг. Так, в 98% случаев интроны начинаются с динуклеотида ГТ, а заканчиваются динуклеотидом АГ. Они-то и служат главными сигналами для правильного осуществления сплайсинга.

Во всем этом и состоит основное ноу-хау в организации генов человека и других эукариотических генов. «Лоскутное» устройство большинства генов — чрезвычайно важное эволюционное приобретение высших организмов. За счет сплайсинга в РНК может происходить соединение не только между соседними экзонными нуклеотидными последовательностями, но и между другими, отстоящими порой в гене на значительном расстоянии. Это называютальтернативным сплайсингом (рис. 20). В геноме человека альтернативный сплайсинг характерен для более трети генов. Этому можно привести следующую аналогию: из слова «администрация» за счет удаления отдельных букв и слогов можно образовать множество совершенно разных по смыслу слов: ад, министр, амнистия, астра, нация. Существование множества альтернативных вариантов сплайсинга в конечном итоге обеспечивает появление более чем одного белка при экспрессии одного единственного гена. В частности, на гене белка тропонина человека, содержащем 18 экзонов, за счет альтернативного сплайсинга может образовываться 64 различных продукта! Сейчас подсчитано, что в среднем один ген у человека способен кодировать около 3-х разных белков. Альтернативный сплайсинг зависит от множества внутриклеточных и внешних факторов, в том числе, как показано недавно, даже от вирусного воздействия на клетку.

Рис. 20. Схематическое изображение альтернативного сплайсинга. Прямоугольниками разного оттенка обозначены экзоны, черными линиями — интроны. Показаны лишь две из множества возможных мРНК, образующихся на одном гене

Экзон-интронное строение генов дало принципиально новую возможность для эволюции генов — комбинировать отдельные элементы при формировании генов. В результате этого в эволюции возникали новые гены, кодирующие разные белки за счет разного сочетания экзонов одного и того же гена. То есть из уже готовых «слов» составляются совершенно разные «предложения». И такой подход, используемый природой, оказался весьма продуктивным.

Следует отметить, что и в зрелой мРНК, которая образуется уже после удаления из первичного транскрипта интронных нуклеотидных последовательностей, также не все участки кодируют белок. Однако, в отличие от интронов, такие последовательности нуклеотидов расположены в начале и в конце молекулы (см. рис. 18). Их размеры также существенно различаются.

Так, в разных мРНК человека некодирующая область, расположенная в начале молекулы, имеет длину от 2800 до 18 нуклеотидов (в среднем 200 нуклеотидов), а та, которая расположена в конце, составляет от 8500 до 20 нуклеотидов (в среднем 1000 нуклеотидов). Эти некодирующие белок области гена очень важны для нормального функционирования мРНК, ее трансляции, стабильности и локализации в клетке. Как уже говорилось, на одном гене за счет альтернативного сплайсинга может образовываться несколько мРНК. Следует подчеркнуть, что и на одной уже сформировавшейся мРНК могут образовываться разные белки. Это происходит за счет наличия в 50% мРНК человека не одного, а двух АУГ-кодонов, являющихся старт-сигналами для синтеза белка на мРНК. За счет этого, в разных ситуациях клетка может начать синтез белка с разных мест мРНК, в результате чего образуются разные по длине, а порой и по своим свойствам, белки. Опять же пример из лингвистики. Если читать текст не с первой, а со второй буквы, смысл зачастую совершенно меняется (сравните: удочка и дочка).

В связи со всем этим понятно, что классическая формула генетиков «один ген — один белок», предложенная лауреатами Нобелевской премии Джоржем Бидлом и Эдуардом Татумом, оказывается в реальности справедливой лишь для небольшой группы генов, а многие гены (возможно, большинство) кодируют семейства родственных, но существенно отличающихся белков, то есть нередко действует принцип «один ген — много белков». За счет этого в геноме осуществляется принцип экономии генетического материала (компактная запись) и достигается большой набор генных продуктов — белков — на относительно небольшом числе генов.

В таблице 3 приведена общая характеристика белок-кодирующих генов, выявленных в результате секвенирования генома человека.

Таблица 3. Усредненные данные о структуре белок-кодирующих генов генома человека

В реальности размеры разных генов, а также их экзонов и интронов сильно отличаются. И основной вклад в эту вариабельность вносят интроны. Уже говорилось, что максимальный по размерам ген дистрофина занимает в геноме человека 2,4 млн. п. н. Подавляющая часть занята именно интронами (их средний размер составляет несколько десятков тысяч п. н.). Наибольшую кодирующую последовательность в геноме человека имеет ген по имени титин. Его размер равен около 81000 п. н. Этот ген — чемпион и по числу интронов (178 штук!), и по длине единичного экзона (17106 п. н.).

Важно отметить, что разбивка генов на отдельные экзоны неслучайна. Индивидуальный экзон часто кодирует не просто какую-то часть белковой молекулы, а определенный фрагмент белка, выполняющий в целом белке отдельную функцию. Такой отдельный структурно-функциональный фрагмент, входящий в состав целого белка, называют доменом.

Категория: Медицина , Наука Ппрочее | Добавил: Nikta (16.06.2015)
Просмотров: 526 | Рейтинг: 0.0/0
Всего комментариев: 0
avatar

Суббота, 27.04.2024, 05:51
Форма входа

Ваш профиль
Привет: Гость

Часы

Карта

Радио

Друзья Сайта
Темный мир
Numen.ru Высшая Школа Серой Магии

Поиск

Наш Предсказатель
Скрипт выводит время до события (праздника).

лунный календарь
Фазы Луны на RedDay.ru (Москва)