Молекулярные сравнения
Чего не знал, не мог знать, Дарвин, что сравнительные свидетельства становится даже более убедительным, когда мы включаем молекулярную генетику, в дополнение к анатомическим сравнениям, имевшимся в его распоряжении.
Так же, как скелет позвоночного неизменен для всех позвоночных, в то время как отдельные кости отличаются, и так же, как экзоскелет ракообразного неизменен для всех ракообразных, в то время как отдельные «трубки» варьируются, так же и код ДНК неизменен для всех живых существ, в то время как сами отдельные гены варьируются.
Это — действительно поразительный факт, который показывает яснее чем что-либо еще, что все живые существа происходят от одного предка.
Не только сам генетический код, но и вся генно/протеиновая система для поддержания жизни, с которой мы имели дело в Главе 8, одна и та же во всех животных, растениях, грибах, бактериях, археях и вирусах.
Изменяется то, что написано кодом, не сам код.
И когда мы сравниваем то, что написано кодом — реальные генетические последовательности всех этих различных существ — мы обнаруживаем своего рода иерархическое дерево подобий.
Мы обнаруживаем одно и то же генеалогическое дерево — хотя намного более тщательно и убедительно детализованное — как мы делали со скелетом позвоночного, скелетом ракообразного, и, на самом деле, всей структурой анатомических подобий во всех царствах живого мира.
Если мы хотим высчитать, насколько близко связана любая пара видов — скажем, насколько близко еж к обезьяне — идеально было бы рассмотреть полные молекулярные тексты каждого гена обоих видов и сравнить до мельчайших подробностей, как ученый-библеист мог бы сравнить два свитка или фрагмента «Книги Пророка Исайи».
Но это отнимает много времени и дорого.
Проект «Геном человека» занял приблизительно десять лет, что соответствует многим человеко-столетиям.
Хотя сейчас можно было бы достигнуть того же результата за долю того времени, это все еще будет большое и дорогостоящее предприятие, каким был бы и проект «Геном ежа».
Как посадка на Луну «Аполлона» и как Большой Адронный Коллайдер (который был только что запущен в Женеве, как раз когда я пишу — гигантский размах этих международных усилий растрогал меня до слез при посещении), полная расшифровка человеческого генома — одно из тех достижений, которое заставляет меня гордиться, что я человек.
Я рад, что теперь успешно завершен проект «Геном шимпанзе», и аналогично для различных других видов.
Если существующий темп прогресса продолжится (см. «Закон Ходжкика» ниже), то скоро станет экономически осуществимо секвенировать геном каждой пары видов, чью близость родства мы бы захотели измерить.
Пока, однако, по большей части мы должны прибегать к выборочному обследованию определенных частей их геномов, и оно работает вполне прилично.
Мы можем брать образцы нескольких выбранных генов (или белков, последовательности которых непосредственно транслированы с генов) и сравнивать их среди разных видов.
Я подойду к этому через мгновение.
Но есть другие способы взять своего рода грубую, автоматическую пробу, и технологии, чтобы это делать доступны уже более продолжительное время.
Ранний метод, работающий удивительно хорошо, использует иммунную систему кроликов (фактически можно использовать любое животное, какое Вам нравится, но кролики замечательно справляются с этой работой).
Как часть естественной защиты тела против болезнетворных микроорганизмов, иммунная система кролика производит антитела против любого инородного белка, поступающего в кровоток.
Так же, как Вы могли бы сказать, что у меня был коклюш, глядя на антитела в моей крови, так же Вы можете сказать, чему подвергался кролик в прошлом, глядя на его иммунный ответ в настоящее время.
Нынешние антитела в кролике составляют историю естественных потрясений, которую наследует его плоть — включая искусственно вводившиеся белки.
Если Вы введете, скажем, белок шимпанзе в кролика, то антитела, которые кролик произведет, впоследствии атакуют тот же самый белок, если он будет введен снова.
Но предположим, что Ваша вторая инъекция содержит эквивалентный белок, не шимпанзе, а гориллы? Кролик, предварительно подвергнутый белку шимпанзе, будет частично вооружен против версии гориллы, но реакция будет более слабой.
И он также будет вооружен против версии белка кенгуру, но реакция будет еще более слабой, учитывая, что кенгуру связан намного менее близким родством с подготовившим его шимпанзе, чем горилла.
Сила иммунного ответа кролика на последующую инъекцию белка является мерой подобия этого белка с оригиналом, которому был первоначально подвергнут кролик.
Именно этим методом, используя кроликов, Винсент Сарич и Аллан Уилсон из Калифорнийского Университета в Беркли продемонстрировали в 1960-ых, что люди и шимпанзе связаны намного более близким родством друг с другом, чем кто-либо ранее себе представлял.
Есть также методы, которые используют сами гены, непосредственно сравнивая их среди видов, вместо того чтобы сравнить белки, которые они кодируют.
Один из самых старых и самый эффективный из этих методов называют гибридизацией ДНК.
Гибридизация ДНК обычно стоит за теми высказываниями, которые можно часто услышать, типа: «У людей и шимпанзе общие 98 процентов их генов».
Между тем, есть некоторая путаница, как раз относительно того, что имеется в виду под числами процентов, такими как эти.
Девяносто восемь процентов чего идентично? Точное число зависит от того, насколько большими единицами мы считаем.
Простая аналогия ясно дает это понять, и она делает это интересным способом, поскольку различия между аналогией и реальной вещью являются столь же показательными, как и сходства.
Предположим, что у нас есть два варианта одной и той же книги, и мы хотим их сравнить.
Скажем, это «Книга пророка Даниила», и мы хотим сравнить каноническую версию с древним свитком, который был только что обнаружен в пещере на берегу Мертвого моря.
Сколько процентов глав двух книг идентично? Вероятно, ноль, для этого нам требуется только одно несоответствие где-нибудь во всей главе, чтобы сказать, что эти две не идентичны.
Какой процент их предложений идентичен? Процент теперь будет намного выше.
Еще выше будет процент идентичных слов, потому что у слов меньше букв, чем у предложений — меньше возможностей разрушить идентичность.
Но подобие слова все еще нарушается, если любая из букв в слове отличается.
Поэтому, если Вы выровняете рядом два текста и сравните их буква за буквой, процент идентичных букв будет еще выше, чем процент идентичных слов.
Таким образом, оценка типа «98 процентов общего» ничего не означает, если мы не определим размер единиц, которые мы сравниваем.
Считаем ли мы главы, слова, буквы или что? И то же самое верно, когда мы сравниваем ДНК двух видов.
Если сравнивать целые хромосомы, процент — ноль, потому что требуется лишь одно крошечное различие где-нибудь на протяжении хромосом, чтобы определить хромосомы как различные.
Часто упоминаемое число приблизительно 98 процентов общего генетического материала людей и шимпанзе фактически не относится ни к числу хромосом, ни к числу целых генов, а к числу «букв» ДНК (технически пар оснований), идентичных друг другу в соответствующих генах человека и шимпанзе.
Но есть подвох.
Если Вы производите выравнивание наивно, то недостающая буква (или добавленная), в отличие от ошибочной буквы, приведет к несоответствию всех последующих букв, потому что все они тогда будут сдвинуты на шаг, опережая одна другую (пока не будет ошибки в противоположном направлении, чтобы снова вернуть их к синхронности).
Несомненно, несправедливо позволять оценке несоответствий быть преувеличенной таким образом.
Глаз ученого, просматривая два свитка «Книги пророка Даниила», автоматически справляется с этим трудно переводимым в цифры способом.
Как мы можем сделать это с ДНК? Здесь мы оставим нашу аналогию с книгами и свитками и перейдем прямо к самой вещи, потому что оказывается саму вещь — ДНК — легче понять чем аналогию!
Если Вы постепенно нагреваете ДНК, наступает момент — где-то около 85 °C — когда связь между двумя нитями двойных спиралей разрывается, и две спирали разделяются.
Вы можете представить 85 °C, или неважно какую получившуюся температуру, как «точку плавления».
Если Вы позволите ей снова остыть, каждая одинарная спираль спонтанно снова соединится с другой одинарной спиралью или фрагментом одинарной спирали, везде, где найдет фрагмент, с которым она может соединиться, используя обычные для двойной спирали правила комплементарности пар оснований.
Можно подумать, что это всегда будет партнер, от которого она только что отделилась и которому, конечно, она полностью соответствует.
Действительно так может быть, но обычно все не столь гладко.
Фрагменты ДНК найдут другие фрагменты, с которыми они могут соединиться, и это обычно не будут в точности их первоначальные партнеры.
И действительно, если Вы добавите разделенные фрагменты ДНК другого вида, фрагменты одинарных нитей вполне способны соединиться с фрагментами одинарных нитей неправильного вида, точно так же, как они соединятся с одиночными нитями правильного вида.
Почему бы и нет? Это замечательное следствие переворота в молекулярной биологии Крика и Уотсона, что ДНК — всего лишь ДНК.
Она не «заботится» о том, является ли она человеческой ДНК, ДНК шимпанзе или ДНК яблока.
Фрагменты охотно соединяются с комплиментарными фрагментами везде, где они их находят.
Однако прочность связи не всегда одинакова.
Однонитевые куски ДНК связываются сильнее с соответствующей одинарной нитью, чем с менее подобными одинарными нитями.
Причина в том, что больше «букв» ДНК («оснований» Уотсона и Крика) оказываются напротив партнеров, с которыми они не могут соединиться.
Связь между нитями поэтому ослаблена — как у застежки— молнии с недостающими некоторыми зубьями.
Как нам измерить эту прочность связи, после того, как фрагменты от различных видов нашли друг друга и объединились? До смешного простым методом.
Мы определяем «точку плавления» связей.
Помните, я говорил, что точка плавления двухспиральной ДНК около 85 °C.
Это верно для нормальный, должным образом согласующейся двухспиральной ДНК, как, например, когда нить человеческой ДНК «отплавлена» от комплиментарной нити человеческой ДНК.
Но когда связь слабее — как например, когда человеческая нить соединяется с нитью шимпанзе — достаточно немного более низкой температуры, чтобы разорвать эту связь.
И когда человеческая ДНК связывается с ДНК более дальнего родственника, такого как рыба или жаба, достаточно еще более низкой температуры, чтобы их разделить.
Различие между точкой плавления, когда одна нить связана к другой нитью своего собственного вида, и точкой плавления, когда она связана с нитью другого вида, является нашей мерой генетического расстояния между двумя видами.
Как практическое правило, уменьшение на каждый 1° Цельсия «точки плавления» приблизительно равноценно снижению на 1 процент количества соответствий букв ДНК (или увеличению на 1 процент числа недостающих зубьев в застежке-молнии).
В этом методе есть осложнения, в которые я не вдавался, и хитрые проблемы, для которых есть изобретательные решения.
Например, если смешать ДНК человека с ДНК шимпанзе, то большая часть фрагментированной человеческой ДНК соединится с другими фрагментами человеческой ДНК, а большая часть ДНК шимпанзе соединится со своей же.
Как отделить гибридную ДНК, чью «точку плавления» Вы действительно хотите определить, от «однородной» ДНК? Ответом является умная уловка, предусматривающая предварительную радиоактивную маркировку.
Но эти детали увели бы нас слишком далеко от нашего пути.
Суть здесь в том, что гибридизация ДНК — это техника, которая приводит ученых к цифрам, вроде 98 процентов генетического сходства между людьми и шимпанзе, и она приводит к очевидно более низким процентам, если перейти к парам животных, связанных более отдаленным родством.
Новейший метод измерения подобия между парой соответствующих генов различных видов является наиболее прямым и самым дорогим: фактически чтением последовательности букв непосредственно в генах, используя те же методы, которые применялись в проекте «геном человека».
Хотя все еще дорого сравнивать весь геном, можно получить хорошее приближение, сравнивая выборку генов, и это теперь делается все чаще.
Какой бы ни была техника, которую мы используем для измерения подобия между двумя видами, будь то антитела кролика, или точки плавления, или прямое секвенирование, следующий шаг в значительной степени одинаков.
Получив отдельное число, отображающее подобие между каждой парой видов, мы затем заносим эти числа в таблицу.
Возьмите ряд видов и напишите их названия в одном и том же порядке как во главе колонок, так и во главе строк.
Затем занесите проценты подобия в соответствующие ячейки.
Таблица будет треугольной (половиной квадрата), потому что, например, процент подобия между человеком и собакой будет таким же, как подобие между собакой и человеком.
Так, если заполнить во всей квадратной таблице каждую из этих двух половин, любая сторона диагонали зеркально отразила бы другую.
Теперь, каких результатов нам следует ожидать? Согласно эволюционной модели можно прогнозировать, что более высокая оценка будет помещена в ячейку, соединяющую человека и шимпанзе; более низкая — в ячейку, соединяющую человека и собаку.
В ячейке человека/собаки должна теоретически быть оценка, идентичная подобию в ячейке шимпанзе /собаки, потому что у людей и шимпанзе совершенно одинаковая степень родственных отношений с собаками.
Она также должна быть идентичной и ячейкам обезьяны/собаки и лемура/собаки.
Ведь люди, шимпанзе, обезьяны и лемуры, все связаны с собакой через их общего предка, древнего примата (который, вероятно, немного был похож на лемура).
Та же самая оценка должна обнаружиться в ячейках человека/кошки, шимпанзе/кошки, обезьяны/кошки и лемура/кошки, потому что кошки и собаки связаны со всеми приматами через общего предка всех хищных.
Должна быть намного более низкая оценка — в идеале одинаково низкая — во всех ячейках, объединяющих, скажем, кальмара с любым млекопитающим.
И не должно иметь значения, какое выбрано млекопитающее, так как все они одинаково отдалены от кальмара.
Таковы строгие теоретические ожидания, и нет никакой причины, почему на практике они не должны были нарушаться.
Если бы они были нарушены, то это было бы свидетельством против эволюции.
То, что происходит фактически, оказывается — в пределах статистической погрешности — именно тем, что мы должны ожидать при условии, что эволюция имела место.
Это все равно, что сказать, что, если нанести генетические расстояния между парами видов на ветви дерева, все удовлетворительно складывается.
Конечно, складывается не совсем безупречно.
Числовые расчеты в биологии редко реализуются с более чем приблизительной точностью.
Свидетельства от сравнения ДНК (или белка) может быть использовано, чтобы решить — исходя из эволюционного предположения — какие пары животных являются более близкими кузенами, чем другие.
Что превращает их в чрезвычайно сильное свидетельство эволюции — так это возможность построить дерево генетических подобий отдельно для каждого гена поочередно.
И важный результат состоит в том, что каждый ген приводит к приблизительно тому же дереву живого.
Еще раз, это именно то, что ожидалось бы, если бы Вы имели дело с истинным генеалогическим деревом.
Это не то, что ожидалось бы, если бы проектировщик оглядел весь животный мир и выискал и выбрал — или «заимствовал» — лучшие белки для работы, везде, где бы они ни находились в животном мире.
Самое раннее крупномасштабное исследование в этом направлении было проведено группой генетиков в Новой Зеландии во главе с профессором Дэвидом Пенни.
Группа Пенни взяла пять генов, которые, хотя и не идентичны у всех млекопитающих, были достаточно подобны, чтобы заслужить у всех одно и то же название.
Детали не имеют значения, но, во избежание недоразумений, эти пять генов были генами гемоглобина A, гемоглобина B (гемоглобины придают крови ее красный цвет), фибринопептида A, фибринопептида B (фибринопептиды используются в свертывании крови), и цитохрома C (который играет важную роль в клеточной биохимии).
Они выбрали одиннадцать млекопитающих для сравнения: макаку-резус, овцу, лошадь, кенгуру, крысу, кролика, собаку, свинью, человека, корову и шимпанзе.
Пенни и его коллеги размышляли статистически.
Они хотели вычислить вероятность того, что по чистой случайности две молекулы привели бы к одному и то же генеалогическому дереву, если бы эволюция не была реальностью.
Таким образом, они попытались представить себе все возможные деревья, которые могли закончиться одиннадцатью потомками.
Это удивительно большое число.
Даже если Вы ограничитесь «двоичными деревьями» (то есть деревьями с ветвями, которые разделяются только надвое — а не натрое или больше), общее количество возможных деревьев составит больше чем 34 миллиона.
Ученые терпеливо нашли каждое из этих 34 миллионов деревьев и сравнили каждое с каждым из остальных 33 999 999 деревьев.
Нет, конечно они этого не делали! Это заняло бы слишком много компьютерного времени.
Однако они разработали разумное статистическое приближение, сокращенный аналог этих титанических расчетов.
Вот как этот метод приближения работает.
Они взяли первый из тех пяти генов, скажем, гемоглобин-A (во всех случаях я использую название белка, чтобы обозначить ген, который кодирует этот белок).
Из всех тех миллионов деревьев они хотели найти наиболее «экономное» в отношении гемоглобина-A.
Экономное здесь означает «требующее предположить минимальное число эволюционных изменений».
Например, все те тысячи деревьев, предполагавших, что наиболее близкий кузен человека был кенгуру, в то время как люди и шимпанзе связаны более отдаленным родством, оказались очень неэкономными деревьями: они должны были предположить множество эволюционных изменений, чтобы привести к результату, что у кенгуру и людей был недавний общий предок.
Вердикт гемоглобину-A был в таком духе:
Достарыңызбен бөлісу: |