Курсовая работа студентки 2-го курса Гарушянц С. Тьюторы: Равчеев Д. А., Герасимова А. В



бет1/3
Дата29.06.2016
өлшемі274.5 Kb.
#165205
түріКурсовая
  1   2   3


Московский Государственный Университет им. М.В. Ломоносова

Факультет Биоинженерии и Биоинформатики



Компьютерный анализ регулона, отвечающего за биосинтез триптофана, в геномах архей

Курсовая работа студентки 2-го курса

Гарушянц С.
Тьюторы: Равчеев Д.А., Герасимова А.В.

Супервайзер: д.б.н. проф. Гельфанд М.С.

Москва, 2004


Введение
Археи представляют собой третью ветвь органического мира, отличную от эукариот и эубактерий. Расхождение архей и эукариот произошло, по всей видимости, уже после отделения эубактерий. Такие представления о возникновении данной группы связаны с тем, что по общему строению клетки, центральному метаболизму и строению транспортных систем они ближе к прокариотам, тогда как транскрипция и трансляция построены по эукариотическому типу. Так, строение РНК-полимеразы скорее напоминает эукариотическое, и, кроме того, для архебактерий показан процессинг мРНК, ранее известный только для эукариотических организмов. Некоторые особенности есть и в строении рибосом: по составу входящих в них рРНК и белков, они имеют типично бактериальное строение, но по форме скорее напоминают эукариотические (Bell and Jackson, 1998). Несмотря на то, что археи представляют собой уникальный источник биологического разнообразия, данная группа является намного менее изученной, чем бактерии и эукариоты. Это связано как с недавним ее открытием, так и с различными трудностями, возникающими при экспериментальном изучении архебактерий. К настоящему времени подробно изучены лишь механизмы метаногенеза, тогда как общий метаболизм практически не исследован.

Исследования архей биоинформатическими методами также ограничены лишь несколькими работами, например, предсказанием гена для шикимат-киназы, фермента, задействованного в синтезе ароматических соединений (Daugherty et al., 2001). В другой работе (Gelfand et al., 2000) был проведен анализ некоторых регуляторных систем архей методами сравнительной геномики. Так, была изучена регуляция теплового шока, фиксации азота и синтеза триптофана, пуриновых нуклеотидов. В связи с ростом числа полных геномных последовательностей, было решено провести дальнейшее исследование синтеза триптофана в различных архебактериях.

Регуляция синтеза триптофана ранее была подробно изучена у гамма-протеобактерий и в грам-положительных бактериях (Panina et al., 2001; Panina et al.,2003).

В случае гамма-протеобактерий была показана регуляция данного метаболического пути на нескольких уровнях. Регуляторная система включает два регулятора транскрипции, TyrR и TrpR, аттенюационные механизмы и аллостерическую регуляцию по принципу обратной связи. У грам-положительных бактерий наряду с регуляцией транскрипции присутствует также регуляция по типу аттенюации: за счет РНК-связывающего белка TRAP, а также за счет специфической последовательности в лидерной области мРНК, так называемого Т-бокса.

Описанные статьи представляют интерес, поскольку путь синтеза триптофана (Рис. 1) практически не отличается у бактерий и архей, и в нем участвуют гомологичные белки.

Как уже говорилось, предпринимались попытки изучения регуляции синтеза триптофана и в архебактериях. Так, в геноме Methanobacter thermautotrophicus в регуляторных областях генов синтеза триптофана были обнаружены довольно консервативные потенциальные сигналы (Gelfand et al., 2000). Сигнал в данном случае представляет собой тандемный повтор, единицей которого является палиндром длиной 6 нуклеотидов с консенсусом TGTACA. Расстояние между палиндромными последовательностями в пределах одного сайта составляет от 3 до 5 нуклеотидов.

Сайты такого вида были найдены перед всеми оперонами, кодирующими синтез триптофана из общего предшественника всех ароматических аминокислот – хоризмата (Рис.1). К таковым относятся опероны MTH1476 и MTH1655-61. Сайты были обнаружены также в регуляторных областях генов, ответственных за синтез общего предшественника всех ароматических аминокислот – хоризмата, и взаимопревращения хоризмата и префената (см. Табл.1). Префенат представляет собой предшественник двух других ароматических аминокислот – тирозина и триптофана. Таким образом, данная регуляторная система контролирует не только синтез триптофана, но и соотношение всех трех ароматических аминокислот.

Потенциальный сайт был также обнаружен перед геном MTH1654, образующим дивергон с опероном MTH1655-61. Анализ аминокислотной последовательности продукта этого гена, а также его ортологов из геномов Archaeoglobus fulgidus и Pyrococcus horikoshii показал, что данный белок является фактором транскрипции. Расположение данного гена в одном локусе с генами синтеза триптофана и присутствие перед ним регуляторного сайта говорит о том, что, скорее всего, именно этот белок и является регулятором синтеза триптофана.



Рис. 1. Путь синтеза триптофана у архей. Около стрелок указаны тривиальные названия генов.




Табл. 1. Названия генов и функции белков, входящих в регулон синтеза триптофана у Methanobacter thermautotrophicus


Функция

Название соответствующего гена

Тривиальное название гена

Предполагаемый репрессор синтеза триптофана

MTH1654




Хоризмат синтаза

MTH748

aroC

Хоризмат мутаза, субъединица А

MTH804

pheA

Триптофан синтаза, субъединица бета гомолог

MTH1476

trpB-1

Хоризмат мутаза, субъединица А

MTH1640

tyrA

Антанилат синтаза компонент I

MTH1655

trpE

Антанилат синтаза, компонент II

MTH1656

trpG

Индол-3-глицерол фосфат синтаза

MTH1657

trpC

5’-фосфорибозил антанилат изомераза

MTH1658

trpF

Триптофан синтаза, бета субъединица

MTH1659

trpB-2

Триптофан синтаза, альфа субъединица

MTH1660

trpA

Антанилат фосфорибозилтрансфераза

MTH1661

trpD



Цели и задачи
Как уже упоминалось ранее, целью данной работы было изучение регуляции синтеза триптофана в различных группах архебактерий. Данная задача интересна с точки зрения молекулярной эволюции, поскольку имеется возможность проследить изменения, как в составе метаболического пути, так и в строении регуляторных систем.

Для этого нами были поставлены следующие задачи: поиск ортологов регуляторного белка, поиск ортологов белков-ферментов метаболического пути, выявление неортологичных замен, поиск новых регуляторных сигналов, изучение структуры регулона.


Материалы и методы

Нами было исследовано 12 геномов архей, принадлежащих к различным группам:


Methanobacter thermautotrophicus delta H (Smith et al., 1997), Methanosarcina acetivorans C2A (Galagan et al., 2002), Methanosarcina mazei (Deppenmeier et al., 2002), Pyrococcus abyssi GE5 (Cohen et al., 2003), Pyrococcus furiosus DSM 3638 (Maeder et al., 2002), Pyrococcus horikoshii OT3 (Kawarabayasi et al., 1998), Archaeoglobus fulgidus DSM 4304 (Klenk et al., 1997), Halobacterium salinarum NRC-1 (Ng et al., 2000), Thermoplasma acidophilum DSM 1728 (Ruepp et al., 2000) и Thermoplasma volcanium GSS1 (Kawashima et al., 2000), а также неполные геномы Methanosarcina barkeri str. fusaro, Methanococcoides burtonii DSM 6242 и Ferroplasma acidarmanus. Все последовательности геномов были взяты из базы данных GenBank (http://www.ncbi.nlm.nih.gov/)

Для поиска интересующих нас регуляторных сайтов использовался метод «проверки соответствия» (“consistency check”). Суть данного метода заключается в том, что исследуется сохранение сайта перед ортологичными генами в родственных геномах. Если сайт сохраняется, то данные гены с большой вероятностью находятся под регуляцией. Если же сайт не сохраняется, то, скорее всего, данный сигнал является ложным (так называемое «перепредсказание»). Благодаря данному методу можно предсказывать регуляцию, даже имея недостаточно специфичное распознающее правило (Mironov et al., 2000).

Для поиска потенциальных сайтов в геномных последовательностях нами использовался метод позиционных весовых матриц (Gelfand et al., 2000).

В этом методе, на основании набора известных сайтов, используя множественное выравнивание, рассчитывается вес каждого нуклеотида в каждой позиции по формуле:


W(b,k)= log[N(b,k)+0,5]-0,25 i log[N(i,k)+0,5],

где: i - все нуклеотиды, N(b,k) – число появлений нуклеотида b в позиции k.

Вес сайта представляет в данном случае сумму весов всех его позиций.

У данного метода есть несколько преимуществ. Во-первых, учитывается разная значимость различных позиций сайта, что является следствием специфичности ДНК-белковых взаимодействий. Во-вторых, учитывается возможность замен одного нуклеотида на другой в определенной позиции и вероятность таких замен.

Для поиска ортологичных генов и потенциальных регуляторных сайтов в геномных последовательностях был использован пакет программ GenomeExplorer (Миронов и др., 2000).

Для построения матриц для поиска сайтов использовалась программа SignalX (Миронов и др., 2000).

Для построения множественных выравниваний и филогенетических деревьев была использована программа ClustalX (Thomson et al., 1997).

Для визуализации деревьев использовалась программа GeneMaster (Миронов А. А., неопубликованное).

Для поиска гомологов известных белков в других геномах была использована программа BLAST (Altschul et al., 1997) (http://www.ncbi.nlm.nih.gov/BLAST/).

Для построения диаграмм лого регуляторного сайта использовалась программа WebLogo (Crooks, 2004).

Для поиска в белковых последовательностях мотивов «спираль-поворот-спираль» (helix-turn-helix, HTH) использовалась программа “Helix-Turn-Helix Motif Prediction” (Dodd and Egan, 1990).
Результаты и обсуждение
Поиск ортологов белка-регулятора в геномах архей

В качестве первого этапа поиска ортологов был произведен поиск гомологов белка-регулятора из M. thermoautotrophicus в белковой базе данных при помощи программы BLAST. После этого уже среди геномов архей, имеющих гомолога, был проведен поиск ортологов данного регулятора, в результате был выбран ряд геномов (см. материалы и методы). Поиск ортологов белка-регулятора является необходимым условием изучения регуляции, поскольку при его отсутствии невозможно предположить, что искомые сайты в исследуемых геномах будут похожи на уже известные сайты в геноме M. thermoautotrophicus. Отсутствие ортолога белка-регулятора говорит о том, что-либо используется другой механизм регуляции, либо отсутствует данный метаболический путь. Отдельного внимания заслуживает ситуация с геномом M.barkeri. В настоящее время нам доступна лишь неполная последовательность генома этого организма, в которой не удалось найти ортолога белка-регулятора. Однако в белковой базе данных с помощью программы BLAST был найден гомолог регулятора из Methanobacter thermoautotrophicus. Поиск гомологов в геноме M. thermoautotrophicus показал, что лучшим гомологом для найденного белка из M. barkeri является именно регулятор MTH1654. Таким образом, эти два белка являются ортологами. Кроме того, нами были найдены ортологи MTH1654 в геномах двух других организмов из рода Methanosarcina: M. acetivorans и M. mazei. На основании этого мы исследовали регуляцию синтеза триптофана также и в геноме M. barkeri.

Выравнивание аминокислотных последовательностей белков-регуляторов показано на рисунке 2. Ранее были высказаны предположения о том, что данный белок содержат HTH-домен (Gelfand, 2000). Их картирование при помощи программы поиска HTH-доменов (Dodd and Egan, 1990) показало, что таковые имеются во всех белках. Несмотря на то, что данные участки выравниваются между собой, степень их сходства крайне низка, в результате чего возможны изменения в структуре регуляторного сигнал. Выравнивание показало также, что у белков-регуляторов из M. burtonii, P. furiosus, M. thermoautotrophicus и H. salinarum неправильно определены старты генов (Рис. 2).

На основе множественного выравнивания было построено филогенетическое дерево белков-регуляторов (Рис.3). Как видно из рисунка 3, степень сходства регуляторов низка, а, следовательно, и сигнал во всех изучаемых видах мог измениться в ходе эволюции. Поэтому для поиска сигнала разумно выделить на дереве группы, в которых регуляторы имеют достаточно высокий уровень сходства. Можно рассчитывать, что внутри таких групп сигнал скорее всего будет сохраняться. Поиск сигнала производился отдельно внутри каждой группы. Были выделены следующие группы:



  • группа, соответствующая роду Pyrococcus;

  • группа, включающая в себя рода Methanosarcina и Methanococcoides;

  • группа, объединяющая рода Thermoplasma и Ferroplasma.


Рис. 2. Выравнивание аминокислотных последовательностей белков-регуляторов с картированными на нем HTH-доменами (показаны белыми буквами на черным фоне). Обозначения: PAB - Pyrococcus abyssi, PH - Pyrococcus horikoshii, PF - Pyrococcus furiosus, MA - Methanosarcina acetivorans, MM - Methanosarcina mazei, MBA - Methanosarcina barkeri, MCB - Methanococcoides burtonii, AF - Archaeoglobus fulgidus, Hsp - Halobacterium salinum NRC-1, FAC - Ferroplasma acidarmanus, TA - Thermoplasma acidophilum, TVN - Thermoplasma volcanium, MTH - Methanobacter thermoautotrophicus.
PAB -------------------------------------MWGRIEHYFDEYPVRKLIAKTLL

PH -------------------------------------MWGRIEHYFDEYPVRKLIAKTLL

PF ----------------------------MLNFVGGRLMWGKIEHYFDEYPVRKLIAKTLL

MTH -----------------------------MYINVVKCMWKQIKHRFEGYPSRMYVARKII

MA -------------------------------------MWQTLLSKFEKYPAQAKVLKLLF

MM -------------------------------------MWQTLLKKFEKYPAQAKVLKLLF

MBA -------------------------------------MWQTLLKKFEKYPAQAKVLKLLF

MCB MSNYICMFLCFNGSFIKLILYGYKPLYPYNFRPKVIIMWSTVLNKFEKHPAQQKVIKLLF

Hsp ------------------------------------------MQKFEGSPGQQAVIRLLL

TA -------------------------------------MWSYIYDKFSRSPSQLRIVKKMF

TVN -------------------------------------MWSYIYDKFSRSPSQLKIVKKMI

FAC -------------------------------------MWDYINKVFDNYPAEKKVVQKML

AF -------------------------------------MWKKVAEKFEKYPSQIAVAREFL

Рис. 2. Продолжение
PAB RYGLRVSE----DMKIKAGEIEVPYTKIAKALNVDRRVVKETVAMILKTPELREIYMNLE

PH RYGLRVSE----DMKIKAGEIEVPYTKIAKALNVDRRVVKETVAMILKTPELRDIYMNLE

PF RYGLRVSE----DMKIKAGEIEVPYTKIAKALNVDRRVVKETVAMILKTPELRDIYMNLE

MTH DLGFRIDR----NGKIYCDDVEISDVALARAVGVDRRTVRATANTILEDEKLRGIFENMM

MA ERGFQVNE----EGKVTSGSIEIAHTQLAKEVGVDRRVVDATTKTIISDELLSTIFKNVH

MM ERGFQVNE----EGKVTSGSIEIAHTQLAKEVGVDRRVVDATTKTIISDELLSTIFKNVH

MBA ERGFQVNE----EGKVTSGSIEIAHTQLAKEAGVDRRVVDATTKTIISDELLSRIFRNVH

MCB ERGFQVNG----DGKVTSGSIEIPHTQLAKEAGVDRRVVDATTETILSDELLKNIFQNVT

Hsp ERGFSVND----GGRVVSGGIEIPYTQVAQEAGVDRRVVDSTTEAILDDGELTRIFQNIS

TA SIGIRVTKLYD-EPVLMCGDIEIRPNTLAKATGTDRRSVMSVIERIINDETLYPVFSQLE

TVN STGIKVTKSFDNEPVLMCGDIEIRPNTLAKAAETDRRSVISVINRIANDDKLYPFFSQLE

FAC KIGISVKILYD-EPKLFCESIEIKPNSIARAFHVDRRVIVNMIQKIINDPELFDFFSNLE

AF RLGISVR-----NGKAYCGDIELVPTKIAEAIGVDRKVVLAAIQNIESDEELSKVFSALK

*: : . :*: :*. .**: : * . * .: :


PAB PT-VHMKYVGKHVGYGVIEIEPEPRA-IGILAKVAQKIADRGINIVQAIAEDPELYPEAT

PH PT-VHMKYVGRHVGYGVIEIEPEPRA-IGILARVAQKIADRGINIVQAIAEDPELYPEAT

PF PT-VHMKYVGKHVGYGVIEIEPEPRA-IGILAKIAQKIAEREINIVQVVAEDPELYPEAI

MTH PAGALLRDAAGELDFGVVEIEADARN-PGILAAAARLIADKGISIRQAHAGDPELDETPR

MA SI-PFLRDVAPALGLGVIIIIPEDAAHIGILAEVAGLISKHNVSIRQAVSDDPYLTDNPR

MM SI-PFLRDVAPSLGLGVIIIIPEDAAHVGILAEVAGLISKHNVSIRQAVSDDPYLTDNPM

MBA SI-PFLRDVAPSLGLGVIIIIPEDAADVGILAEVASLISGSKVSIRQAVSDDPYLTDNPR

MCB SI-PFLRDVAPALGLGVIIITPDDAANVGILFSVSQVISNHNISIRQAVSDDPYFNSKAM

Hsp QI-PSLMDLAPVLDLHVVTVAVQDADEPGIVAAVTGLLADHGIPIRQTISEDPEFTDEPR

TA PV-ANLWKVSSKLGYGVIEILPESASKPGIIAGVSSIIAKRGISIRQVIVDDPELVEDPK

TVN PV-ANLWKASVKMGLGVIEIIPESANKPGIIAGISSIIAKHNISIRQVIVDDPEIVEDPK

FAC PM-SNFENSGSKMGFGVIEIIPTDASMPGIIAGVMNVLAESGISVRQFIADDPDLVDNPR

AF PV-ANIAEVARILGFGVLEVYAEST-KVGIVAGVASALANAGISIRYILAEDPELSVESK

: . :. *: : **: :: : : ** : .


PAB LTIITEKPIPGDLINELSKLEGVKRISIY

PH LTIITEKPIPGDLINELSKLEGVKRISIY

PF LTIITEKPIPGDLINELSKLEGVKRISIY

MTH LTIITETPIPGGLLKDFLKIDGVKRVSIY

MA LTIITDHKVPGDLVDDILNLPSVKGVSIY

MM LTIITDNKVPGDLVDEILKLPSVKGVSIY

MBA LTIITDKKVPGELVDKILELPSVKGVSIY

MCB LTIITDSKVPGDIVNEILQLPGVKGVSIY

Hsp LYVVTDEELPGAVFTALAEMSAVRSVELS

TA AVVVTEQKVPPDIIPELKSVEGVRAITIL

TVN AVVVTDQKVPAELIPELRSVDGVKGITIL

FAC AIIVTTNTITGDVLNGIKKARGVKAVML-

AF LTVVTETKIPGAVVEEILRVEGVEKVLIS

::* :. :. : .*. : :




Рис. 3. Филогенетическое дерево для белков, ортологичных MTH1654 из M. thermautotrophicum. Обозначения: MTH - Methanobacter thermoautotrophicus, PAB - Pyrococcus abyssi, PH - Pyrococcus horikoshii, PF - Pyrococcus furiosus, MA - Methanosarcina acetivorans, MM - Methanosarcina mazei, MBA - Methanosarcina barkeri, MCB - Methanococcoides burtonii, AF - Archaeoglobus fulgidus, Hsp - Halobacterium salinum NRC-1, FAC - Ferroplasma acidarmanus, TA - Thermoplasma acidophilum, TVN - Thermoplasma volcanium.

Поиск потенциальных членов триптофанового регулона в геномах архей
После того, как были выбраны геномы, содержащие ортолога белка-регулятора, в них был произведен поиск генов, участвующих в синтезе триптофана. С этой целью был проведен поиск ортологов для всех генов, входящих в триптофановый регулон в M. thermautotrophicus (Таблица 2). Особенно стоит отметить то, что, несмотря на наличие регулятора у P. horikoshii, метаболический путь у данного вида почти полностью отсутствует, что было показано ранее (Xie et al., 2003).

Для некоторых генов в ряде геномов не удалось найти ортологов. При этом в составе оперонов, содержащих гены синтеза триптофана, были найдены гены с неизвестной функцией. Для продуктов этих генов был произведен поиск гомологов при помощи программы BLASTP.

Ряд неортологичных замен наблюдается для 5’-фосфорибозил антанилат изомеразы (trpF) у таких организмов, как Pyrococcus abyssi и P.furiosus, Thermoplasma acidophilum и Archaeglobus fulgidus. Для белков из Pyrococcus abyssi и P.furiosus уровень сходства с ферментом TrpF из Lactobacillus casei, для которого данная функция была определена экспериментально, составляет 30% и 32% соответственно (Natori, 1990). Для этих же видов был показан высокий уровень сходства с TrpF из археи Thermococcus kodakaraensis (уровень сходства 60% и 58% соответственно) и белками из бактерий Clostridium acetobutylicum с меньшим сходством (32%) для P. abyssi, и Listeria innocua для P.furiosus с уровнем сходства 35%. Для TrpF из Thermoplasma acidophilum было обнаружено сходство с белком из Thermoplasma volcanium (48%) , белком из бактерии Lactobacillus casei, но с меньшим сходством (35%). Для белка из A. fulgidus уровень сходства с соответствующим белком из бактерии Lactobacillus casei составляет 31%, так же найдено сходство с белками из ряда архей, например, уровень сходства с белком из Thermococcus kodakaraensis составляет 50%.

Для всех найденных TrpF из архей и TrpF из бактерии Lactobacillus casei было построено филогенетическое дерево (Рис. 4). Как видно из рис. 4, все белки TrpF, несмотря на низкий уровень сходства, принадлежат к одному семейству. Ветвь, соответствующая бактериальному белку, выходит из одного общего корня со всеми белками из архей, в результате чего исключается предположение о горизонтальном переносе от бактерий к археям. Таким образом, наиболее вероятным представляется следующее предположение: все белки TrpF архей представляют собой гомологи, далеко разошедшиеся в ходе эволюции. Однако, из-за низкого уровня сходства, используемый алгоритм поиска ортологов не позволяет нам идентифицировать все TrpF, как ортологичные.



Помимо этого наблюдается неортологичные замены альфа-субъединицы триптофан синтазы (TrpA) у рода Thermoplasma. Так для T. acidophilum было найдено сходство с TrpA



Тривиальное название гена

MTH

MCB

MM

MBA

MA

AF

Hsp

FAC

TA

TVN

PAB

PF




MTH1654

068_0059

MM2375

-

MA1396

AF1020

VNG2296C

166_0095

Ta1106

TVN0456

PAB2435

PF1572

aroC

MTH748

068_0108

MM1712

RMMA08408

aroC

AF0670

aroC

157_0040

Ta0824

TVN0729

aroC

PF1700

pheA

MTH804

-

-

-

-

-

VNG1244C

-

-

-

-

-

trpB-1

MTH1476

068_0036

MM0337

-

trpB

AF1240

-

158_0036

Ta0669

TVN0931

trpB-2

PF1592

tyrA

MTH1640

046_0008

MM1275

-

MA4595

AF0227

-

-

-

-

-

-

trpE

MTH1655

048_0022

MM2818

RMMA07397

trpE

AF1603

trpE1

158_0031

Ta0806

TVN1024

trpE

PF1709

trpG

MTH1656

-

MM2817

-

trpG

AF1602

trpG1

158_0030

Ta0807

TVN1023

trpG

PF1708

trpC

MTH1657

062_0018

MM2823

RMMA07985

trpC

AF1604

trpC

158_0029

Ta0808

TVN1022

PAB2043

PF1711

trpF

MTH1658

-

MM2819

RMMA08710

trpF

AF1601*

trpF

158_0032

Ta0805*

TVN1025

trpF*

PF1707*

trpB-2

MTH1659

062_0019

MM2822

RMMA08701

-

AF1600

trpB

-

-

-

trpB-1

PF1706

trpA

MTH1660

062_0020

MM2821

RMMA08700

trpA

AF1599




trpA

158_0035

Ta0803*

TVN1027*

trpA

PF1705

trpD

MTH1661

048_0025

MM2820

RMMA07984

trpD

AF1604

trpD1

158_0034

Ta0804

TVN1026

trpD

PF1710



Табл. 2. Ортологи всех генов, входящих в триптофановый регулон в Methanobacter thermautotrophicus. Обозначения: PAB - Pyrococcus abyssi, PF - Pyrococcus furiosus, MA - Methanosarcina acetivorans, MM - Methanosarcina mazei, MBA - Methanosarcina barkeri, MCB - Methanococcoides burtonii, AF - Archaeoglobus fulgidus, Hsp - Halobacterium salinum NRC-1, FAC - Ferroplasma acidarmanus, Ta - Thermoplasma acidophilum, TVN - Thermoplasma volcanium, MTH - Methanobacter thermoautotrophicus.

Условные обозначения: “-“ ортологов не найдено; “*” - установлена неортологичная замена.



Sulfolobus tokodaii (27%), с бактериальной триптофан синтазой из Chlamydophila caviae (29%) и даже с соответствующим белком из красной водоросли Porphyra purpurea (22%). Для T. volcanium было найдено сходство с trpA архей (Sulfolobus solfataricus – 27%) и бактерий Chlamydophila caviae (27%).

Для всех белков TrpA также было построено филогенетическое дерево (Рис. 5). В случае с TrpA ситуация оказалась схожей с наблюдавшейся для белков TrpF. Однако, в



непосредственной близости от ветви, содержащей белки из T. acidophilum, T. volcanium и F. acidarmanus, располагается ветвь, соответствующая Trp из кренархеот рода Sulfolobus. Поэтому в данном случае мы не можем исключать возможность горизонтального переноса от кренархеот к эуархеотам.
Рис. 4. Филогенетическое дерево белков TrpF из архей и бактерий. Обозначения: PAB - Pyrococcus abyssi, PF - Pyrococcus furiosus, MA - Methanosarcina acetivorans, MM - Methanosarcina mazei, MBA - Methanosarcina barkeri, AF - Archaeoglobus fulgidus, Hsp - Halobacterium salinum NRC-1, FAC - Ferroplasma acidarmanus, TA - Thermoplasma acidophilum, TV - Thermoplasma volcanium, MTH - Methanobacter thermoautotrophicus. Бактерии: LC - Lactobacillus casei.



Рис. 5. Филогенетическое дерево белков TrpA из архей, бактерий и эукариот. Обозначения: Археи: PAB - Pyrococcus abyssi, PF - Pyrococcus furiosus, MA - Methanosarcina acetivorans, MM - Methanosarcina mazei, MBA - Methanosarcina barkeri, MCB - Methanococcoides burtonii, AF - Archaeoglobus fulgidus, Hsp - Halobacterium salinum NRC-1, FAC - Ferroplasma acidarmanus, TA - Thermoplasma acidophilum, TV - Thermoplasma volcanium, MTH - Methanobacter thermoautotrophicus, STO – Sulfolobus tokodaii, SS – Sulfolobus sulfotarius. Бактерии: CCA – Chlamydophila caviae. Эукариоты: PP – Porphyra purpurea.



Доменные перестройки
Для синтеза триптофана из хоризмата необходимо 7 ферментативных активностей, названных TrpEGDFCAB, и каждая из них осуществляется за счет своего отдельного белкового домена. Для ряда бактерий и архей было показано, что для белков, участвующих в синтезе триптофана, характерны доменные пересторойки (Xie, 2003). Так, например, у бактерий Corynebacterium glutamicum происходит слияние trpC и trpF в единый ген, у Coxiella burtenii - слияние trpF и trpB. Достаточно частым является слияние trpG и trpD, например, такая перестройка происходит у бактерий Thermotoga maritima и Campylobacter jejuni. Для части цианобактерий, таких как Anabaena sp., Nostoc puncliforme, было показано слияние trpE и trpG (рис. 6).
Рис. 6. Доменные перестройки для ферментов синтеза триптофана у некоторых видов бактерий и архей. Данные о доменных перестройках у A. fulgidus получены в этой работе; остальные примеры взяты из Xie et al. (2003)

Corynebacterium glutamicum




N TrpC TrpF C


N TrpE C N TrpB C N TrpG C N TrpD C



Coxiella burtenii

N TrpF TrpB C




N TrpG C N TrpE C N TrpC C N TrpD C



Thermotoga maritime, Campylobacter jejuni

N TrpG TrpD C




N TrpE C N TrpC C N TrpB C N TrpF C


Anabaena sp., Nostoc puncliforme


N TrpE TrpG C



Рис. 6 Продолжение


N TrpC C N TrpB C N TrpF C N TrpD C


Archaeglobus fulgidus


N TrpC TrpD C



N TrpF C N TrpB C N TrpG C N TrpE C



Рис. 7. а) Выравнивание TrpCD A. fulgidus (AF1604) и TrpC M. thermoautotrophicus (MTH1657); б) Выравнивание TrpCD A. fulgidus (AF1604) и TrpD M. thermoautotrophicus (MTH1661).


a)
Met|MTH1657 MLRDIIRSKKLEVKELMKKTPLSILRDDITVMDEPVSFPAAVGGGKVSLICEYKRASPSM

AF|AF1604 ----------------------------MMDFGFVDSLKGASKRGKNAVIAEVKVRSPIH

: :. *: .* ** ::*.* * **
Met|MTH1657 GRISE-RGLEEMMEVYQDLADAVSIVTDGKYFKGSLDLLSGATDYG-KPLLMKDFLVDEY

AF|AF1604 GDLLRGRRIEDILRAYEKAGAAAISYITAEQFSGNFETLKKIVGLTDLPVLRKDFIRGRK

* : . * :*:::..*:. . *. .: *.*.:: *. .. *:* ***: ..
Met|MTH1657 KIYQARASGASSVLLITGVFPDLEAG-IQKCRELSMEPLVECHTSLDIFRALEAGAEIIG

AF|AF1604 EVERTAEVEAAALLLIARHLKERTAEMVDFCFEHGIEPLVEVHHAEDLVYAENARAVLI-

:: :: *:::***: : : * :: * * .:***** * : *:. * :* * :*
Met|MTH1657 VNNRDLETFEVDLERTHALAPLVP-DELILVSESGVRGPEDAEILAGYGADALLIGTAPM

AF|AF1604 -NNRDIDRMERDGGSIDVTAKIAEKIRAFKVSGSGIGSVEDLLFVLQY-VDAALIGTAFM

****:: :* * .. * :. . : ** **: . ** :: * .** ***** *
Met|MTH1657 SAQNPRELLEEIVDAVSQCRDRRRRYTGDEFFEQFA------------------------

AF|AF1604 MAENTEEFVQTVCGGEKMIEDVLRGLDFDKAYELAKTLPELDEIKIAAVLAALEAKGYGA

*:*..*::: : .. . .* * *: :*
Met|MTH1657 ------------------------------------------------------------

AF|AF1604 EVIAGFAKGVAEKSKIEIGKVMDTCGTGGDKTSSINVSTAVAIALSTVHPVAKHGNRAVS


Met|MTH1657 ------------------------------------------------------------

AF|AF1604 SKSGSADVLEALGVRIEMDEERARKMIAETNFAFLFAPLYHKSFARVAAVRRNLGIRTIF

Met|MTH1657 ------------------------------------------------------------

AF|AF1604 NVTGPLTNPARPEVQIVGVASEILLVEVAKAMSLLGRRAVVVYGSGMDEVNPNSSTDIAV

Met|MTH1657 ------------------------------------------------------------

AF|AF1604 VNGGVERLKLEPEDFGIERCRVLPCSSSGESAERIRAVFSGKGLKEDRRLIAINFATALF

Met|MTH1657 -------------------------------------

AF|AF1604 ALGYEDLKENVEIFEEKVQSGELARKLEEIACKSTSM

Рис. 7б. Продолжение

AF|AF1604 MMDFGFVDSLKGASKRGKNAVIAEVKVRSPIHGDLLRGRRIEDILRAYEKAGAAAISYIT

Met|MTH1661 ------------------------------------------------------------


AF|AF1604 AEQFSGNFETLKKIVGLTDLPVLRKDFIRGRKEVERTAEVEAAALLLIARHLKERTAEMV

Met|MTH1661 ------------------------------------------------------------

AF|AF1604 DFCFEHGIEPLVEVHHAEDLVYAENARAVLINNRDIDRMERDGGSIDVTAKIAEKIRAFK

Met|MTH1661 ------------------------------------------------------------

AF|AF1604 VSGSGIGSVEDLLFVLQYVDAALIGTAFMMAENTEEFVQTVCGGEKMIEDVLRGLDFDKA

Met|MTH1661 ----------------------------------MKFRRMIS---EIMD--FRNLSEDEA

:* : :. :::: :*.*. *:*


AF|AF1604 YELAKTLP--ELDEIKIAAVLAALEAKGYGAEVIAGFAKGVAEKS-KIEIG---KVMDTC

Met|MTH1661 YSLMEMIMAGELDDIKIAAILTALAMKGETVDEITGFARAMRDRSPRVRVSGSHEVVDSC

*.* : : ***:*****:*:** ** .: *:***:.: ::* ::.:. :*:*:*
AF|AF1604 GTGGDKTSSINVSTAVAIALSTVHP-VAKHGNRAVSSKSGSADVLEALGVRIEMDEERAR

Met|MTH1661 GTGGDSFRSYNISTAAAMIAAAAGVRVAKHGNRAVTGSCGGADILEAAGVNIELDAAAAA

*****. * *:***.*: ::. *********:...*.**:*** **.**:* *
AF|AF1604 KMIAETNFAFLFAPLYHKSFARVAAVRRNLGIRTIFNVTGPLTNPARPEVQIVGVASEIL

Met|MTH1661 RSLSDVGISFMFAPLFHRATARVAAVRRSLGFKTVFNILGPLTSPAAAGIQLLGVFDPQL

: :::..::*:****:*:: ********.**::*:**: ****.** . :*::** . *
AF|AF1604 LVEVAKAMSLLG-RRAVVVYG------SGMDEVNPNSSTDIAVVNGGVERLK-LEPEDFG

Met|MTH1661 VGPVAEVLRNLGTRCAMVVHGFDANLNPALDEISTVGPTLVAFLEDDEIRIDRLMPPDFG

: **:.: ** * *:**:* ..:**:.. ..* :*.::.. *:. * * ***
AF|AF1604 IER---CRVLPCSSSGESAERIRAVFSGKG---LKEDRRLIAINFATALFALG--YEDLK

Met|MTH1661 VEVGELEHLRAGSTTAENLELFMDVLRGREDTPEQKSRLDIALANAGALIYLAGLADTLP

:* :: . *::.*. * : *: *: ::.* **: * **: *. : *
AF|AF1604 ENVEIFEEKVQSGELARKLEEIACKSTSM--

Met|MTH1661 EGTETAKRTVKSGAALELLEEFVSYTRNLQS

*..* :..*:** . ***:.. : .:

В данной работе нами было показано слияние trpC и trpD для археи A. fulgidus. Так во всех остальных исследуемых организмах были обнаружены два отдельных гена trpC и trpD, а у A. fulgidus был обнаружен один ген, включающих обе последовательности. Схематическое изображение расположения доменов в данном ферменте представлено на рисунке 6. На рис. 7 приведены выравнивания белка TrpCD из A. fulgidus с белками TrpC и TrpD из M. thermoautotrophicus.




Изменения в оперонной структуре
Помимо неортологичных замен и доменных перестроек, нами были обнаружены также изменения в оперонной структуре. Обычно гены, отвечающие за синтез триптофана из хоризмата, расположены в одном опероне. В некоторых случаях, например у Halobacterium sp. NRC-1, происходит распад этого оперона на два или более, например, у Halobacterium sp. NRC-1. Помимо этого у M. acetivorans и M. mazei сохраняется один оперон, включающий в себя гены синтеза триптофана, но последовательность генов в нем отличается от наблюдающейся у M.thermoautotrophicus. Полная оперонная структура генов синтеза триптофана всех исследовавшихся видов архей приведена на рисунке 8.
Рис. 8. Полная оперонная структура исследованных видов архей. Символом (*) обозначены неортологичные замены. Оранжевыми квадратами обозначено наличие сайта в данной регуляторной области.


Достарыңызбен бөлісу:
  1   2   3




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет