3.6 Изучения различий между сайтами, предсказанных с помощью программ RNAhybrid и miRanda
На следующем этапе исследования сайты, предсказанные программой RNAhybrid, были сравнены с сайтами, которые предсказывает программа miRanda v3.3a. Как было показано в обзоре, miRanda v3.3a является программой, основанной на уровне комплементарности в „seed” области. Сайты предсказанные этой программой представлены в базе данных www.microrna.org. Сайты, предсказанные miRanda v3.3a отбираются по параметру score, минимальное требование 120. Далее сайты отбираются по скору, вычисленному по алгоритму mirSVR (support vector regression). Минимальное требование для отбора 6mer (2-7 нуклеотиды) seed с одной Г:У парой или одним мисматчем.
Таблица 17 – Сайты, предсказанные RNAhybrid и miRanda с лучшим параметром score
RNAhybrid
|
miRanda
|
APC 5' G G 3'
GGACAUGGGGGCAGUUA
UUUGUACCUUCGUUAAU
miR-302f 3' 5'
CDS,2287 -27.6 kCal/Mol
|
miR-302f: 3' uuUGUACCUUCGUUAAu 5'
||||||::|||:||
APC: 5' ggACATGGGGGCAGTTa 3'
Score: 139.00 -23.11 kCal/Mol
|
BAD 5' G C3'
GGAAGCUCCGCCCC
CCUUCGAGGCGGGG miR-3180-3p 3'CCGGAGG U5'
14mer,CDS,565 -38.1 kCal/Mol
|
miR-3180-3p:3'ccggaggCCUUCGAGGCGGGGu 5'
||||||||||||||
BAD: 5'gggcaggGGAAGCTCCGCCCCc 3'
Score:175.00 -38.32 kCal/Mol
|
DLC1 5' U A 3'
GGACGACAUCCUCUACC
UUUGUUGUGGGGGGUGG
miR-4472 3' U 5'
5mer,CDS,3158 -31.4 kCal/Mol
|
miR-4472: 3' uuUUGUUGUGGGGGGUGg 5'
:||:|||:||:|:||
DLC1: 5' tgGACGACATCCTCTACc 3'
Score:136.00 -27.76 kCal/Mol
|
FLCN 5' G A A 3'
CGUGCGC CAGCCCCGC
GCGCGCG GUCGGGGCG
miR-4508 3' G 5'
9mer,CDS,678 -40.3 kCal/Mol
|
miR-4508: 3' gcGCGCGGGUCGGGGCg 5'
:|||| ||||||||
FLCN: 5' cgTGCGCACAGCCCCGc 3'
Score:163.00 -36.41 kCal/Mol
|
FLCN 5' G C 3'
GCUGUGGGAGCUGGCAG
UGACACCUUCGACCGUC
miR-4727-5p 3' GG UA5'
9mer,CDS,1503 -39.3 kCal/Mol
|
miR-4727-5p:3' ggUGACACCUUCGACCGUCua5'
:||||||:|||||||||
FLCN: 5' agGCTGTGGGAGCTGGCAGcc3'
Score:167.00 -34.69 kCal/Mol
|
FZD7 5' A C 3'
GGCGGCGGCCCCACUG
UUGUCGUCGGGGUGAC
miR-194* 3' GUCUA C 5'
9mer,CDS,577 -36.9kCal/Mol
|
miR-194*: 3' gtctaTTGTCGTCGGGGTGACc 5'
::|:||:|||||||||
FZD7: 5' gcccaGGCGGCGGCCCCACTGc 3'
Score:169.00 -33.48 kCal/Mol
|
KIT 5' U G U3'
GUGGACCAGGA GGCAAG
CACCUGGUCCU CCGUUC
miR-4776-3p3'UACGU A 5'
6mer,CDS,648 -37.9 kCal/Mol
|
miR-4776-3p:3'uacGUCACCUGGUCCUACCGUUc5'
| ||||||||||| |||||
KIT: 5'gttCTGTGGACCAGGAGGGCAAg3'
Score:160.00 -36.48 kCal/Mol
|
MLH3 5' G C G 3'
GAGCAAUUUC AGGAA
CUUGUUAAAG UCCUU
miR-384 3'AUA A A 5'
5mer, CDS,1375 -24.2 kCal/Mol
|
miR-384: 3' auaCUUGUUAAAGAUCCUUa 5'
||:||||||| |||||
MLH3: 5' gagGAGCAATTTCCAGGAAg 3'
Score:149.00 -19.39 kCal/Mol
|
MLH3 5' A G C 3'
CAAGGCAGA CCUGCAG
GUUUCGUUU GGACGUC
miR-1205 3' GA G U 5'
7mer,CDS, 4527 -31.3 kCal/Mol
|
miR-1205: 3' gaGUUUCGUUUGGGACGUCu 5'
|||:|||:| |||||||
MLH3: 5' taCAAGGCAGAGCCTGCAGc 3'
Score:174.00 -28.29 kCal/Mol
|
MMP2 5' G G G 3'
CGCGCUCACG GUCCCCU
GCGCGAGUGC CAGGGGG
miR-4665-5p3'CGA G UC5' 7mer,CDS,334 -43.7 kCal/Mol
|
miR-4665-5p:3'cgaGCGCGAGUGCGCAGGGGGUc5'
|||||||||| ||||||::
MMP2: 5'gggCGCGCTCACGGGTCCCCTGa3'
Score:160.00 -42.10 kCal/Mol
|
MMP9 5' G U 3'
GCUCCCGUCCUGCU
CGAGGGCAGGACGA
miR-4530 3'G CCC 5'
14mer,CDS,2142 -36.6 kCal/Mol
|
miR-4530: 3' gcGAGGGCAGGACGAccc 5'
|||||||||||||
MMP9: 5' ggCTCCCGTCCTGCTttg 3'
Score:140.00 -33.65 kCal/Mol
|
Для сравнения сайтов была использованы сайты, локализованные в кодирующей области. На он-лайн ресурсе представлены только сайты, расположенные в 3'нетранслируемой области мРНК. Для поиска сайтов была использована локальная программа miRanda v3.3a. Были изучены сайты связывания локализованные в CDS мРНК 14 генов мишеней (ABCC2, APC, AXIN1, BAD, DLC1, FLCN, FZD7, KIT, KLF12, MET, MLH1, MLH3, MMP2, MMP9).
В таблице 17 представлены сайты, которые по программе miRanda имеют лучшее значение score для изученной микроРНК в каждой из мРНК мишеней. Данные свидетельствуют, что обе программы могут предсказывать с одинаковой эффективностью все канонические (6-8mer seed – 2-8 нуклеотиды, без Г:У пар) и неканонические сайты.
Таблица 18 - Сайты предсказанные программами RNAhybrid и miRanda
RNAhybrid
|
miRanda
|
ABCC2 5' C A 3'
UCUGCUUCGGAAAUCCA
GGACGAGGUUUUUAGGU
miR-1246 3' AA5'
7mer,CDS,4484 -29.1 kCal/Mol
|
miR-1246: 3' ggACGAGGUUUUUAGGUaa 5'
||||:|::|||||||
ABCC2: 5' tcTGCTTCGGAAATCCAag 3'
Score:153.00 -24.99 kCal/Mol
|
AXIN1 5' A A 3'
GGGACAGGGAAGGGCAU
CUUUGUCCUUUUUUGUA
miR-4307 3' C A 5'
CDS,1072 -26.0 kCal/Mol
|
miR-4307: 3' ccUUUGUCCUUUUUUGUAa 5'
::|||||:||:::|||
AXIN1: 5' agGGACAGGGAAGGGCATa 3'
Score:125.00 -22.63 kCal/Mol
|
DLC1 5' A U G 3'
GAAGC GGGAAGAACAU
CUUUG CCUUUUUUGUA
miR-4307 3' C U A 5'
5mer,CDS,466 -23.9 kCal/Mol
|
miR-4307: 3' ccUUUGUCCUUUUUUGUAa 5'
||:| ||:||:|||||
DLC1: 5' agAAGCTGGGAAGAACATg 3'
Score:153.00 -19.52 kCal/Mol
|
KLF12 5' A C 3'
CCUGGGAAGGCUG
GGACCCUUUUGAC
miR-4328 3' UUA C5'
CDS,1269 -27.5 kCal/Mol
|
miR-4328: 3' uuaGGACCCUUUUGACc 5'
||||||||::|||
KLF12: 5' gtaCCTGGGAAGGCTGc 3'
Score:138.00 -24.56 kCal/Mol
|
MET 5'U U 3'
GAAGCAGGAAGGAAC
CUUUGUCCUUUUUUG
miR-4307 3'C UAA 5'
CDS,2579 -24.7 kCal/Mol
|
miR-4307: 3' ccUUUGUCCUUUUUUGUAa 5'
||:||||||::||| |
MET: 5' tgAAGCAGGAAGGAACTTt 3'
Score:117.00 -20.34 kCal/Mol
|
MLH1 5' G G A 3'
ACCCUCUCAG CCAGC
UGGGAGAGUU GGUCG
miR-320c 3' G AAAA 5'
CDS,2281 -34.7 kCal/Mol
|
miR-320c: 3' ugGGAGAGUUGGGUCGaaaa 5'
|||||||: |||||
MLH1: 5' acCCTCTCAGGCCAGCagag 3'
Score:118.00 -29.15 kCal/Mol
|
MMP9 5' U C 3'
GCCCGCGCCUUCG
UGGGUGCGGAGGU
miR-4443 3' UUU U 5'
7mer,CDS,442 -29.4 kCal/Mol
|
miR-4443: 3' uuuUGGGUGCGGAGGUu 5'
:|||:|||||:|:
MMP9: 5' tttGCCCGCGCCTTCGc 3'
Score:130.00 -25.10 kCal/Mol
|
Отбор сайтов в программе miRanda основан на значении Score, который зависит от количества комплементарных нуклеотидов в сайте и наличия комплементарных пар в seed области. Поэтому некоторые сайты с высоким значением энергии гибридизации и уровнем комплементарности, но большим количеством Г:У пар и с наличием неспаренных нуклеотидов в “seed” области имеют низкое значение score. Все сайты, представленные в таблице 18, имеют не лучшее значение score для этих микроРНК, то есть существуют сайты с более высоким значением score для этих пар (микроРНК-мРНК), но более низким значением энергии гибридизации и уровнем комплементарности. Как показало исследование, miRanda может находить все потенциальные сайты, которые ранее были предсказаны программой RNAhybrid.
Как упоминалось выше сайты, предсказанные программой miRanda, размешены на сайте www.microrna.org Центра Вычислительной Биологии (The Computational Biology Center at Memorial Sloan-Kettering Cancer Center). Все сайты, предсказанные программой miRanda, далее отбираются по алгоритму mirSVR, который вычисляет свой score для каждого сайта в зависимости от экспрессии микроРНК и мРНК мишени.
Таблица 19 – Сайты, представленные на сайте www.microrna.org
RNAhybrid
|
miRanda
|
MTHFR:hsa-miR-1260
target 5' A U G 3'
GGUGGC GAGGUGGGA
CCACCG CUCCACCCU
miRNA 3' A U A 5'
|
3' acCACCGUCUCCACCCUa 5' miR-1260
||||| |||||||||
4120:5' agGUGGCUGAGGUGGGAg 3' MTHFR
mirSVR score:-0.0097
PhastCons score:0.5171
|
3-utr,6314 ΔG = -38.7 kcal/mol
|
|
TP53:hsa-miR-1285
target 5' U C 3'
GGGUCUCGCUUUGUUGCCCAGG
UCCAGAGUGAAACAACGGGUCU
miRNA 3' 5'
|
3'ucCAGAGUGAAACAACGGGUCu 5' miR-1285
|||||:|||||||||||||
789:5'ggGUCUCGCUUUGUUGCCCAGg 3' TP53
mirSVR score:-0.0248
PhastCons score:0.5144
|
3-utr,2298 ΔG = -46.0 kcal/mol
|
|
На следующем этапе изучена доступность сайтов в базе www.microrna.org, предсказанных программой miRanda. Для этого был проведен поиск 11 сайтов, расположенных в 3’UTR. Выявлено, что сайт miR-3180-5p в мРНК CCND1, сайт miR-1285 в мРНК CDH1, miR-378b в мРНК MLH3 не представлены он-лайн базе из-за низкого показателя mirSVR score. Сайты для miR-4487, miR-4665-5p, miR-4663, miR-4710, miR-4732-3p, miR-4711-3p нет в базе, потому что эти микроРНК не включены на данный момент в базу данных. База www.microrna.org предлагает сайты взаимодействия для 1100 микроРНК, некоторые из межгенных микроРНК на данный момент не обработаны по программе miRanda и не входят в базу данных. Из одиннадцати сайтов предсказанных RNAhybrid (таблица 14), только два сайта для miR-1260 в мРНК MTHFR, miR-1285 в мРНК TP53 представлены в базе www.microrna.org (таблица 19). В заключении можно сделать вывод, что miRanda предсказывает сайты с одинаковой эффективностью, но большинство из этих сайтов не доступны в базе данных www.microrna.org. Эти данные свидетельствуют о значимости наших исследований в обнаружении в геноме человека сайтов с высоким уровнем комплементарности.
3.7 Изучение филогенетической консервативности сайтов, предсказанных RNAhybrid
На следующем этапе мы хотим проверить достоверность сайтов на основе консервативности сайта среди близкородственных и филогенетически далеких видов. В предыдущей части исследования мы говорили, что по данным выравнивания TargetScan, сайты микроРНК в 3'UTR сохраняются в 1-2 видах, то есть имеют низкую консервативность. На данном момент появились работы, которые показали эффективность действия сайтов микроРНК с низким уровнем консервативности [347]. То есть консервативность не является абсолютным критерием отбора функциональных сайтов.
В нашем исследовании мы описываем сайты взаимодействия в 5'UTR, CDS, 3'UTR. Поэтому в этой главе будут рассмотрена консервативность сайтов микроРНК, которые находятся в кодирующей части мРНК, что является новизной этой работы. Значимым отличием нашей работы от известных работ является проверка консервативности полной последовательности сайта микроРНК. Тогда как в основном проверяется только консервативность 'seed' области сайта. Второе отличие в методе изучения консервативности. В основном проводят выравнивание мРНК мишеней разных видов. В нашем исследовании мы проводили идентификацию сайта на основе аминокислотной последовательности.
Как известно одна микроРНК может действовать на несколько генов мишеней и на один ген несколько микроРНК. На основе филогенетической консервативности генов мы постараемся проверить два этих утверждения.
miR-1279 имеет сайты связывания в мРНК генов PTPN12, ZEB1, MSH6. Сайт связывания в в мРНК гена PTPN12 является каноническим сайтом с полной комплементарностью в 'seed' области. Нуклеотидная последовательность сайта связывания кодирует TKEQYE гексапептид. Сайт в PTPN12 имеет одну Г:У пару, которая находится на дистанции от 'seed' области.
Сайт miR-1279 имеет энергию взаимодействия -24,4 kcal/mol и ΔG/ΔGm равную 86.5%. Человеческий ген PTPN12 имеет 23 ортолога у разных животных. Для верификации сайта мы сравнивали нуклеотидную последовательность сайта с аминокислотной последовательностью (таблица 20). Графики вариабельности, полученные с помощью программе WebLogo, показывают, что нуклеотиды первой и второй позиции кодонов консервативные (рисунок 13). Олигонуклеотид в сайте взаимодействия кодирует TKEQYE гексапептид, который идентичный во всех изученных ортологичных белках. Замены в третьей позиции нуклеотидов не влияют на содержание аминокислот в сайте связывания (рисунок 13). Этот гексапептид расположен от 13 до 18 позиции в консервативной области аминокислотной последовательности изученных тирозин-фосфатаз (таблица 20). Замены в одного или нескольких нуклеотидов в третьей позиции приводит к уменьшению энергии взаимодействия, но не влияет на локализацию сайта.
Т
Объект
|
Участок мРНК гена PTPN12
|
Фрагмент белка PTPN12 с TKEQYE
|
Aca
Ame
Bta
Cgr
Cja
Clu
Dre
Eca
Gga
Hsa
Laf
Mdo
Mga
Mmu
Nle
Oan
Ocu
Oni
Pab
Ptr
Rno
Tgu
Xla
Xtr
|
CAAACGAAGGAGCAGTATGAACTCG
CAAACAAAGGAGCAGTATGAACTTG
CAAACAAAGGAGCAATATGAACTTG
CAAACAAAGGAGCAATATGAACTTG
CAAACTAAGGAGCAATATGAGCTTG
CAAACAAAGGAGCAATATGAGCTTG
CAAACTAAGGAGCAGTATGAGCTTG
CAGACAAAGGAGCAGTATGAGTTGG
CAGACAAAGGAGCAGTATGAACTTG
CAGACAAAGGAGCAGTATGAACTTG
CAAACAAAGGAGCAATATGAGCTTG
CAAACAAAGGAACAATATGAGCTTG
CAAACAAAGGAGCAATATGAGCTTG
CAAACTAAGGAGCAGTATGAGCTTG
CAGACTAAGGAGCAGTATGAGCTTG
CAGACCAAAGAGCAGTATGAGCTGG
CAAACAAAGGAGCAATATGAGCTTG
CAAACGAAGGAGCAATATGAACTTG
CAGACAAAGGAGCAGTACGAGTTGG
CAAACCAAGGAGCAGTATGAGCTGG
CAAACGAAGGAACAGTATGAACTTG
CAAACAAAGGAACAGTATGAACTCG
CAAACAAAGGAGCAATATGAACTTG
CAAACAAAGGAGCAGTATGAACTTG
|
QEMRTQRHSAVQTKEQYELVHRAIAQ
QEMRTQRHSAVQTKEQYELVHRAIAQ
QEMRTQRHSAVQTKEQYELVHRAIAQ
QEMRTQRHSAVQTKEQYELVHRAIAQ
QEMRTQRHSAVQTKEQYELVHRAIAQ
QEMRTQRHSAVQTKEQYELVHRAIAQ
QEMRTQRHSAVQTKEQYELVHRAIAQ
QEMRTQRHSAVQTKEQYELVHRAIAQ
QEMRTQRHSAVQTKEQYELVHRAIAQ
QEMRTQRHSAVQTKEQYELVHRAIAQ
QEMRTQRHSAVQTKEQYELVHRAIAQ
QEMRTQRHSAVQTKEQYELVHRAIAQ
QEMRTQRHSAVQTKEQYELVHRAIAQ
QEMRTQRHSAVQTKEQYELVHRAIAQ
QEMRTQRHSAVQTKEQYELVHRAIAQ
QEMRTQRHSAVQTKEQYELVHRAIAQ
QEMRTQRHSAVQTKEQYELVHRAIAQ
QEMRTQRHSAVQTKEQYELVHRAIAQ
QEMRTQRHSAVQTKEQYELVHRAIAQ
QEMRTQRHSAVQTKEQYELVHRAIAQ
QEMRTQRHSAVQTKEQYELVHRAIAQ
QEMRTQRHSAVQTKEQYELVHRAIAQ
QEMRTQRHSAVQTKEQYELVHRAIAQ
QEMRTQRHSAVQTKEQYELVHRAIAQ
|
В таблице жирным шрифтом выделены последовательности нуклеотидов и соответствующие им последовательности аминокислот.
|
аблица 20 – Нуклеотидные последовательности мРНК гена PTPN12 в сайтах взаимодействия с miR-1279 и аминокислотные последовательности белка PTPN12 в области содержащей пентапептид TKEQYE [348]
1
|
|
2
|
|
3
|
|
4
|
|
5
|
|
6
|
|
7
|
|
8
|
|
Вариабельность нуклеотидов в сайте связывания miR-1279 с мРНК генов PTPN12 (1), MSH6 (3), ZEB1 (5) и вариабельность аминокислот в области белка PTPN12 (2), MSH6 (4), ZEB1 (6) кодирующие TKEQYE , EGSSDE , GEKPYE олигопептиды ортологов, вариабельность нуклеотидов в сайте miR-548m c мРНК PTPN12 (7) и аминокислот в области белка PTPN12 (8) кодирующие EATDI ортологов
|
Рисунок 13 – Вариабельность нуклеотидной и аминокислотной последовательности сайтов ортологов [348]
Сайты связывания в ортологах имеют уровень достоверности от p<0.01 до p<0.0002 (таблица 21). Сайт взаимодействия идентичный у 11 видов от млекопитающих до земноводных, в других видах сайт имеет изменения, но не теряет своей эффективности. Полученные данные свидетельствуют, что сайт связывания существовал на ранних этапах эволюции и не менялся сотни миллионов лет.
Таблица 21 – Характеристики взаимодействия hsa-miR-1279 с ортологами гена PTPN12
Объект
|
Позиция , нт
|
ΔG, kcal/mol
|
ΔG/ΔGm, %
|
p<
|
Rno
|
836
|
-24,8
|
87,9
|
0.0002
|
Cgr
|
788
|
-24,4
|
86,5
|
0.0002
|
Gga, Hsa, Laf, Mmu, Ptr, Xtr
|
836
|
-24,4
|
86,5
|
0.0002
|
Mga
|
677
|
-24,4
|
86,5
|
0.0002
|
Nle, Pab
|
479
|
-24,4
|
86,5
|
0.0002
|
Ocu
|
815
|
-24,4
|
86,5
|
0.0002
|
Tgu
|
1111
|
-24,4
|
86,5
|
0.0002
|
Oan
|
479
|
-24.8
|
87.9
|
0.0002
|
Ame, Bta
|
837
|
-23,4
|
83,0
|
0.0003
|
Clu
|
447
|
-23,4
|
83,0
|
0.0003
|
Eca
|
765
|
-23,4
|
83,0
|
0.0003
|
Oni
|
840
|
-23,5
|
83,3
|
0.0003
|
Aca
|
836
|
-21,0
|
74,5
|
0.001
|
Dre
|
828
|
-20,2
|
71,6
|
0.002
|
Xla
|
836
|
-20,1
|
71,3
|
0.002
|
Mdo
|
908
|
-17,8
|
63,1
|
0.01
|
Cja
|
836
|
-17,8
|
63,1
|
0.01
|
Таблица 22 - Характеристики взаимодействия hsa-miR-1279 с мРНК гена PTPN12 разных видов животных [348]
|
|
|
мРНК PTPN12 5' C A 3'
AAAGGAGCAAUAUGA
UUUCUUCGUUAUACU
miR-1279 3' UC 5'
|
|
мРНК PTPN12 5' C A 3'
AAAGGAGCAGUAUGA
UUUCUUCGUUAUACU
miR-1279 3' UC 5'
|
Cgr CDS,788 ΔG = -24,4 ΔG/ΔGm = 86,5
|
|
Gga CDS,836 ΔG = -24,4 ΔG/ΔGm = 86,5
|
Hsa CDS,836 ΔG = -24,4 ΔG/ΔGm = 86,5
|
|
Mga CDS,677 ΔG = -24,4 ΔG/ΔGm = 86,5
|
Mmu CDS,836 ΔG = -24,4 ΔG/ΔGm = 86,5
|
|
Tgu CDS,1108 ΔG = -24,4 ΔG/ΔGm = 86,5
|
Ptr CDS,836 ΔG = -24,4 ΔG/ΔGm = 86,5
|
|
Xtr CDS,677 ΔG = -24,4 ΔG/ΔGm = 86,5
|
|
|
|
мРНК PTPN12 5' C G 3'
AAAGGAGCAAUAUGA
UUUCUUCGUUAUACU
miR-1279 3' UC 5'
|
|
мРНК PTPN12 5' U G 3'
AAGGAGCAGUAUGA
UUCUUCGUUAUACU
miR-1279 3' UCU 5'
|
Laf CDS,836 ΔG = -24,4 ΔG/ΔGm = 86,5
|
|
Ame CDS,837 ΔG = -23,4 ΔG/ΔGm = 83,0
|
Nle CDS,479 ΔG = -24,4 ΔG/ΔGm = 86,5
|
|
Bta CDS,837 ΔG = -23,4 ΔG/ΔGm = 83,0
|
Ocu CDS,815 ΔG = -24,4 ΔG/ΔGm = 86,5
|
|
Clu CDS,447 ΔG = -23,4 ΔG/ΔGm = 83,0
|
Pab CDS,479 ΔG = -24,4 ΔG/ΔGm = 86,5
|
|
Eca CDS,765 ΔG = -23,4 ΔG/ΔGm = 83,0
|
|
|
|
мРНК PTPN12 5' C A 3'
AAAGGAGCAAUAUGA
UUUCUUCGUUAUACU
miR-1279 3' UC 5'
|
|
мРНК PTPN12 5' C G 3'
AAGGAGCAGUAUGA
UUCUUCGUUAUACU
miR-1279 3' UCU 5'
|
Rno CDS,836 ΔG = -24,8 ΔG/ΔGm = 87,9
|
|
Oni CDS,840 ΔG = -23,4 ΔG/ΔGm = 83,3
|
Начало 5'-участка сайтов связывания в мРНК указано в нуклеотидах начиная от первого нуклеотида CDS; энергия взаимодействия (ΔG) - в kcal/mol; величина ΔG/ΔGm – в процентах.
|
Данные таблицы 22 свидетельствуют, что miR-1279 связывается 5'-частью с мРНК гена PTPN12 всех видов животных. Следовательно, вероятность взаимодействия miR-1279 с мРНК ортологичных генов PTPN12 высокая. В таблице 22 приведены характеристики взаимодействия miR-1279 с мРНК ортологичных генов PTPN12 18 видов животных. Соответствующие сайты связывания определены с уровнем достоверности от p<0,0003 до p<0,0002.
Вторая miRNA (miR-548m), взаимодействующая с CDS мРНК ортологичных генов PTPN12, имеет сайты связывания менее консервативные, чем сайты связывания для miR-1279. miR-548m связывается с CDS мРНК ортологичных генов PTPN12 в сайтах, кодирующих пентапептид EATDI у девяти видов животных (таблица 23).
В олигопептидах гомологичных белков PTPN12 разных видов животных имеются точечные замены одной или двух аминокислот, однако гексапептиды расположены в той же позиции консервативной области белка. Характеристики сайтов связывания miR-548m приведены в таблице 24 и свидетельствуют о меньшей степени взаимодействия miR-548m с CDS мРНК ортологичных генов PTPN12.
Таблица 23 - Нуклеотидные последовательности мРНК гена PTPN12 в сайтах взаимодействия с miR-548m и аминокислотные последовательности белка PTPN12 в области содержащей пентапептид EATDI [348]
Объект
|
Участок мРНК гена PTPN12
|
Фрагмент белка PTPN12 с EATDI
|
Cgr
Clu
Eca
Hsa
Laf
Nle
Ptr
Ocu
Ame
Mdo
Mga
Mmu
Gga
Rno
Tgu
Aca
|
CTAACAGAAGCCACGGATATTGGT
CCAACAGAGGCCACAGATATTGGT
CCAACAGAAGCCACAGATATTGGT
CCAACAGAAGCCACAGATATTGGT
CCGACAGAAGCCACAGATATTGGT
CCAACAGAAGCCACAGATATTGGT
CCAACAGAAGCCACAGATATTGGT
CCATCAGAAGCCACAGATATCGGT
CCAACAGAGGCCACAGATATTGGT
CCATCAGAAATCACAGATATTGGT
CCCGCAGAAATAACAGATATTGGT
CCAGCAGAAGTCACAGATATTGGT
CCAACAGAAGTAACAGATATTGGT
CTAACAGAAGTCACAGACATTGGT
CCTGCAGAAGTAACAGATATTGGT
CCAGTTGAGACTACAGATATTGGT
|
LTEATDIGFGNRCGKPKGPR
PTEATDIGFGNRCGKPKGPR
PTEATDIGFGNRCGKPKGPR
PTEATDIGFGNRCGKPKGPR
PTEATDIGFGNRCGKPKGPR
PTEATDIGFGNRCGKPKGPR
PTEATDIGFGNRCGKPKGPR
PSEATDIGFGNRCGRPKGPR
SPEATDIGFRNRCGKPKGPR
PSEITDIGFGNRCGKPKGPR
PAEITDIGFGNRCGKPRGPR
PAEVTDIGFGNRCGKPKGPR
PTEVTDIGFGNRCGKPRGPR
LTEVTDIGFGNRCGKPKGPR
PAEVTDIGFGNRCAKPRGPR
PVETTDIGFGNRCGKPRGPR
|
Величина ΔG/ΔGm изменялась от 42,6% до 80,8% для 19 животных (p<0,96 до p<0,0003). У четырех животных сайт в изученной области не сохранился (Dre, Oan, Xla, Xtr). В девяти геномах сайт имеет высокую консервативность. Следовательно, влияние miR-548m на экспрессию гена PTPN12 слабее, чем miR-1279. Соответственно степень гомологии нуклеотидных последовательностей сайтов связывания в мРНК и степень гомологии пентапептидов ортологичных белков PTPN12 у разных животных меньше (рисунок 13).
По данным таблицы 24, miR-548m связывается с мРНК ортологичных генов PTPN12 преимущественно 3'-частью или центральной частью (A. carolinensis, C. jacchus, Galus galus, Meleagris gallopavo, O. niloticus, P. abelii). Эти и приведенные выше данные свидетельствуют о возможности связывания мРНК с любой частью нуклеотидной последовательности miRNA.
Полученные данные о свойствах сайтов связывания двух miRNA в белок-кодирующей области мРНК гена PTPN12 свидетельствуют о локализации сайтов в участках мРНК, кодирующих консервативные аминокислотные последовательности тирозин-фосфатазы. Несмотря на дивергенцию, произошедшую сотни миллионов лет назад для некоторых из 24 видов животных, взаимодействие мРНК ортологичных генов PTPN12 с изученными miRNA сохранилось. Этому способствовало расположение сайтов связывания в консервативных участках мРНК, которые определяют сохранение функции тирозин-фосфатазы. Благодаря этому сохранилась возможность регуляции экспрессии гена PTPN12 с помощью miRNA.
Таблица 24 - Характеристики взаимодействия hsa-miR-548m с мРНК ортологичных генов PTPN12 разных видов животных [348]
|
|
|
мРНК 5' A G 3'
CAGAAGCCACAGAUAUU
GUUUUUGGUGUUUAUGG
miRNA 3' AAAC 5'
|
|
мРНК 5' A G 3'
CAGAAGCCACAGAUAUU
GUUUUUGGUGUUUAUGG
miRNA 3' AAAC 5'
|
Eca CDS,2195 ΔG = -25,4 ΔG/ΔGm = 76,3
|
|
Nle CDS,1905 ΔG = -25,4 ΔG/ΔGm = 76,3
|
Hsa CDS,2261 ΔG = -25,4 ΔG/ΔGm = 76,3
|
|
Ptr CDS,2261 ΔG = -25,4 ΔG/ΔGm = 76,3
|
Laf CDS,2336 ΔG = -25,4 ΔG/ΔGm = 76,3
|
|
|
|
|
|
мРНК 5' U G 3'
CAGAAGCCACAGAUAUC
GUUUUUGGUGUUUAUGG
miRNA 3' AAAC 5'
|
|
мРНК 5' A G 3'
CAGAGGCCACAGAUAUU
GUUUUUGGUGUUUAUGG
miRNA 3' AAAC 5'
|
Ocu CDS,2243 ΔG = -26,9 ΔG/ΔGm = 80,8
|
|
Clu CDS,1878 ΔG = -25,0 ΔG/ΔGm = 75,1
|
|
|
Ame CDS,2264 ΔG = -25,0 ΔG/ΔGm = 75,1
|
|
|
|
мРНК 5' A G 3'
CAGAAGCCACGGAUAUU
GUUUUUGGUGUUUAUGG
miRNA 3' AAAC 5'
|
|
мРНК 5' C A 3'
AACCGCAAGUGCC
UUGGUGUUUAUGG
miRNA 3' GUUU AAAC 5'
|
Cgr CDS,2201 ΔG = -24,6 ΔG/ΔGm = 73,9
|
|
Tgu CDS,2142 ΔG = -24,4 ΔG/ΔGm = 73,3
|
|
|
|
Далее для того, чтобы проверить действие одной микроРНК на несколько генов будут рассмотрены сайты miR-1279 с мРНК генов MSH6 и ZEB1. Сайт связывания в мРНК гена MSH6 имеет однонуклеодный пузырь и четыре Г:У пары. Несмотря на это сайт имеет высокие параметры ΔG/ΔGm (89.4%) и энергию взаимодействия -25,2 kcal/mol.
Таблица 25 - Нуклеотидные последовательности мРНК гена MSH6 в сайтах взаимодействия с miR-1279 и аминокислотные последовательности белка MSH6 в области содержащей пентапептид EGSSDE
Объект
|
Участок мРНК гена MSH6
|
Фрагмент белка MSH6 с EGSSDE
|
Ame
Cgr
Cpo
Cfa
Eca
Hsa
Laf
Mdo
Nle
Mml
Ocu
Pab
Ptr
Ssc
Bta
Mmu
|
AAGGAGGAAGGAAGUAGUGAUGAACUA
AAGGGUGCUCCAAAGCGCAAGAGAACA
AAGGAGGAAGGAAGCAGUGAUGAGAUA
AAGGAGGAAGGAAGCAGUGAUGAAAUA
AAGGAGGAAGGAAGCAGUGAUGAAAUA
AAGGAGGAAGGAAGCAGUGAUGAAAUA AAGGAGGAAGGAAGCAGUGAUGAAAUA
AAGGAGGAAGGGAGCAGUGAUGAAGCA
AAGGAGGAAGGAAGCAGUGAUGAAAUA AAGGAGGAAGGAAGCAGUGAUGAAAUA
AAGGAGGAAGGAAGCAGUGAUGAAGUU
AAGGAGGAAGGAAGCAGUGAUGAAAUA AAGGAGGAAGGAAGCAGUGAUGAAAUA
AAGGAGGAAGGAAGCAGUGAUGAAAUG
AAGGAGGAAGCAAGCAGUGAUGAAAUA
AAGCAGGAAGGAAGCAGUGAUGACGCG
|
GGSDVEFKPDAKEEGSSDELSSGVGDSDS
DGSDVEFKPDTKQEGSSDEMSSGVGDSDS
GGSDVEFKPDTKEEGSSDEISSGAGDSES
GGSDVEFKPDAKEEGSSDEISSGVGDSDS GGSDVEFKPDAKEEGSSDEISSGVGDSDS GGSDVEFKPDTKEEGSSDEISSGVGDSES GGSDVEFKPDAKEEGSSDEISSGVGDSES GGSDVEFKPDTKEEGSSDEASSGMGESDS
GGSDVEFKPDTKEEGSSDEISSGVGDSES GGSDVEFKPDTKEEGSSDEISSGVGDSES
GGSDVEFKPDAKEEGSSDEVSSAVGDSES
GGSDVEFKPDTKEEGSSDEISSGVGDSES GGSDVEFKPDTKEEGSSDEISSGVGDSES
GGSDVEFKPDTKEEGSSDEMSSGVGDSDS
GGSDVEFKPDTKEEASSDEISSGVGDSDS
GGSDVEFKPDTKQEGSSDDASSGVGDSDS
|
Таблица 26 - Характеристики взаимодействия hsa-miR-1279 с ортологами гена MSH6
Объект
|
Позиция, нт
|
ΔG, kJ/mol
|
ΔG/ΔGm, %
|
p<
|
Cfa
|
578
|
-25,2
|
89.4
|
0.00016
|
Cpo
|
806
|
-25,2
|
89.4
|
0.00016
|
Ecu
|
758
|
-25,2
|
89.4
|
0.00016
|
Hsa , Mml
|
812
|
-25,2
|
89.4
|
0.00016
|
Nle
|
602
|
-25,2
|
89.4
|
0.00016
|
Ocu
|
809
|
-25,2
|
89.4
|
0.00016
|
Pon
|
818
|
-25,2
|
89.4
|
0.00016
|
Ptr
|
929
|
-25,2
|
89.4
|
0.00016
|
Ssc
|
815
|
-25,2
|
89.4
|
0.00016
|
Mmu
|
812
|
-24,9
|
88.3
|
0.00018
|
Dre
|
797
|
-24,7
|
87.6
|
0.00020
|
Mdo
|
1019
|
-24,7
|
87.6
|
0.00020
|
Cgr
|
623
|
-23,4
|
83.0
|
0.00033
|
Ame
|
815
|
-23,2
|
82.3
|
0.00036
|
Bta
|
808
|
-21,3
|
75.5
|
0.0009
|
Laf
|
578
|
-21,1
|
74.8
|
0.001
|
Олигонуклеотид в сайте связывания кодирует гексапептид EGSSDE в белке MSH6. Мы изучили 34 ортолога человеческого гена MSH6. Эффективность miR-1279 сайта сохраняется в 16 ортологах.
Олигонуклеотиды сайта и соответственный олигопептид представлены в таблице 25. MSH6 белок 13 млекопитающих и человека имеют идентичных EGSSDE гексапептид и нуклеотидная последовательность сайта также у этих видов является высоко гомологичной. В первой аминокислоте олигопептида есть вариабельность по первому кодону кодирующий глутаминовую кислоту. EGSSDE олигопептид расположен с 13 по 18 позиции консервативного участка белка MSH6 (таблица 25). Вариабельность нуклеотидов и аминокислот представлена на рисунке 13.
Все сайты связывания в мРНК гена MSH6 соответствуют одной рамке считывания. Достоверность сайтов связывания составляет от p<0.001 до p<0.00016 (таблица 26). У девяти ортологов сайт имеет полную идентичность (от шимпанзе до морской свинки).
мРНК гена MSH6 у 11 животных имеет 3’-доминантный сайт miR-1279 и во всех этих видах высокую гомологию. В мРНК гена Bos Taurus и Loxodonta Africana сайт также имеет 3’-доминантный тип, но слабо взаимодействующий 5’-конец микроРНК (таблица 29).
мРНК гена ZEB1 имеет сайт связывания с miR-1279, энергия взаимодействия составляет 90% от максимальной величины, потому что 16 нуклеотидов микроРНК из 17 комплементарны мРНК мишени. Сайт имеет две Г:У пары и однонуклеодный пузырь на обеих нитях. Для проверки доставерности сайта были изучены сайты в мРНК ортологов 16 организмов. 12 из них сохранили сайт miR-1279 и консервативные аминокислоты в сайте связывания (таблица 27). Нуклеотидная последовательность сайта взаимодействия имеет высокую гомологию (Рисунок 13).
Таблица 27 - Нуклеотидные последовательности мРНК гена ZEB1 в сайтах взаимодействия с miR-1279 и аминокислотные последовательности белка ZEB1 в
Объект
|
Участок мРНК гена ZEB1
|
Фрагмент белка ZEB1 с GEKPYE
|
Ame
Bta
Cja
Cfa
Gga
Hsa
Mml
Mmu
Nle
Pab
Ptr
Xla
Xtr
|
UCCACAGUGGAGAGAAGCCAUAUGAAUGCCCAAAC
UCCACAGUGGAGAGAAGCCAUAUGAAUGCCCAAAC
UUCACAGUGGAGAGAAGCCAUAUGAAUGCCCAAAC
UCCACAGUGGAGAGAAGCCAUAUGAAUGCCCAAAC
UUCACAGUGGAGAGAAGCCAUAUGAGUGCCCAAAC
UUCACAGUGGAGAGAAGCCAUAUGAAUGCCCAAAC
UUCACAGUGGAGAGAAGCCAUAUGAAUGCCCAAAC
UUCACAGUGGAGAGAAGCCAUACGAAUGCCCGAAC
UUCACAGUGGAGAGAAGCCAUAUGAAUGCCCAAAC
UUCACAGUGGAGAGAAGCCAUAUGAAUGCCCAAAC
UUCACAGUGGAGAGAAGCCAUAUGAAUGCCCAAAC
UUCACAGUGGAGAGAAGCCAUACGAGUGCCCAAAC UCCACAGUGGCAGUCCCACACGCCCACAGAUACGG
|
KEHLRIHSGEKPYECPNCKKRFS
KEHLRIHSGEKPYECPNCKKRFS
KEHLRIHSGEKPYECPNCKKRFS
KEHLRIHSGEKPYECPNCKKRFS
KEHLRIHSGEKPYECPNCKKRFS
KEHLRIHSGEKPYECPNCKKRFS
KEHLRIHSGEKPYECPNCKKRFS
KEHLRIHSGEKPYECPNCKKRFS
KEHLRIHSGEKPYECPNCKKRFS
KEHLRIHSGEKPYECPNCKKRFS
KEHLRIHSGEKPYECPNCKKRFS
KEHLRIHSGEKPYECPNCKKRFS
KEHLRIHSGEKPYECPNCKKRFS
|
области содержащей пентапептид GEKPYE
Третий нуклеотид кодонов кодирующих тирозин и глутаминовую кислоту изменяется у разных организмов. Хотя это событие не влияет на аминокислотную последовательность и все 12 видов имеют в белке гексапептид GEKPYE. Этот олигопептид расположен в консервативной области белка (таблица 27). Характеристики сайтов связывания у ортологичных мРНК представлены в таблице 28. Сайт miR-1279 имеет хорошую консервативность среди млекопитающих и птиц, у земноводных сайт сохранился с меньшей точностью.
Если рассматривать вид взаимодействия, то мРНК 9 видов имеет 3’-доминантный тип сайта с miR-1279. мРНК гена ZEB1 у M. musculus, X. laevis, X. tropicalis взаимодействует с 9-11 нуклеотидами с 3’-концом miR-1279, то есть также является 3'-доминантным сайтом (таблица 29).
Таблица 28 - Характеристики взаимодействия hsa-miR-1279 с ортологами гена ZEB1
Объект
|
Позиция, нт
|
ΔG, kJ/mol
|
ΔG/ΔGm, %
|
p<
|
Ame
|
810
|
-105.4
|
89.4
|
0.00016
|
Bta, Cja, Pab
|
792
|
-105.4
|
89.4
|
0.00016
|
Cfa
|
588
|
-105.4
|
89.4
|
0.00016
|
Gga
|
789
|
-105.4
|
89.4
|
0.00016
|
Hsa, Nle, Ptr
|
741
|
-105.4
|
89.4
|
0.00016
|
Mml
|
750
|
-105.4
|
89.4
|
0.00016
|
Mmu
|
730
|
-87.4
|
74.1
|
0.0011
|
Xtr
|
732
|
-87.4
|
74.1
|
0.0011
|
Xla
|
798
|
-87.4
|
74.1
|
0.0011
|
Достарыңызбен бөлісу: |