Смиряев а. В., Панкина л. К. Основы биоинформатики



бет2/11
Дата11.07.2016
өлшемі8.87 Mb.
#192412
түріУчебное пособие
1   2   3   4   5   6   7   8   9   10   11

3.2. Матрицы замен.

Чтобы вычислить вес (score) всего выравнивания необходимо определить частный вес каждой пары замен при выравнивании последовательностей.

Аминокислоты с близкими биохимическими свойствами, такими как заряд, полярность и т.д. характеризуются большей вероятностью парных замен. Некоторые аминокислоты, например цистеин, глицин, триптофан очень редко заменяются в процессе эволюции. Для того чтобы учесть неравную вероятность замен были разработаны специальные матрицы, которые получили название матрицы замен. Эти матрицы содержат оценки частных весов для любой пары замены аминокислоты (или нуклеотида) i на аминокислоту (или нуклеотид) j. Первыми матрицами были матрицы аминокислотных замен РАМ (Percent accepted, 1978 г.).

Для их создания были использованы эволюционно близкие последовательности различных белков, таких как гемоглобин, цитохром с, фибриноген и т.д. Были посчитаны относительные частоты замен между различными аминокислотами и построены филогенетические деревья. Для оценки весов использовались средние значения частот, вычисленные на большом наборе данных. С одной стороны такой подход не позволяет учесть индивидуальные особенности каждого белка, но с другой стороны, он позволяет применить метод весов к различным белкам. По этим данным была построена эмпирическая матрица нормированных весов аминокислотных замен.

Наиболее широко используемая матрица – это РАМ250 (табл.3.1)

Таблица. 3.1 Матрица аминокислотных замен РАМ250






A

R

N

D

C

Q

E

G

H

I

L

K

M

F

P

S

T

W

Y

V

A

2


























































R

-2

6























































N

0

0

2




















































D

0

-1

2

4

















































C

-2

-4

-4

-5

4














































Q

0

1

1

2

-5

4











































E

0

-1

1

3

-5

2

4








































G

1

-3

0

1

-3

-1

0

5





































H

-1

2

2

1

-3

3

1

-2

6


































I

-1

-2

-2

-2

-2

-2

-2

-3

-2

5































L

-2

-3

-3

-4

-6

-2

-3

-4

-2

2

6




























K

-1

3

1

0

-5

1

0

-2

0

-2

-3

-5

























M

-1

0

-2

-3

-5

-1

-2

-3

-2

2

4

0

6






















F

-4

-4

-4

-6

-4

-5

-5

-5

-2

1

2

-5

0

9



















P

1

0

-1

-1

-3

0

-1

-1

0

-2

-3

-1

-2

-5

6
















S

1

0

1

0

0

-1

0

1

-1

-1

-3

0

-2

-3

1

3













T

1

-1

0

0

-2

-1

0

0

-1

0

-2

0

-1

-2

0

1

3










W

-6

2

-4

-7

-8

-5

-7

-7

-3

-5

-2

-3

-4

0

-6

-2

-5

17







Y

-3

-4

-2

-4

0

-4

-4

-5

0

-1

-1

-4

-2

7

-5

-3

-3

0

10




V

0

-2

-2

-2

-2

-2

-2

-1

-2

4

2

-2

2

-1

-1

-1

0

-6

-2

4

Вес S(i, j) в ячейке i, j таблицы 3.1 больше нуля означает, что аминокислота i заменяется на j чаще, чем в среднем по всем заменам. То есть эти аминокислоты сравнительно легко заменяют друг друга, т.к. они функционально эквивалентны или по другим причинам. Вес меньше нуля указывает на пары аминокислот, которые сравнительно редко заменяют друг друга.

Недостатком матриц РАМ является то, что они не очень надежно работают на больших эволюционных расстояниях.

Другим широко используемым семейством матриц весов являются матрицы BLOSUM, предложенные в 1992 г. Они построены на основе выравниваний последовательностей с определенной степенью сходства. В матрицах BLOSUM значение веса S (i, j) для каждой ячейки i, j получено из наблюдений частот замен в частичных выравниваниях близких белков. Каждая матрица соответствует специфическому порогу сходства. Например, при построении матрицы BLOSUM62 были использованы последовательности, имеющие более чем 62% сходства.

В табл. 3.2 показана матрица замен на пороговом уровне 50% сходства BLOSUM50.

Таблица 3.2. Матрица замен BLOSUM50.







A

R

N

D

C

Q

E

G

H

I

L

K

M

F

P

S

T

W

Y

V

A

5


























































R

-2

7























































N

-1

-1

7




















































D

-2

-2

2

8

















































C

-1

-4

-2

-4

13














































Q

-1

1

0

0

-3

7











































E

-1

0

0

2

-3

2

6








































G

0

-3

0

-1

-3

-2

-3

8





































H

-2

0

1

-1

-3

1

0

-2

10


































I

-1

-4

-3

-4

-2

-3

-4

-4

-4

5































L

-2

-3

-4

-4

-2

-2

-3

-4

-3

2

5




























K

-1

3

0

-1

-3

2

1

-2

0

-3

-3

6

























M

-1

-2

-2

-4

-2

0

-2

-3

-1

2

3

-2

7






















F

-3

-3

-4

-5

-2

-4

-3

-4

-1

0

1

-4

0

8



















P

-1

-3

-2

-1

-4

-1

-1

-2

-2

-3

-4

-1

-3

-4

10
















S

1

-1

1

0

-1

0

-1

0

-1

-3

-3

0

-2

-3

-1

5













T

0

-1

0

-1

-1

-1

-1

-2

-2

-1

-1

-1

-1

-2

-1

2

5










W

-3

-3

-4

-5

-5

-1

-3

-3

-3

-3

-2

-3

-1

1

-4

-4

-3

15







Y

-2

-1

-2

-3

-3

-1

-2

-3

2

-1

-1

-2

0

4

-3

-2

-2

2

8




V

0

-3

-3

-4

-1

-3

-3

-4

-4

4

1

-3

-1

1

-3

-2

0

-3

1

5

Матрицы, построенные при пороговых значениях 62 и 50%, широко используются для парного выравнивания и поиска последовательностей – гомологов в базах данных. Матрицы с меньшими пороговыми значениями соответствуют большим временам раздельной эволюции. Поэтому их используют для выравнивания более удаленных друг от друга последовательностей.

Основными отличиями матриц РАМ и Blosum являются:

1) использование матрицами РАМ простой эволюционной модели (подсчет замен на ветвях филогенетического древа);

2) матрицы РАМ основаны на учете мутаций по принципу глобального выравнивания (в высококонсервативных и высокомутабельных участках), а матрицы Blosum – локального (только высококонсервативных участков).

При средней степени сходства последовательностей наиболее часто используются матрицы Blosum 62 и PAM160. При выравнивании близкородственных последовательностей следует использовать матрицы Blosum с большим порядковым номером и матрицы PAM с меньшим номером.



Достарыңызбен бөлісу:
1   2   3   4   5   6   7   8   9   10   11




©dereksiz.org 2024
әкімшілігінің қараңыз

    Басты бет