GN ID AC

advertisement
Таблица 1. Описание последовательности запроса
GN
ID
GALE
AC
OC
Len
P24325
UDP-glucose 4-epimerase (EC 5.1.3.2) (Galactowaldenase) (UDP-galactose 4epimerase).
HAEMOPHILUS INFLUENZAE
338
Обозначения:
GN – название гена
ID – идентификатор последовательности в банке данных SwissProt
AC – номер документа в банке данных SwissProt
OC – название организма
Len – длина последовательности
Таблица 2. Описание выравниваний с последовательностями потенциальных гомологов
Global
Align.
BLAST
H_AC
H_OC
70-90%
Q9CNY5
Pasteurella
multocida
55-70%
P55180
Bacillus subtilis
45-55%
Q9SN58
Arabidopsis
thaliana
40-45%
Q7WTB1
Lactobacillus
helveticus
H_Len
E-value
338 aa
e-173
339 aa
e-126
350 aa
e-103
330 aa
2e-69
A_Len
A_Score
A_ID
А_Pos
A_ScoreB
Q_From
Q_To
H_From
H_To
G_Len
G_Score
G_ID
G_Sim
338
1562
87%
92%
606
1
338
1
338
338
1562.0
87.3%
92.6%
337
1156
65%
78%
449
1
337
1
336
340
1157.0
64.7%
77.9%
338
960
55%
72%
374
3
336
5
341
351
958.0
53.0%
69.8%
339
667
43%
59%
261
1
338
1
329
340
672.0
43.2%
59.4%
G_NGap
0
0.9%
4.0%
3.5%
Обозначения:
H_AC – номер документа потенциального гомолога (хита) в банке данных SwissProt;
H_OC – название организма потенциального гомолога;
H_Len – длина последовательности потенциального гомолога;
E-value – E-value выравнивания;
A_Len – длина локального выравнивания;
A_Score – вес Смита-Ватермана локального выравнивания;
A_ScoreB – нормированный вес локального выравнивания в битах;
A_ID – процент идентичности локального выравнивания;
A_Pos – процент сходства локального выравнивания;
Q_From, Q_To – начало и окончание локального выравнивания в последовательности
запроса;
H_From, H_To – начало и окончание локального выравнивания в последовательности
потенциального гомолога;
G_Len – длина глобального выравнивания;
G_Score – вес глобального выравнивания;
G_ID - процент идентичности глобального выравнивания;
G_Sim – процент сходства глобального выравнивания;
G_NGap – суммарное количество гэпов глобального выравнивания (не включая
концевые гэпы)
Download