Sequence Alignment Algorithms

Dynamic programming algorithms are recursive algorithms modified to store intermediate results, which improves efficiency for certain problems. The Smith-Waterman (Needleman-Wunsch) algorithm uses a dynamic programming algorithm to find the optimal local (global) alignment of two sequences --

and

. The alignment algorithm is based on finding the elements of a matrix

where the element $H_{i,j}$ is the optimal score for aligning the sequence (

,...,

) with (

,.....,

). Two similar amino acids (e.g. arginine and lysine) receive a high score, two dissimilar amino acids (e.g. arginine and glycine) receive a low score. The higher the score of a path through the matrix, the better the alignment. The matrix

is found by progressively finding the matrix elements, starting at $H_{1,1}$ and proceeding in the directions of increasing

and

. Each element is set according to:

where $S_{i,j}$ is the similarity score of comparing amino acid

to amino acid

(obtained here from the BLOSUM40 similarity table) and

is the penalty for a single gap. The matrix is initialized with $H_{0,0} = 0$ . When obtaining the local Smith-Waterman alignment, $H_{i,j}$ is modified:

The gap penalty can be modified, for instance,

can be replaced by $(d \times k)$ , where

is the penalty for a single gap and

is the number of consecutive gaps.

Once the optimal alignment score is found, the ``traceback'' through

along the optimal path is found, which corresponds to the the optimal sequence alignment for the score. In the next set of exercises you will manually implement the Needleman-Wunsch alignment for a pair of short sequences, then perform global sequence alignments with a computer program developed by Anurag Sethi, which is based on the Needleman-Wunsch algorithm with an affine gap penalty,

, where

is the extension gap penalty. The output file will be in the GCG format, one of the two standard formats in bioinformatics for storing sequence information (the other standard format is FASTA).

Manually perform a Needleman-Wunsch alignment

In the first exercise you will test the Smith-Waterman algorithm on a short sequence parts of hemoglobin (PDB code 1AOW) and myoglobin 1 (PDB code 1AZI).

Table 4: Alignment score worksheet. In all alignment boxes, the similarity score $S_{i,j}$ from the BLOSUM40 matrix lookup is supplied (small text, bottom of square). Four alignment scores are provided as examples (large text, top of square), try and calculate at least four more, following the direction provided in the text for calculating $H_{i,j}$ .

		H	G	S	A	Q	V	K	G	H	G
	0	-8	-16	-24	-32	-40	-48	-56	-64	-72	-80
K	-8	$\begin{array}{c} \mathbf{-1}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-9}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{6}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$
T	-16	$\begin{array}{c} \mathbf{-9}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{-3}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$
E	-24	$\begin{array}{c} \mathbf{}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-3}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-3}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-3}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-3}}\\ \end{array}$
A	-32	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{5}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{1}}\\ \end{array}$
E	-40	$\begin{array}{c} \mathbf{}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-3}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-3}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-3}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-3}}\\ \end{array}$
M	-48	$\begin{array}{c} \mathbf{}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$
K	-56	$\begin{array}{c} \mathbf{}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{6}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$
A	-64	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{5}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{1}}\\ \end{array}$
S	-72	$\begin{array}{c} \mathbf{}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{5}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{0}}\\ \end{array}$
E	-80	$\begin{array}{c} \mathbf{}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-3}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-3}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-3}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-3}}\\ \end{array}$
D	-88	$\begin{array}{c} \mathbf{}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-3}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$
L	-96	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-4}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-3}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-4}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-4}}\\ \end{array}$
K	-104	$\begin{array}{c} \mathbf{}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{6}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$
K	-112	$\begin{array}{c} \mathbf{}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{6}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$
H	-120	$\begin{array}{c} \mathbf{}\\ {_{13}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-4}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{13}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$
G	-128	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{8}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-4}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{8}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{8}}\\ \end{array}$
T	-136	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{}\\ {_{-2}}\\ \end{array}$

Table 5: Traceback worksheet. The completed alignment score matrix

(large text, top of each square) with the BLOSUM40 lookup scores S $_{i,j}$ (small text, bottom of each square). To find the alignment, trace back starting from the lower right (T vs G, score -21) and proceed diagonally (to the left and up), left, or up. Only proceed, however, if the square in that direction could have been a predecessor, according to the conditions described in the text.

		H	G	S	A	Q	V	K	G	H	G
	0	-8	-16	-24	-32	-40	-48	-56	-64	-72	-80
K	-8	$\begin{array}{c} \mathbf{-1}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-9}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -16}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{-24}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -31}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-39}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -42 }\\ {_{6}}\\ \end{array}$	$\begin{array}{c} \mathbf{-50 }\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -58 }\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-66}\\ {_{-2}}\\ \end{array}$
T	-16	$\begin{array}{c} \mathbf{-9}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{-3}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -7}\\ {_{2}}\\ \end{array}$	$\begin{array}{c} \mathbf{-15}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -23}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-30}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -38 }\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{-44 }\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -52 }\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{-60}\\ {_{-2}}\\ \end{array}$
E	-24	$\begin{array}{c} \mathbf{ -16}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{-11}\\ {_{-3}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -3}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -8}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -13}\\ {_{2}}\\ \end{array}$	$\begin{array}{c} \mathbf{-21}\\ {_{-3}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -29 }\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-37 }\\ {_{-3}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -44 }\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{-52}\\ {_{-3}}\\ \end{array}$
A	-32	$\begin{array}{c} \mathbf{-24}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{-15}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -10}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{ 2}\\ {_{5}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -6}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{-13}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -21 }\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-28 }\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -36 }\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{-43}\\ {_{1}}\\ \end{array}$
E	-40	$\begin{array}{c} \mathbf{-32}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{-23}\\ {_{-3}}\\ \end{array}$	$\begin{array}{c} \mathbf{-15}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -6}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{ 4}\\ {_{2}}\\ \end{array}$	$\begin{array}{c} \mathbf{-4}\\ {_{-3}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -12 }\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-20 }\\ {_{-3}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -28 }\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{-36}\\ {_{-3}}\\ \end{array}$
M	-48	$\begin{array}{c} \mathbf{-39}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-31}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -23}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{-14}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -4}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{ 5}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -3 }\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-11 }\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -19 }\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-27}\\ {_{-2}}\\ \end{array}$
K	-56	$\begin{array}{c} \mathbf{-47}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-39}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -31}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{-22}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -12 }\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-3}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{ 11 }\\ {_{6}}\\ \end{array}$	$\begin{array}{c} \mathbf{ 3 }\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -5 }\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-13}\\ {_{-2}}\\ \end{array}$
A	-64	$\begin{array}{c} \mathbf{-55}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{-46}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -38}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-26}\\ {_{5}}\\ \end{array}$	$\begin{array}{c} \mathbf{-20}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -11}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{ 3}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{ 12}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{ 4 }\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -4}\\ {_{1}}\\ \end{array}$
S	-72	$\begin{array}{c} \mathbf{-63 }\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-54 }\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -41 }\\ {_{5}}\\ \end{array}$	$\begin{array}{c} \mathbf{-34}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-25 }\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-19}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-5 }\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{ 4 }\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{11 }\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{ 4 }\\ {_{0}}\\ \end{array}$
E	-80	$\begin{array}{c} \mathbf{-71 }\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{-62 }\\ {_{-3}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -49 }\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{-42}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-32 }\\ {_{2}}\\ \end{array}$	$\begin{array}{c} \mathbf{-27}\\ {_{-3}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -13 }\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-4}\\ {_{-3}}\\ \end{array}$	$\begin{array}{c} \mathbf{ 4 }\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{ 8}\\ {_{-3}}\\ \end{array}$
D	-88	$\begin{array}{c} \mathbf{-79 }\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{-70 }\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -57 }\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{-50}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-40 }\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-35}\\ {_{-3}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -21 }\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{-12 }\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{-4 }\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{ 2}\\ {_{-2}}\\ \end{array}$
L	-96	$\begin{array}{c} \mathbf{-87 }\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{-78 }\\ {_{-4}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -65 }\\ {_{-3}}\\ \end{array}$	$\begin{array}{c} \mathbf{-58}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{-48 }\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{-38}\\ {_{2}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -29 }\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{-20 }\\ {_{-4}}\\ \end{array}$	$\begin{array}{c} \mathbf{-12 }\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{-6}\\ {_{-4}}\\ \end{array}$
K	-104	$\begin{array}{c} \mathbf{-95 }\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-86 }\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -73 }\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{-66}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-56 }\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-46}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -32 }\\ {_{6}}\\ \end{array}$	$\begin{array}{c} \mathbf{-28 }\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{-20 }\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-14}\\ {_{-2}}\\ \end{array}$
K	-112	$\begin{array}{c} \mathbf{-103}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -94}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -81}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -74}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-64}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-54}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -40}\\ {_{6}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -34}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{-28}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-22}\\ {_{-2}}\\ \end{array}$
H	-120	$\begin{array}{c} \mathbf{-99}\\ {_{13}}\\ \end{array}$	$\begin{array}{c} \mathbf{-102}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -89}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -82}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{-72}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{-62}\\ {_{-4}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -48}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -42}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{-21}\\ {_{13}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -29 }\\ {_{-2}}\\ \end{array}$
G	-128	$\begin{array}{c} \mathbf{-107}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -91}\\ {_{8}}\\ \end{array}$	$\begin{array}{c} \mathbf{-97}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -88}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-80}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{-70}\\ {_{-4}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -56}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -40}\\ {_{8}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -29 }\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{-13}\\ {_{8}}\\ \end{array}$
T	-136	$\begin{array}{c} \mathbf{-115}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -99}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{-89}\\ {_{2}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -96}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{-88}\\ {_{-1}}\\ \end{array}$	$\begin{array}{c} \mathbf{-78}\\ {_{1}}\\ \end{array}$	$\begin{array}{c} \mathbf{ -64}\\ {_{0}}\\ \end{array}$	$\begin{array}{c} \mathbf{-48 }\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{-37}\\ {_{-2}}\\ \end{array}$	$\begin{array}{c} \mathbf{-21}\\ {_{-2}}\\ \end{array}$

Finding homologous pairs of ClassII tRNA synthetases

Homologous proteins are proteins derived from a common ancestral gene. In this exercise with the Needleman-Wunsch algorithm you will study the sequence identity of several class II tRNA synthetases, which are either from Eucarya, Eubacteria or Archaea or differ in the kind of aminoacylation reaction which they catalyze. Table 6 summarizes the reaction type, the organism and the PDB accession code and chain name of the employed Class II tRNA synthetase domains.