Diferença entre semelhança e identidade no alinhamento de seqüências

o diferença chave entre similaridade e identidade no alinhamento de sequência é que similaridade é a semelhança (semelhança) entre duas seqüências em comparação, enquanto identidade é o número de caracteres que correspondem exatamente entre duas sequências diferentes.

A bioinformática é um campo interdisciplinar da ciência que envolve principalmente biologia molecular e genética, ciência da computação, matemática e estatística. O alinhamento de sequência é um termo importante em bioinformática. É o procedimento no qual as seqüências de DNA, RNA ou proteína estão dispostas para identificar regiões de semelhança que é uma conseqüência da relação funcional, estrutural ou evolutiva entre as seqüências. No final do alinhamento, eles serão apresentados como linhas dentro de uma matriz. Para alinhar os caracteres idênticos em colunas sucessivas, existem lacunas inseridas entre os resíduos.

CONTEÚDO

1. Visão geral e principais diferenças
2. O que é similaridade no alinhamento de sequências
3. O que é identidade no alinhamento de sequência
4. Semelhanças entre semelhança e identidade no alinhamento de sequências
5. Comparação lado a lado - semelhança versus identidade no alinhamento de sequências em forma de tabela
6. Resumo

O que é semelhança?

A semelhança no alinhamento de sequências é a semelhança entre duas sequências quando comparadas. Este fato depende da identidade das sequências. A semelhança mostra até que ponto os resíduos estão alinhados. Portanto, sequências semelhantes contêm propriedades semelhantes. Em bioinformática, a similaridade é uma ferramenta para avaliar a semelhança entre duas proteínas.

Figura 01: Semelhança no alinhamento de sequência

Existem duas etapas principais para sequenciar o processo de alinhamento. A etapa inicial é o alinhamento por pares, que ajuda a encontrar o alinhamento ideal entre duas seqüências (incluindo intervalos) usando algoritmos como BLAST, FastA e LALIGN. O algoritmo correspondente encontra o número mínimo de operações de edição; in-dels e substituições para alinhar uma sequência à outra. Após o alinhamento por pares, é necessário obter dois parâmetros quantitativos de cada comparação por pares. Eles são identidade e semelhança.

O que é identidade?

Identidade no alinhamento de sequência é o número de caracteres que correspondem exatamente entre duas seqüências diferentes. Portanto, as lacunas não contam ao avaliar a identidade. A medição é considerada relacional à sequência mais curta entre as duas seqüências. Isso implica significativamente que ele tem o efeito quando a identidade da sequência não é transitiva. Se X = Y e Y = Z, X não é necessariamente igual a Z. Isso é deduzido em termos da medida da distância da identidade.

Figura 02: Identidade no alinhamento de sequência

Por exemplo, X tem uma sequência de AAGGCTT, Y tem uma sequência de AAGGC e Z tem uma sequência de AAGGCAT. A identidade entre X e Y é 100% 5 nucleotídeos idênticos / min [comprimento (X), comprimento (Y)]. A identidade entre Y e Z também é 100%. Mas a identidade entre X e Z é de apenas 85% (6 nucleotídeos idênticos / 7).

Quais são as semelhanças entre similaridade e identidade no alinhamento de sequências?

  • Similaridade e identidade são dois termos que usamos no alinhamento de sequências.
  • Além disso, eles se referem à semelhança entre as duas seqüências.
  • Além disso, nós os expressamos como um valor percentual.

Qual é a diferença entre semelhança e identidade no alinhamento de sequências?

A similaridade no alinhamento indica a semelhança entre duas seqüências quando comparada, enquanto a identidade no alinhamento de sequências indica a quantidade de caracteres que correspondem exatamente entre duas sequências diferentes. Portanto, essa é a principal diferença entre semelhança e identidade no alinhamento de sequência.

Resumo - Similaridade vs Identidade no Alinhamento de Sequência

O alinhamento da sequência ajuda a identificar regiões de semelhança no DNA, RNA ou proteína resultantes de relações funcionais, estruturais ou evolutivas entre as seqüências. Portanto, semelhança e identidade são dois termos-chave no contexto do alinhamento de sequência. A principal diferença entre esses dois termos é que a semelhança é a semelhança entre duas seqüências em comparação, enquanto identidade é o número de caracteres que correspondem exatamente entre duas seqüências diferentes. Assim, este é o resumo da diferença entre semelhança e identidade no alinhamento de sequências.

Referência:

1. "Identidade e semelhança - uma medida quantitativa". Identidade e semelhança - uma medida quantitativa, disponível aqui.
2. "Alinhamento de sequência". Alinhamento de sequência - Bioinformatics.Org Wiki, disponível aqui.

Cortesia da imagem:

1. “Filogenia baseada em alinhamento e sem alinhamento” Por Kolekar Pandurang - Trabalho próprio (CC BY 3.0) via Commons Wikimedia
2. “BLAST sample output” Por Fdardel - Trabalho próprio (CC BY-SA 3.0) via Commons Wikimedia