testamos CLUSTAL W em uma grande variedade de situações, e é capaz de lidar com alguns problemas muito difíceis de alinhamento de proteínas. Se o conjunto de dados consiste em sequências bastante intimamente relacionadas de modo que os primeiros alinhamentos são precisos, então CLUSTAL w geralmente vai encontrar um alinhamento que é muito perto do ideal. Problemas ainda podem ocorrer se o conjunto de dados inclui sequências de comprimentos muito diferentes ou se algumas sequências incluem regiões longas que são impossíveis de alinhar com o resto do conjunto de dados. Tentar equilibrar a necessidade de longas inserções e supressões em alguns alinhamentos com a necessidade de evitá-los em outros ainda é um problema. Os valores padrão para nossos parâmetros foram testados empiricamente usando casos de teste de conjuntos de proteínas globulares onde algumas informações sobre o alinhamento correto estavam disponíveis. Os valores dos parâmetros podem não ser muito apropriados com proteínas nonglobulares. Temos argumentado que a utilização de uma matriz de peso e de duas penalizações de gap é demasiado simplista para ser de uso geral nos casos mais difíceis. Substituímos estes parâmetros por um grande número de novos parâmetros concebidos principalmente para ajudar a incentivar as lacunas nas regiões em loop. Embora estes novos parâmetros sejam de natureza heurística, eles funcionam surpreendentemente bem e são simples de implementar. A velocidade subjacente à abordagem de alinhamento progressivo não é afectada negativamente. A desvantagem é que o espaço de parâmetros é agora enorme; o número de combinações possíveis de parâmetros é mais do que pode ser facilmente examinado à mão. Justificamos isso pedindo ao usuário que trate CLUSTAL W como uma ferramenta de exploração de dados ao invés de como um método de análise definitivo. Não é sensato derivar automaticamente vários alinhamentos e confiar em algoritmos particulares como sendo capazes de sempre obter a resposta correta. Deve-se examinar os alinhamentos de perto, especialmente em conjunto com a árvore filogenética subjacente (ou estimativa dela) e tentar variar alguns dos parâmetros. Os valores anómalos (sequências que não têm parentes próximos) devem ser cuidadosamente alinhados, assim como os fragmentos de sequências. O programa irá atrasar automaticamente o alinhamento de quaisquer sequências que sejam menos de 40% idênticas a quaisquer outras até que todas as outras sequências estejam alinhadas, mas isso pode ser definido a partir de um menu pelo Usuário. Pode ser útil para construir um alinhamento de seqüências intimamente relacionadas e, em seguida, adicione o mais parentes distantes um de cada vez ou em lotes, usando o perfil de alinhamentos e de ponderação esquema descrito anteriormente e, talvez, usando uma variedade de configurações de parâmetro. Damos um exemplo usando domínios SH2. Domínios SH2 são difundidos em proteínas de sinalização eucarióticas onde funcionam no reconhecimento de péptidos contendo fosfotirosina. No capítulo de Bork e Gibson (, este volume), as pesquisas Blast e pattern/profile foram usadas para extrair o conjunto de domínios SH2 conhecidos e para procurar novos membros. (Perfis usados em pesquisas de banco de dados são conceitualmente muito semelhantes aos perfis usados em CLUSTAL W: Veja os capítulos e para métodos de pesquisa de perfil. As pesquisas de perfil detectaram domínios SH2 na família jak de proteínas tirosinas cinases, que se pensava não conter domínios SH2. Embora os domínios SH2 da família JAK sejam bastante divergentes, eles têm os resíduos estruturais essenciais necessários, bem como o resíduo crítico positivamente carregado que liga fosfotirosina, sem dúvida que eles são domínios SH2 bona fide. Os cinco novos domínios da família JAK SH2 foram adicionados sequencialmente ao alinhamento existente de 65 domínios SH2 usando a opção de alinhamento do perfil de CLUSTAL W. A figura 6 mostra parte do alinhamento resultante. Apesar de suas sequências divergentes, os novos domínios SH2 foram alinhados quase perfeitamente com o antigo conjunto. Não foram colocadas inserções nos domínios SH2 originais. Neste exemplo, o procedimento de alinhamento do perfil produziu melhores resultados do que um alinhamento completo de um passo de todos os 70 domínios SH2, e em consideravelmente menos tempo. (RESUMO TRUNCADO)