am testat CLUSTAL W într-o mare varietate de situații și este capabil să gestioneze unele probleme foarte dificile de aliniere a proteinelor. Dacă setul de date constă din suficiente secvențe strâns legate, astfel încât primele alinieri să fie corecte, atunci CLUSTAL W va găsi de obicei o aliniere care este foarte aproape de ideal. Problemele pot apărea în continuare dacă setul de date include secvențe de lungimi foarte diferite sau dacă unele secvențe includ regiuni lungi care sunt imposibil de aliniat cu restul setului de date. Încercarea de a echilibra nevoia de inserții și ștergeri lungi în unele alinieri cu nevoia de a le evita în altele este încă o problemă. Valorile implicite pentru parametrii noștri au fost testate empiric folosind cazuri de testare a seturilor de proteine globulare în care erau disponibile unele informații cu privire la alinierea corectă. Valorile parametrilor pot să nu fie foarte potrivite cu proteinele nonglobulare. Am susținut că utilizarea unei matrice de greutate și a două penalități de decalaj este prea simplistă pentru a fi de uz general în cele mai dificile cazuri. Am înlocuit acești parametri cu un număr mare de parametri noi, concepuți în primul rând pentru a ajuta la încurajarea lacunelor în regiunile de buclă. Deși acești parametri noi sunt în mare parte euristici, ei funcționează surprinzător de bine și sunt ușor de implementat. Viteza de bază a abordării de aliniere progresivă nu este afectată negativ. Dezavantajul este că spațiul parametrilor este acum imens; numărul de combinații posibile de parametri este mai mult decât poate fi ușor examinat manual. Justificăm acest lucru solicitând utilizatorului să trateze CLUSTAL W ca un instrument de explorare a datelor, mai degrabă decât ca o metodă de analiză definitivă. Nu este sensibil să se obțină automat mai multe alinieri și să se aibă încredere în anumiți algoritmi ca fiind capabili să obțină întotdeauna răspunsul corect. Trebuie să examinăm aliniamentele îndeaproape, în special în legătură cu arborele filogenetic subiacent (sau estimarea acestuia) și să încercăm să variem unii dintre parametri. Valorile aberante (secvențe care nu au rude apropiate) trebuie aliniate cu atenție, la fel ca și fragmentele de secvențe. Programul va întârzia automat alinierea oricăror secvențe care sunt mai mici de 40% identice cu oricare altele până când toate celelalte secvențe sunt aliniate, dar acest lucru poate fi setat dintr-un meniu de către utilizator. Poate fi util să construiți mai întâi o aliniere a secvențelor strâns legate și apoi să adăugați rudele mai îndepărtate pe rând sau în loturi, folosind aliniamentele profilului și schema de ponderare descrisă anterior și poate folosind o varietate de setări ale parametrilor. Dăm un exemplu folosind domenii SH2. Domeniile SH2 sunt răspândite în proteinele de semnalizare eucariote unde funcționează în recunoașterea peptidelor care conțin fosfotirozină. În capitolul lui Bork și Gibson (, acest volum), Căutările Blast și pattern/profile au fost folosite pentru a extrage setul de domenii SH2 cunoscute și pentru a căuta noi membri. (Profilurile utilizate în căutările bazei de date sunt conceptual foarte asemănătoare cu profilurile utilizate în CLUSTAL W: Vezi capitolele și pentru metodele de căutare a profilului.) Căutările de profil au detectat domenii SH2 în familia JAK de proteine tirozin kinaze, despre care se credea că nu conțin domenii SH2. Deși domeniile SH2 ale familiei JAK sunt destul de divergente, ele au reziduurile structurale de bază necesare, precum și reziduul critic încărcat pozitiv care leagă fosfotirozina, fără a lăsa nicio îndoială că sunt domenii SH2 de bună credință. Cele cinci noi domenii SH2 ale familiei JAK au fost adăugate secvențial la alinierea existentă a 65 de domenii SH2 folosind opțiunea de aliniere a profilului CLUSTAL W. Figura 6 prezintă o parte din alinierea rezultată. În ciuda secvențelor lor divergente, noile domenii SH2 au fost aliniate aproape perfect cu vechiul set. Nu au fost plasate inserții în domeniile originale SH2. În acest exemplu, procedura de aliniere a profilului A produs rezultate mai bune decât o aliniere completă într-un singur pas a tuturor celor 70 de domenii SH2 și într-un timp considerabil mai mic. (REZUMAT TRUNCHIAT)