olemme testanneet KLUSTAALI W: tä monenlaisissa tilanteissa, ja se pystyy käsittelemään joitakin erittäin vaikeita proteiinin kohdistusongelmia. Jos tietokokonaisuus koostuu tarpeeksi läheisesti toisiinsa liittyviä sekvenssejä niin, että ensimmäinen kohdistukset ovat tarkkoja, sitten CLUSTAL W yleensä löytää kohdistus, joka on hyvin lähellä ihanteellinen. Ongelmia voi silti esiintyä, jos tietojoukko sisältää hyvin eripituisia sekvenssejä tai jos jotkin sekvenssit sisältävät pitkiä alueita, joita on mahdotonta yhdenmukaistaa muun tietojoukon kanssa. Se, että yritetään tasapainottaa pitkien lisäyksien ja poistojen tarvetta joissakin kohdissa ja tarvetta välttää niitä toisissa, on edelleen ongelma. Parametriemme oletusarvot testattiin empiirisesti käyttäen testitapauksia pallomaisista proteiineista, joissa oli saatavilla tietoa oikeasta kohdistuksesta. Parametriarvot eivät välttämättä ole kovin tarkoituksenmukaisia ei-monglobulaarisille proteiineille. Olemme väittäneet, että yhden painomatriisin ja kahden välirangaistuksen käyttäminen on liian yksinkertaista, jotta siitä olisi yleisesti hyötyä kaikkein vaikeimmissa tapauksissa. Olemme korvanneet nämä parametrit lukuisilla uusilla parametreilla, jotka on suunniteltu ensisijaisesti edistämään loop-alueiden aukkoja. Vaikka nämä uudet parametrit ovat suurelta osin heuristisia luonteeltaan, ne toimivat yllättävän hyvin ja ovat yksinkertaisia toteuttaa. Tämä ei vaikuta kielteisesti asteittaisen yhdenmukaistamisen taustalla olevaan nopeuteen. Haittana on, että parametri tila on nyt valtava; mahdollisten parametrien yhdistelmien määrä on enemmän kuin käsin voidaan helposti tutkia. Perustelemme tätä pyytämällä käyttäjää käsittelemään CLUSTAL W: tä tiedonetsintätyökaluna eikä lopullisena analyysimenetelmänä. Ei ole järkevää johtaa automaattisesti Useita linjauksia ja luottaa tiettyjen algoritmien pystyvän aina saamaan oikean vastauksen. On tutkittava linjauksia tarkasti, erityisesti yhdessä taustalla olevan fylogeneettisen puun kanssa (tai arvioitava sitä) ja kokeiltava joidenkin parametrien vaihtelua. Outliers (sekvenssit, joilla ei ole lähisukulaisia) on kohdistettava huolellisesti, samoin sekvenssien fragmentit. Ohjelma viivästyttää automaattisesti kaikkien sellaisten jaksojen kohdistamista, jotka ovat alle 40% identtisiä muiden kanssa, kunnes kaikki muut sekvenssit ovat linjassa, mutta tämä voidaan asettaa käyttäjän valikosta. Se voi olla hyödyllistä rakentaa yhdenmukaistaminen läheisten sekvenssien ensin ja sitten lisätä kaukaisempia sukulaisia yksi kerrallaan tai erissä, käyttäen Profiilin yhdenmukaistaminen ja painotus järjestelmän kuvattu aiemmin ja ehkä käyttämällä erilaisia parametriasetukset. Annamme yhden esimerkin käyttämällä SH2 verkkotunnuksia. SH2-domeenit ovat yleisiä eukaryoottisissa signaaliproteiineissa, joissa ne toimivat fosfotyrosiinia sisältävien peptidien tunnistamisessa. Luvussa Bork ja Gibson (, tämä määrä), Blast ja pattern/profile hakuja käytettiin poimia joukko tunnettuja SH2 verkkotunnuksia ja etsiä uusia jäseniä. (Tietokantahauissa käytetyt profiilit ovat käsitteellisesti hyvin samankaltaisia kuin CLUSTAL W: ssä käytetyt profiilit: katso luvut ja profiilihakumenetelmät.) Profiilihauissa havaittiin jak-perheen proteiinityrosiinikinaasien SH2-verkkotunnuksia, joiden ei arveltu sisältävän SH2-verkkotunnuksia. Vaikka JAK-perheen SH2-verkkotunnukset ovat melko erilaisia, niillä on tarvittavat ydinrakennejäämät sekä kriittisesti positiivisesti varautunut jäämä, joka sitoo fosfotyrosiinia, joten ei ole epäilystäkään siitä, että ne ovat bona fide SH2-verkkotunnuksia. Viisi uutta JAK-perheen SH2-verkkotunnusta lisättiin peräkkäin nykyiseen 65 SH2-verkkotunnuksen linjaukseen käyttäen CLUSTAL w-Profiilin kohdistusvaihtoehtoa. Kuvassa 6 esitetään osa tuloksena olevasta linjauksesta. Poikkeavista sekvensseistään huolimatta uudet SH2-verkkotunnukset ovat olleet lähes täydellisesti linjassa vanhan sarjan kanssa. Alkuperäisiin SH2-verkkotunnuksiin ei sijoitettu lisäyksiä. Tässä esimerkissä Profiilin kohdistusmenettely on tuottanut parempia tuloksia kuin kaikkien 70 SH2-verkkotunnuksen yksivaiheinen täydellinen kohdistus, ja huomattavasti lyhyemmässä ajassa. (ABSTRAKTI KATKAISTU)