a CLUSTAL használata több szekvencia-igazításhoz

a CLUSTAL W-t sokféle helyzetben teszteltük, és képes kezelni néhány nagyon nehéz fehérje-igazítási problémát. Ha az adatkészlet elég szorosan kapcsolódó szekvenciákból áll, hogy az első igazítások pontosak legyenek, akkor CLUSTAL W általában olyan igazítást talál, amely nagyon közel áll az ideálishoz. Problémák akkor is előfordulhatnak, ha az adatkészlet nagyon különböző hosszúságú szekvenciákat tartalmaz, vagy ha egyes szekvenciák olyan hosszú régiókat tartalmaznak, amelyeket lehetetlen összehangolni az adatkészlet többi részével. Megpróbálni egyensúlyba hozni a hosszú Beillesztések és törlések szükségességét egyes igazításokban azzal, hogy másokban el kell kerülni őket, még mindig probléma. Paramétereink alapértelmezett értékeit empirikusan teszteltük globuláris fehérjék halmazainak teszteseteivel, ahol a helyes beállításról rendelkezésre állt némi információ. A paraméterértékek nem feltétlenül megfelelőek a nonglobuláris fehérjék esetében. Azzal érveltünk, hogy egy súlymátrix és két hiánybüntetés alkalmazása túl egyszerű ahhoz, hogy a legnehezebb esetekben általánosan használható legyen. Ezeket a paramétereket számos új paraméterrel helyettesítettük, amelyek elsősorban a hurokrégiók hiányosságainak ösztönzését szolgálják. Bár ezek az új paraméterek nagyrészt heurisztikus jellegűek, meglepően jól teljesítenek és egyszerűen megvalósíthatók. A progresszív összehangolási megközelítés mögöttes sebességét ez nem befolyásolja hátrányosan. Hátránya, hogy a paramétertér most hatalmas; a paraméterek lehetséges kombinációinak száma több, mint kézzel könnyen megvizsgálható. Ezt azzal indokoljuk, hogy arra kérjük a felhasználót, hogy a CLUSTAL W-t inkább adatfeltáró eszközként kezelje, mint végleges elemzési módszerként. Nem ésszerű automatikusan levezetni több igazítást, és bizonyos algoritmusokban megbízni, hogy képesek mindig a helyes választ kapni. Az igazításokat alaposan meg kell vizsgálni, különösen az alapul szolgáló filogenetikai fával (vagy annak becslésével) együtt, és meg kell próbálni változtatni néhány paramétert. A kiugró értékeket (olyan szekvenciákat, amelyeknek nincs közeli hozzátartozója) óvatosan kell igazítani, csakúgy, mint a szekvenciák töredékeit. A program automatikusan késlelteti a többi szekvenciával kevesebb, mint 40% – ban azonos szekvenciák igazítását, amíg az összes többi szekvenciát nem igazítják, de ezt a felhasználó egy menüből állíthatja be. Hasznos lehet először a szorosan kapcsolódó szekvenciák összehangolását felépíteni, majd a távolabbi rokonokat egyenként vagy tételenként hozzáadni a korábban leírt profil-igazítások és súlyozási séma segítségével, esetleg különféle paraméterbeállítások felhasználásával. Egy példát adunk az SH2 domainek használatával. Az SH2 domének széles körben elterjedtek az eukarióta jelző fehérjékben, ahol a foszfotirozint tartalmazó peptidek felismerésében működnek. Bork és Gibson fejezetében (ebben a kötetben) a Blast és a pattern/profil kereséseket használták az ismert SH2 domainek kinyerésére és új tagok keresésére. (Az adatbázis-keresésekben használt profilok fogalmilag nagyon hasonlóak a CLUSTAL W-ben használt profilokhoz: lásd a fejezeteket és a profilkeresési módszereket.) A profilkeresések SH2 doméneket fedeztek fel a fehérje tirozin-kinázok jak családjában, amelyekről úgy gondolták, hogy nem tartalmaznak SH2 doméneket. Bár a JAK család SH2 domének meglehetősen divergensek, rendelkeznek a szükséges magszerkezeti maradékokkal, valamint a kritikus pozitív töltésű maradékokkal, amelyek megkötik a foszfotirozint, nem hagy kétséget afelől, hogy jóhiszemű SH2 domének. Az öt új JAK család SH2 domaint egymás után adtuk hozzá a 65 SH2 domain meglévő igazításához a CLUSTAL w profil igazítási opcióval. A 6.ábra a kapott igazítás egy részét mutatja. Eltérő szekvenciáik ellenére az új SH2 domének szinte tökéletesen igazodtak a régi készlethez. Az eredeti SH2 doménekbe nem helyeztek be beillesztéseket. Ebben a példában a profilbeigazítási eljárás jobb eredményeket hozott, mint mind a 70 SH2 tartomány egylépéses teljes igazítása, lényegesen kevesebb idő alatt. (ABSZTRAKT CSONKA)

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.