Kemoinformatika: perspektíva egy latin-amerikai tudományos környezetből

a kemoinformatikán dolgozó más tudományos csoportokhoz hasonlóan a DIFACQUIM-nél végzett kutatási tevékenységek két fő csoportba szervezhetők, amelyeket az ábra vázlatosan vázol. 1: (1) fogalmak kidolgozása vagy finomítása, és (2) házon belül vagy más csoportok által kifejlesztett módszerek alkalmazása.

viszont a kidolgozott fogalmak és módszerek a következőképpen oszthatók fel: (1) a szerkezet–aktivitás kapcsolatok (SAR) módszerei, különösen az aktivitási tájmodellezés (Alm) koncepciójának felhasználásával; (2) nyílt hozzáférésű alkalmazások fejlesztése kémiai adatbázisok feltárására (jelenleg a D-Tools, vide infra); és (3) a kémiai tér és a kémiai könyvtárak sokféleségének elemzése.

Fig. 2
2. ábra

D-eszközök: konszenzusos Sokszínűségi telek; b tevékenység tájkép plotter; C platform az egységes molekuláris elemzéshez (PUMA)

az alkalmazások öt fő területre összpontosítanak: (1) epi-informatika, azaz az epigenetikára alkalmazott kémiai információs módszerek; (2) a fertőző betegségekre alkalmazott számítási módszerek; (3) peptid alapú; (4) természetes termékalapú gyógyszerfelfedezés; és (5) foodinformatics, azaz az élelmiszer-kémia kémiai információs megközelítései, amelyeket kiterjesztettek az ízekre és az illatokra egyaránt (ábra. 1). A következő alfejezetek ezeket a területeket tárgyalják.

SAR az aktivitási tájmodellezés koncepciójának felhasználásával

az ALM hasznos a gyógyszer felfedezésében annak értékeléséhez, hogy a hasonlóság elve hatékonyan vonatkozik-e egy adott adatkészletre. A hasonlóság elve kimondja, hogy a szerkezetileg hasonló vegyületek hasonló tulajdonságokkal rendelkeznek. Ez egy erős feltételezés, amelyre a kémiai szerkezeten alapuló prediktív modellek támaszkodnak . A tevékenységi tájból származó betekintést ki lehet használni a gyógyszerkémiában, hogy megtalálják a vegyület egy vagy több cél felé irányuló aktivitása szempontjából releváns szerkezeti motívumokat . Az ALM elméletét és alkalmazását a DIFACQUIM és más kutatócsoportok széles körben fejlesztették ki . Leginkább a DIFACQUIM hozzájárulása az ALM – ben a szerkezet–aktivitás hasonlóság (SAS) térképek továbbfejlesztése volt, amelyeket Shanmugasundaram és Maggiora javasolt az aktivitási sziklák vizuális észlelésére és a SAR értékelésére . Ezen a területen a közelmúltban bekövetkezett fejleményekre példa a sűrűség SAS-térképek és a tevékenységi tájseprés, amelyeket a továbbiakban tárgyalunk.

sűrűség SAS térképek

feltéve, hogy a SAS térképek ábrázolják minden párosított szerkezet–aktivitás összehasonlítás egy kémiai adatkészletben, a túlnyomó számú adatpont (minden adatpont páros összehasonlítást jelent), még viszonylag kis adatkészletek esetén is megnehezítheti a vizuális értékelést a régiók meghatározásához a térképen. E célból sűrűség SAS térképeket fejlesztettek ki, ahol ugyanazon felület kis területeit színezik az általuk tartalmazott adatpontok száma (azaz páros összehasonlítások) alapján . Ezt a megközelítést később egy online szerveren vezették be és valósították meg (lásd “Activity landscape plotter (ALP)” szakasz).

Activity landscape sweeping

érdekes módon egyes adatkészletekben az aktivitási sziklák hozzájárulása aránytalanul magas egyes alszerkezeti klasztereken belül. Ezek az eredmények a simább SAR-val rendelkező területek felé mutatnak (azaz hasonló vegyületek hasonló aktivitással rendelkeznek) a kémiai térben, ami alkalmasabb lehet A prediktív modellezésre . Az activity landscape sweeping ötlete a szerkezeti hasonlóságon keresztül meghatározott vegyületek klasztereinek elemzése annak érdekében, hogy egyedileg tanulmányozzuk e klaszterek SAR-ját és hozzájárulásukat a könyvtár általános SAR-jához. Az aktivitási tájseprés példája a “példa: activity landscape and diversity of AKT inhibitors” részben található.

Online eszközök: DIFACQUIM eszközök a kemoinformatikához (D-TOOLS)

a DIFACQUIM által kifejlesztett nyilvánosan elérhető eszközöket együttesen “D-Tools” – nak nevezték el . A D-Tools általános célja, hogy szabadon elérhető online forrásokat biztosítson a molekuláris tulajdonságok és a molekuláris ujjlenyomatok kiszámításához, a kémiai tér lefedettségének és sokféleségének elemzéséhez, valamint a szűrési adatkészletek SAR-jának feltárásához az aktivitási tájmodellezés elvei alapján. A D-Tools-ban elérhető összes alkalmazás tudományos használatra készült, és sok más nyilvános szerverhez hasonlóan ezek használata és az eredmények értelmezése a felhasználó felelőssége. További részletek a vonatkozó kiadványokban találhatók . Az utóbbi időben a SAR, az ALM és a kémiai könyvtárak sokféleségének elemzéséhez számos forrást adtak a D-Tools-hoz. D-eszközök, míg a folyamatos fejlesztés, jelenleg áll három alkalmazás: (1) konszenzus Diversity Plot (CDP), (2) Activity Landscape Plotter (ALP), és (3) Platform Unified Molecular Analysis (PUMA) (ábra. 2). Az egyes alkalmazások főbb jellemzőit és felhasználásait, beleértve a közzétett felhasználásokat is, a következő szakaszok tárgyalják.

konszenzusos Sokszínűségi diagramok (CDP-K)

a CDP-ket azért fejlesztették ki, hogy több kémiai könyvtár Sokszínűségi mutatójának integratív megjelenítését elérjék . A CDP-k alacsony dimenziójú—jellemzően 2D-reprezentációk az összetett adatbázisok” teljes” vagy “globális” sokféleségéről, több kritérium egyidejű figyelembevételével, nevezetesen: molekuláris ujjlenyomatok, állványok, fizikai-kémiai tulajdonságok és vegyületek száma (könyvtárméret). Más Sokszínűségi mutatók azonban megvalósíthatók. Egy CDP-ben (ábra. 2a), minden adathalmaz egy adatponttal van ábrázolva. Az X tengely a molekuláris ujjlenyomatok alapján képviseli a kémiai sokféleséget, míg az Y tengely az állvány sokféleségét, a pont színe a fizikai-kémiai tulajdonságok sokféleségét képviseli folyamatos skála segítségével, mérete pedig az adatkészlet relatív méretét. A CDP-k további részleteit itt találja . Egy konkrét példát mutatunk be a “példa: activity landscape and diversity of AKT inhibitors” részben, amelyet az ábra mutat be. 4. Mint korábban említettük, a D-Tools-ban elérhető egy online alkalmazás konszenzusos Sokszínűségi telkek létrehozására.

Activity landscape plotter (Alp)

azzal a céllal, hogy a SARS-t az activity landscape modeling koncepciójával elemezze, az ALP szerver lehetővé teszi a felhasználó számára SAS és SAS-szerű térképek létrehozását saját szűrési adatai felhasználásával. Ezek a térképek általában a kémiai hasonlóság (molekuláris ujjlenyomatokkal mérve) és a vegyületpárok potenciálkülönbsége közötti kapcsolatot ábrázolják . SAS-térkép generálható a vegyületek SAR-jának elemzésére biológiai végponttal rendelkező adatkészletek, például egy molekuláris célpont aktivitási értéke . Az ALP-vel generált SAS-térképek az X tengely szerkezeti hasonlóságát, az Y tengely aktivitási különbségét mutatják. A két biológiai végponttal rendelkező összetett adatkészletek SAR-ját kettős aktivitási különbség (Dad) térképek segítségével lehet elemezni, amelyek az X -, illetve az Y-tengely két biológiai végpontjának aktivitási különbségeit ábrázolják . Mindkét grafikonon a színek információkat adnak a grafikonokhoz, például a vegyület maximális hatékonyságát egy párban, valamint az adatpontok számát. Megjegyzendő, hogy az elemzések eredményei is ingyenesen letölthetők, beleértve az összes nyers adatot páros struktúrával-aktivitási információkkal (ez utóbbi abban az esetben, ha a felhasználó további elemzést szeretne végezni más eszközökkel).

Platform unified molecular analysis (PUMA)

PUMA egy ingyenes online alkalmazás kemoinformatikai alapú sokféleség elemzés és vizualizáció kémiai tér a felhasználó által szolgáltatott adathalmazok. A PUMA integrálja a mutatókat az összetett adatbázisok (pl. állványtartalom) jellemzésére, a kémiai sokféleség elemzésére és a kémiai tér megjelenítésére . A PUMA-nak olyan előnyei vannak, mint a nyílt hozzáférés, és nem kell letölteni és telepíteni. A felhasználó bizalmasságának fenntartása érdekében az adatkészleteket a fejlesztők nem tartják meg az alkalmazás futtatása után. A PUMA integrálja az ALP-t és a CDP-t , amelyeket röviden ismertetünk a “konszenzus Sokszínűségi telkek (CDPs)” részben és az “Activity landscape plotter (ALP)” részben.

kémiai tér és sokféleség elemzés

a Kemográfia, amelyet kémiai űrnavigációnak is neveznek, egyre fontosabbá vált a gyógyszerfelfedezésben és osztályozásban . Bár eredetileg a kombinatorikus kémiai könyvtárak jellemzésére tervezték, elismerték annak potenciálját a gyógykémia más területein . Egy adott adatkészlet kémiai terének ábrázolása jelentős betekintést nyújthat az adatkészlet sokféleségébe, és azonosíthatja a kapcsolódó vegyületek klasztereit. Aktivitási adatokkal kombinálva a kémiai tér hatékony eszközzé válik a SAR elemzéshez. Meg kell jegyezni, hogy számos molekuláris leíró létezik, amelyek felhasználhatók a kémiai tér ábrázolására .

kémiai űrábrázolás az epigenetikában

ez a DIFACQUIM kutatócsoport egyik fő kutatási területe. 2015-ben csoportunk beszámolt a DNS-metiltranszferáz 1 (DNMT1) inhibitorok átfogó jellemzéséről, beleértve a kémiai teret, a sokféleséget, a SAR-t és az állványelemzést . Egy évvel később a vizsgálatot kiterjesztették a bet bromodomain és hiszton-dezacetiláz inhibitorokra, megvitatva a kettős aktivitású inhibitorok racionális tervezésének megvalósíthatóságát . Egy nyomon követési munkában csoportunk azt javasolta, hogyan lehet “okossá válni” a több epigenetikus célpont ellen ható kémiai vegyületek tervezésében a szerkezet többszörös aktivitású kapcsolatainak (SMARt) feltárásával . Jelenlegi erőfeszítéseink a dnmt3a és a dnmt3b kemoinformatikus elemzésre összpontosítanak. Arra számítunk, hogy ezek a tanulmányok releváns betekintést nyújtanak a racionális gyógyszertervezéshez ezekkel a célokkal szemben.

Fig. 3
3. ábra

példa az akt-gátlók könyvtárára alkalmazott tevékenységi tájseprésre. általános sűrűségszerkezet–aktivitás hasonlóság (SAS) térkép az egész könyvtár számára; b a teljes könyvtár kémiai tere főkomponens-elemzéssel (PCA) nyert és klaszterrel színezett, k-eszközökkel klaszterezve; c sűrűség SAS térkép a klaszterről 2; d sűrűség SAS térkép a klaszterről 5

a közelmúltban a DIFACQUIM két új általános módszert dolgozott ki a kémiai tér feltárására és ábrázolására: adatbázis-ujjlenyomatok és ChemMaps.

Adatbázis-ujjlenyomatok

az adatbázis-ujjlenyomatok a Shannon-entrópia fogalmán alapulnak . Lényegében az adatbázis-ujjlenyomatokat úgy tervezték, hogy egyetlen ujjlenyomatban összefoglalják az adott adatkészlet leginkább képviselt kémiai jellemzőit . Az adatbázis-ujjlenyomatok két legegyszerűbb alkalmazása: (1) A nagy könyvtárak kémiai terének vizuális ábrázolása és (2) virtuális szűrés. Például az adatbázis ujjlenyomatait nemrégiben alkalmazták 52 epigenetikus célpont kémiai terének ábrázolására .

ChemMaps

a kémiai tér szerkezeti jellemzők alapján történő vizuális ábrázolása számítási szempontból drága. A kérdés rövid magyarázata érdekében sok ilyen megközelítés megköveteli a páros hasonlósági mátrix kiszámítását, amely gyorsan kombinatorikus robbanáshoz vezet, amikor a feltérképezendő vegyületek száma növekszik. A probléma megoldása érdekében csoportunkban kifejlesztettük a Chemmap-okat . Röviden, ez a módszer kihasználja a “kémiai műholdak” fogalmát , amelyek referenciaként használt molekulák. Végül minden molekulára kiszámítják a páros hasonlóságokat egy csökkentett műholdkészlettel szemben, ezáltal jelentősen csökkentve a feladat összetettségét. A ChemMaps legjobb tudásunk szerint az első algoritmus, amely kiválasztja a műholdakat a feltérképezett kémiai könyvtárból, ezért nagyobb alkalmazkodóképességet biztosít, mint a korábbi módszerek.

példa: activity landscape and diversity of AKT inhibitors

a “SAR using the concept of activity landscape modeling” és a “Chemical space and diversity analysis” szakaszban említett módszerek némelyikének szemléltetéséhez vizsgáljuk meg a ChEMBL-től kapott AKT inhibitorok adatkészletét . Az AKT ígéretes célpont a rákellenes gyógyszerek kifejlesztésében, és csoportunk korábban is hozzájárult az új kémiai állványok azonosításához struktúraalapú virtuális szűréssel . A chembl-ből nyert AKT inhibitorok adatkészletének sűrűség SAS térképét az ábra mutatja. 3a. a szín a tartályok egy sűrűség SAS térkép képviseli a párok száma vegyületek tartoznak az adott területen a telek . Vegye figyelembe a telek jobb felső részén az aktivitási sziklákat, azaz olyan vegyületpárokat, amelyek nagy szerkezeti hasonlósággal, de nagy hatékonysági különbségekkel is rendelkeznek.A 3B. ábra ugyanannak a könyvtárnak a kémiai terét ábrázolja. A ChEMBL-ből nyert AKT-inhibitorok adatkészletének kémiai terét a hasonlósági mátrix főkomponens-elemzésének két első sajátvektorával térképeztük fel. A vegyületek klasztereit az első hat sajátvektoron k-eszközökkel csoportosítva azonosítottuk, amelyek a teljes variancia körülbelül 40% – át gyűjtötték össze. Hasonlítsa össze a 2. és 5. klaszterek SAS térképeit az ábrán. 3C, d, ill. Az 5. klaszterben kisebb az aktivitási sziklák aránya, és összességében simább a SAR, mint a 2.klaszterben. Ezért néhány prediktív modell alkalmazása előtt fontolóra lehet venni a vegyületek eltávolítását szabálytalanabb SAR-val rendelkező klaszterekben (például 2.klaszter). Az ilyen megközelítés az úgynevezett “activity landscape elsöprő”, és a továbbiakban ismertetjük .

Fig. 4
4. ábra

konszenzus Sokszínűségi diagram (CDP) öt adatkészletre (klaszterekre) alkalmazva az AKT-gátlók könyvtárában. Az ujjlenyomat sokféleségét (x tengely) a maccs kulcsok/Tanimoto hasonlósági mátrix mediánértékén keresztül számítják ki, míg az állvány sokfélesége (y tengely) a ciklikus rendszerek helyreállítási görbéjének görbéje alatti területet képviseli. Mindkét mutató esetében az alacsonyabb értékek nagyobb sokféleséggel társulnak. A CDP kvadránsokra oszlik, figyelembe véve az egyes tengelyek hat adatkészletének megfelelő átlagértékét. Az adatpontok mérete a vegyületek relatív számát, míg a szín a fizikai-kémiai tulajdonságok euklideszi távolságának átlagát jelenti (a piros szín kevesebb, a zöld pedig nagyobb változatosságot jelent). (Színes ábra online)

vizsgáljuk meg most az ábrán látható öt klaszter teljes sokféleségét. 3 a CDP használata. A PUMA – val minden klaszterre kiszámítjuk a fizikai-kémiai tulajdonságok euklideszi távolságát (PCP), a páronkénti ujjlenyomat-hasonlóság mediánját (MACCS billentyűk és a Tanimoto-együttható segítségével), valamint az állvány helyreállítási görbe alatti területet. Ezekkel az adatokkal kitölthetjük az alkalmazás weboldalán elérhető CDP sablont. Végül rendereljük a CDP-t és testreszabjuk a cselekményt. Az eredmény ábrán látható. 4, ahol minden pont egy klasztert képvisel, a pont mérete arányos a klaszterben lévő vegyületek számával, a szín az adatbázison belüli PCP átlagos euklideszi távolsághoz viszonyítva, az X tengely a maccs páros hasonlóságának mediánját, az Y tengely pedig az állvány helyreállítási görbe alatti területet képviseli. Ábrán látható. 4 ez az 5 klaszter szintén a legkevésbé változatos, ami legalább részben megmagyarázhatja az aktivitási sziklák kisebb arányát. Ezzel szemben az 1.klaszter a legváltozatosabb. Figyelembe véve az eredményeket füge. 2. és 3. javasolható az 5. klaszter molekuláihoz kapcsolódó változatosabb vegyületek kísérleti eredményeinek megszerzése. Az 5 klaszterben lévő vegyületek azonban alkalmasabbak lennének prediktív megközelítésekre, tekintettel annak sima SAR-jára.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.