samaan tapaan kuin muut akateemiset ryhmät työskentelevät chemoinformatics, tutkimustoiminta suoritetaan difacquim voidaan järjestää kahteen pääryhmään kaavamaisesti esitetty Fig. 1: (1) käsitteiden kehittäminen tai tarkentaminen ja (2) omien tai muiden ryhmien kehittämien menetelmien soveltaminen.
kehitetyt käsitteet ja menetelmät voidaan puolestaan jakaa seuraavasti: (1) rakenne–aktiivisuussuhdemenetelmät (Sar), erityisesti toimintamaisemamallinnuksen (Alm) käsitteen avulla; (2) avoimen käytön sovellusten kehittäminen kemiallisten tietokantojen tutkimiseksi (kerätään tällä hetkellä d-työkaluissa, vide Infrassa); ja (3) kemiallisen tilan ja kemiallisten kirjastojen monimuotoisuuden analysointi.
sovellukset keskittyvät viiteen pääalueeseen: (1) epi-informatiikka eli epigenetiikkaan sovellettavat kemialliset tiedotusmenetelmät; (2) tartuntatauteihin sovellettavat laskennalliset menetelmät; (3) peptidipohjaiset menetelmät; (4) luontaistuotteisiin perustuvat lääkkeiden löydöt; ja (5) foodinformatiikka eli elintarvikekemian kemialliset tiedot, jotka on laajennettu niin maku-kuin tuoksuaineisiin (Fig. 1). Seuraavissa kohdissa käsitellään näitä aloja.
- SAR käyttäen käsitettä aktiivisuusmaiseman mallinnus
- tiheyden SAS–kartat
- Aktiivisuusmaiseman lakaisu
- Online tools: DIFACQUIM tools for chemoinformatics (D-TOOLS)
- konsensus-monimuotoisuuspiirit (CDP)
- Activity landscape plotter (Alp)
- Platform for unified molecular analysis (PUMA)
- Kemiallinen avaruus-ja monimuotoisuusanalyysi
- Kemiallinen tilakartoitus epigenetiikassa
- tietokannan sormenjäljet
- ChemMaps
- esimerkki: AKT: n estäjien aktiivisuusmaisema ja monimuotoisuus
SAR käyttäen käsitettä aktiivisuusmaiseman mallinnus
ALM on hyödyllinen huumeiden löytämisessä arvioitaessa, sovelletaanko samankaltaisuusperiaatetta tehokkaasti tiettyyn aineistoon. Samankaltaisuusperiaatteen mukaan rakenteellisesti samankaltaisilla yhdisteillä olisi enemmän samanlaisia ominaisuuksia. Tämä on vahva oletus, johon kemialliseen rakenteeseen perustuvat ennustavat mallit tukeutuvat . Insights from activity landscape can be used in medicinal chemistry to find structural motiivs relevant to a compound ’ s activity to one or more targets . ALM: n teoriaa ja soveltamista on kehitetty laajasti DIFACQUIMIN ja muiden tutkimusryhmien toimesta . Enimmäkseen difacquimin panos ALM: ssä on ollut rakenne–aktiivisuuden samankaltaisuuden (SAS) karttojen jatkokehittäminen, joita Shanmugasundaram ja Maggiora ehdottivat aktiivisuuskallioiden silmämääräiseen havaitsemiseen ja SAR: n arviointiin . Esimerkkejä viimeaikaisesta kehityksestä tällä alueella ovat tiheyskartat ja aktiivisuusmaiseman nuohous, joita käsitellään seuraavaksi.
tiheyden SAS–kartat
edellyttäen, että SAS-kartat kuvaavat jokaisen parillisen rakenne-aktiivisuusvertailun kemiallisessa aineistossa, datapisteiden ylivoimainen määrä (jokainen datapiste edustaa parivertailua), jopa suhteellisen pienten aineistojen osalta, voi vaikeuttaa silmämääräistä arviointia alueiden määrittämiseksi kartalla. Tätä varten kehitettiin tiheyskosketuskartat, joissa saman pinnan pieniä alueita väritetään niiden sisältämien datapisteiden määrän (eli parivertailujen) perusteella . Tämä lähestymistapa otettiin myöhemmin käyttöön ja toteutettiin online-palvelimella (KS. ”Activity landscape plotter (ALP)” – osio).
Aktiivisuusmaiseman lakaisu
mielenkiintoista on, että joissakin aineistoissa aktiivisuuskallioiden osuus on suhteettoman suuri joidenkin alaryhmien sisällä. Nämä tulokset osoittavat kohti alueita, joilla on tasaisempi SAR (ts .samankaltaisilla yhdisteillä on samanlainen aktiivisuus) kemiallisessa tilassa, mikä voisi olla sopivampi ennustavaan mallinnukseen. Aktiviteettimaiseman lakaisun ideana on analysoida rakenteellisen samankaltaisuuden kautta määriteltyjen yhdisteiden klustereita, jotta voidaan yksilöllisesti tutkia näiden klusterien SAR-arvoa ja niiden osuutta kirjaston KOKONAISSAR-arvossa. Esimerkki aktiivisuusmaiseman lakaisusta on esitetty kohdassa” esimerkki: AKTIIVISUUSMAISEMA ja AKT: n estäjien monimuotoisuus”.
Online tools: DIFACQUIM tools for chemoinformatics (D-TOOLS)
difacquimin kehittämiä julkisesti saatavilla olevia työkaluja on kutsuttu yhteisnimellä ”D-Tools” . D-Toolsin yleistarkoituksena on tarjota vapaasti käytettävissä olevia verkkoresursseja molekyylien ominaisuuksien ja molekyylien sormenjälkien laskemiseen, kemiallisen tilan kattavuuden ja monimuotoisuuden analysointiin sekä seulontatietoaineistojen SAR-tutkimiseen aktiivisuusmaiseman mallinnuksen periaatteiden mukaisesti. Kaikki D-työkaluissa saatavilla olevat sovellukset on tarkoitettu akateemiseen käyttöön, ja kuten monet muutkin julkiset palvelimet, niiden käyttö ja tulosten tulkinta on käyttäjän vastuulla. Lisätietoja on saatavissa vastaavista julkaisuista . Viime aikoina d-työkaluihin on lisätty monia resursseja SAR -, ALM-ja kemiallisten kirjastojen moninaisuuden analysointiin. D-työkalut, jotka ovat jatkuvassa kehityksessä, koostuvat tällä hetkellä kolmesta sovelluksesta: (1) Consensus Diversity Plot (CDP), (2) Activity Landscape Plotter (ALP) ja (3) Platform for Unified Molecular Analysis (PUMA) (Fig. 2). Kunkin sovelluksen tärkeimmät ominaisuudet ja käyttötarkoitukset, mukaan lukien julkaistut käyttötarkoitukset, käsitellään seuraavissa jaksoissa.
konsensus-monimuotoisuuspiirit (CDP)
CDP: t kehitettiin useiden kemiallisten kirjastojen monimuotoisuusmittareiden integroivan renderöinnin saavuttamiseksi . CDP: t ovat pieniulotteisia-tyypillisesti 2D—kuvauksia yhdistetietokantojen” kokonais – ” tai ”globaalista” monimuotoisuudesta ottaen huomioon samanaikaisesti useita kriteerejä, kuten molekyylien sormenjäljet, rakennustelineet, fysikaalis-kemialliset ominaisuudet ja yhdisteiden lukumäärä (kirjaston koko). Muita monimuotoisuusmittareita voidaan kuitenkin toteuttaa. CDP :ssä (kuva. 2a), jokainen tietojoukko esitetään datapisteellä. X-akseli edustaa kemiallista monimuotoisuutta, joka perustuu molekulaarisiin sormenjälkiin, kun taas Y-akseli edustaa rakennustelineiden monimuotoisuutta, pisteen väri kuvaa fysikaaliskemiallisten ominaisuuksien monimuotoisuutta jatkuvalla asteikolla ja sen koko kuvaa aineiston suhteellista kokoa. Lisätietoja CDPs annetaan . Yksi erityinen esimerkki on esitetty kohdassa ”esimerkki: Activity landscape and diversity of ACT inhibitors” ja kuvitettu Kuvassa. 4. Kuten aiemmin todettiin, d-työkaluissa on saatavilla online-sovellus konsensus-moninaisuuskohteiden tuottamiseksi.
Activity landscape plotter (Alp)
Alp-palvelimen avulla käyttäjä voi luoda SAS-ja SAS-tyyppisiä karttoja käyttäen omaa seulontatietoaan. Yleensä nämä kartat kuvaavat kemiallisen samankaltaisuuden (mitattuna molekyylien sormenjäljillä) ja yhdisteparien voimakkuuseron välistä suhdetta . SAS-kartta voidaan luoda analysoimaan yhdisteiden SAR-tietokokonaisuuksia, joilla on biologinen päätetapahtuma, esimerkiksi aktiivisuusarvo yhdelle molekyylikohteelle . ALP: llä luodut SAS-kartat kuvaavat rakenteellista samankaltaisuutta X-akselilla ja aktiivisuuseroa Y-akselilla. Yhdisteaineistojen SAR-arvot, joilla on kaksi biologista päätepistettä, voidaan analysoida Dad – kartoilla (dual-activity difference), joissa esitetään aktiivisuuserot kahdelle biologiselle päätepisteelle X-ja Y-akseleilla . Molemmissa kuvaajissa värit lisäävät tonteille tietoa, kuten yhdisteen maksimiteho parilla ja datapisteiden määrä. Huomioitavaa on, että analyysien tulokset ovat myös vapaasti ladattavissa, mukaan lukien kaikki raakadata pairwise rakenne–aktiivisuustietoineen (jälkimmäinen mikäli käyttäjä haluaa tehdä lisäanalyysejä muilla työkaluilla).
Platform for unified molecular analysis (PUMA)
PUMA on ilmainen online-sovellus kemoinformatic-pohjaiseen monimuotoisuusanalyysiin ja käyttäjän toimittamien tietokokonaisuuksien kemiallisen tilan visualisointiin. PUMA integroi mittarit luonnehtimaan yhdistetietokantoja (esim .rakennustelineiden sisältö), analysoimaan kemiallista monimuotoisuutta ja visualisoimaan kemiallista tilaa. PUMA on etuja, kuten avoin pääsy ja ei tarvitse ladata ja asentaa. Käyttäjien luottamuksellisuuden säilyttämiseksi kehittäjät eivät säilytä tiedostoja sovelluksen suorittamisen jälkeen. PUMA yhdistää ALP: n ja CDP: n , jotka kuvattiin lyhyesti ”Consensus diversity plotters (CDPs)” – osiossa ja ”Activity landscape plotter (Alp)” – osiossa.
Kemiallinen avaruus-ja monimuotoisuusanalyysi
Kemografia, jota kutsutaan myös kemialliseksi avaruusnavigaatioksi, on tullut yhä tärkeämmäksi huumeiden löytämisessä ja luokittelussa . Vaikka se alun perin suunniteltiin kombinatoristen kemian kirjastojen luonnehdintaan, sen potentiaali muilla lääketieteellisen kemian aloilla on tunnustettu . Tietyn aineiston kemiallisen tilan kartoittaminen voisi antaa merkittäviä tietoja aineiston monimuotoisuudesta ja tunnistaa toisiinsa liittyvien yhdisteiden klustereita. Kun se yhdistetään aktiivisuustietoihin, kemiallisesta tilasta tulee tehokas työkalu SAR-analyysiin. On huomattava, että on olemassa erilaisia molekyylikuvauksia, joita voitaisiin käyttää kemiallisen tilan kartoittamiseen .
Kemiallinen tilakartoitus epigenetiikassa
tämä on yksi DIFACQUIMIN tutkimusryhmän päätutkimuslinjoista. Vuonna 2015 ryhmämme raportoi DNA-metyylitransferaasi 1: n (DNMT1) estäjien kattavan luonnehdinnan, mukaan lukien kemiallinen tila, monimuotoisuus, SAR ja telineanalyysi . Vuotta myöhemmin tutkimus laajennettiin koskemaan BET bromodomaiinia ja Histoni-deasetylaasin estäjiä, ja siinä keskusteltiin kaksiaktiivisten estäjien järkevän suunnittelun toteutettavuudesta . Seurantatyössä ryhmämme ehdotti, miten” saada älykäs ” suunnittelussa kemiallisia yhdisteitä, jotka vaikuttavat useita epigeneettisiä tavoitteita tutkimalla rakenne multiple-activity relationships (SMARt). Nykyinen toimintamme keskittyy dnmt3a ja dnmt3b chemoinformatic analysis. Odotamme, että näistä tutkimuksista saadaan relevanttia tietoa lääkkeiden järkevästä suunnittelusta näihin tavoitteisiin nähden.
äskettäin DIFACQUIM kehitti kaksi uutta yleistä menetelmää kemiallisen tilan tutkimiseen ja edustamiseen: tietokannan sormenjäljet ja ChemMaps.
tietokannan sormenjäljet
tietokannan sormenjäljet perustuvat Shannonin entropian käsitteeseen . Pohjimmiltaan tietokannan sormenjäljet on suunniteltu tiivistämään yhteen sormenjälkeen tietyn tietojoukon eniten edustetut kemialliset ominaisuudet . Kaksi on yksinkertaisimpia tietokantajäljennösten sovelluksia: 1) suurten kirjastojen kemiallisen tilan visuaalinen esitys ja 2) virtuaalinen seulonta. Esimerkiksi tietokantojen sormenjälkiä on hiljattain sovellettu kuvaamaan 52 epigeneettisen kohteen kemiallista tilaa .
ChemMaps
rakenteisiin perustuvaa kemiallisen tilan visuaalista esittämistä pidetään laskennallisesti kalliina. Jotta asiaa voitaisiin lyhyesti selittää, monet näistä lähestymistavoista vaativat laskemaan pareittain samankaltaisuuden matriisin, joka nopeasti johtaa kombinatoriseen räjähdykseen, kun kartoitettavien yhdisteiden määrä kasvaa. Ongelman ratkaisemiseksi ryhmässämme kehitettiin ChemMaps . Yhdellä silmäyksellä tämä menetelmä hyödyntää käsitettä” kemialliset satelliitit”, jotka ovat molekyylejä, joita käytetään viite. Lopuksi lasketaan jokaisen molekyylin yhtäläisyydet pelkistettyä satelliittijoukkoa vastaan, mikä vähentää huomattavasti tehtävän monimutkaisuutta. ChemMaps on parhaan tietomme mukaan ensimmäinen algoritmi, joka valitsee satelliitit kartoitettavan kemiallisen kirjaston sisältä ja tarjoaa siten aikaisempia menetelmiä paremman sopeutumiskyvyn.
esimerkki: AKT: n estäjien aktiivisuusmaisema ja monimuotoisuus
joidenkin ”SAR using the concept of activity landscape modeling” – osiossa ja ”Chemical space and diversity analysis” – osiossa mainittujen menetelmien havainnollistamiseksi tarkastellaan CHEMBLISTÄ saatuja AKT: n estäjien aineistoja . AKT on lupaava kohde syöpälääkkeiden kehityksessä, ja ryhmämme on aiemmin osallistunut uusien kemiallisten telineiden tunnistamiseen rakennepohjaisen virtuaaliseulonnan avulla . CHEMBLISTÄ saatujen AKT-estäjien aineiston tiheyskartta SAS on esitetty kuvassa. 3a. tiheyden SAS-kartan säiliöiden väri kuvaa niiden yhdisteparien määrää, jotka kuuluvat kuvaajan vastaavaan alueeseen . Huomaa tontin oikeassa yläkulmassa aktiivisuuskalliot, ts.yhdisteparit, joilla on suuri rakenteellinen samankaltaisuus, mutta suuret erot myös voimakkuudessa.Kuva 3b kuvaa saman kirjaston kemiallista tilaa. CHEMBLISTÄ saatujen AKT-estäjien aineiston kemiallinen tila kartoitettiin samankaltaisuusmatriisin pääkomponenttianalyysin kahdella ensimmäisellä eigenvektorilla. Yhdisteryppäät tunnistettiin k-means-ryhmittelyllä kuudella ensimmäisellä eigenvektorilla, jotka keräsivät noin 40% kokonaisvarianssista. Vertaa SAS karttoja klustereita 2 ja 5 Kuvassa. 3c, d, vastaavasti. Klusterissa 5 on vähemmän toimintakallioita ja kaiken kaikkiaan tasaisempi SAR kuin klusterissa 2. Siksi ennen joidenkin ennustemallien soveltamista voitaisiin harkita yhdisteiden poistamista ryppäissä, joissa on epäsäännöllisempi SAR-arvo (kuten klusteri 2). Tällainen lähestymistapa on nimeltään ”Activity landscape lakaistaan” ja on edelleen kuvattu .
tutkikaamme nyt Fig: n viiden klusterin täydellistä monimuotoisuutta. 3 käyttämällä CDP: tä. Puman avulla lasketaan kullekin klusterille fysikaalis-kemiallisten ominaisuuksien euklidiset etäisyydet (PCP), parwisen sormenjäljen samankaltaisuuden mediaani (maccs-näppäimillä ja Tanimoto-kertoimella) ja tukirangan palautumiskäyrän alla oleva alue. Näillä tiedoilla voimme täyttää CDP-mallin, joka on saatavilla sovelluksen verkkosivuilla. Lopuksi, teemme CDP ja muokata juoni. Tulos näkyy kuvassa. 4, jossa jokainen piste edustaa klusteria, pisteen koko on verrannollinen yhdisteiden lukumäärään klusterissa, väri on suhteessa tietokannan sisäiseen PCP – keskiarvoon Euklidiseen etäisyyteen, X-akseli edustaa MACC: n parivivahteisen samankaltaisuuden mediaania ja Y-akseli edustaa rakennustelineen palautumiskäyrän alaista aluetta. Se on nähtävissä Fig. 4 että klusteri 5 on myös vähiten erilaisia, mikä voisi selittää, ainakin osittain, pienempi osuus toiminnan kallioita. Sen sijaan klusteri 1 on monipuolisin. Tarkastelemalla tuloksia viikunoissa. 2 ja 3 voidaan suositella, että saadaan kokeellisia tuloksia monimuotoisemmista yhdisteistä, jotka liittyvät klusterin 5 molekyyleihin. Klusteri 5: n yhdisteet soveltuisivat kuitenkin paremmin ennakoiviin lähestymistapoihin, koska niiden SAR-arvo on sileä.