화학 정보학:라틴 아메리카의 학문적 환경에서 관점

화학 정보학에 종사하는 다른 학술 그룹과 마찬가지로,디파큄에서 수행 된 연구 활동은 그림 1 에 개략적으로 설명 된 두 가지 주요 그룹으로 구성 될 수 있습니다. 1:(1)개념의 개발 또는 개선,그리고(2)사내 또는 다른 그룹에 의해 개발 된 방법의 응용.

차례로 개발 된 개념과 방법은 다음과 같이 세분화 될 수 있습니다: (1)구조–활동 관계에 대 한 방법(특별 행정구),특히 활동 풍경 모델링의 개념을 사용 하 여(알);(2)오픈 액세스 응용 프로그램(현재 수집 된 디-도구,적외선);화학 데이터베이스를 탐색 하 고(3)화학 공간 및 화학 라이브러리의 다양성의 분석.

그림. 2
그림 2

디-도구:합의 다양성 플롯;비 활동 풍경 플로터; 통합 분자 분석 플랫폼(푸마)

응용 프로그램은 다섯 가지 주요 영역에 초점을 맞추고 있습니다:(1)에피 정보학,즉,후성 유전학에 적용되는 화학 정보 방법;(2)전염성 질병에 적용되는 전산 방법;(3)펩타이드 기반;(4)천연 제품 기반 약물 발견;그리고(5)식품 정보학,즉,향료와 향료로 확장 된 식품 화학에 대한 화학 정보 접근법(그림 1). 1). 다음 하위 섹션에서는 이러한 영역에 대해 설명합니다.신약발달은 유사성 원리가 주어진 데이터세트에 효과적으로 적용되는지 여부를 평가하는 데 도움이 된다. 유사성 원리는 구조적으로 유사한 화합물이 더 유사한 특성을 가질 것이라고 말합니다. 이것은 화학 구조를 기반으로 한 예측 모델이 의존하는 강력한 가정입니다. 활동 풍경에서 통찰력 하나 이상의 목표를 향해 화합물의 활동에 관련 된 구조적 모티프를 찾을 약 화학에서 악용 될 수 있습니다. 알름의 이론과 응용은 디파큄 및 다른 연구 그룹에 의해 광범위하게 개발되었습니다. 이 지도는 산무가순다람과 마조라가 활동 절벽을 시각적으로 감지하고 특별 행정구를 평가하기 위해 제안한 것이다. 이 지역의 최근 개발 예로는 밀도 지도와 활동 풍경 청소가 있으며 다음에 논의됩니다.

밀도 맵은 화학 데이터 집합의 모든 쌍을 이루는 구조–활동 비교를 묘사한다면,상대적으로 작은 데이터 집합의 경우에도 압도적 인 수의 데이터 포인트(각 데이터 포인트는 쌍별 비교를 나타냄)는 맵에서 영역을 결정하는 시각적 평가를 어렵게 만들 수 있습니다. 여기서 동일한 표면의 작은 영역은 포함된 데이터 요소 수(즉,쌍별 비교)에 따라 색상이 지정됩니다. 이 접근 방식은 나중에 온라인 서버에서 도입되고 구현되었습니다(“활동 풍경 플로터(알프)”섹션 참조).

활동 풍경 청소

흥미롭게도 일부 데이터 세트에서 활동 절벽의 기여도는 일부 하부 구조 클러스터 내에서 불균형 적으로 높습니다. 이러한 결과는 예측 모델링에 더 적합 할 수있는 화학 공간에서 더 부드러운 특수 행정구(즉,유사한 화합물이 유사한 활성을 가짐)가있는 영역을 가리 킵니다. 활동 풍경 청소 뒤에 아이디어는 개별적으로 이러한 클러스터의 특별 행정구 및 라이브러리의 전반적인 특별 행정구에 기여를 연구 하기 위해 구조적 유사성을 통해 정의 된 화합물의 클러스터를 분석 하는. 활동 풍경 청소의 예는”예:활동 풍경 및 활동 억제제의 다양성”섹션에 나와 있습니다.

온라인 도구:디파큄 화학정보학을 위한 도구

디파큄이 개발한 공개적으로 접근할 수 있는 도구는 총칭하여”디-도구”로 명명되었다. 디 툴의 일반적인 목적은 분자 특성 및 분자 지문을 계산하고,화학 공간의 범위와 다양성을 분석하고,활동 풍경 모델링의 원리를 사용하여 선별 데이터 세트의 특별 행정구를 탐색 할 수있는 온라인 리소스를 자유롭게 제공하는 것입니다. 이 응용 프로그램은 사용자의 책임입니다. 자세한 내용은 각 출판물에 공개되어 있습니다. 최근,화학 라이브러리의 특별 행정구,명암,다양성의 분석을위한 많은 자원이 디 툴에 추가되었습니다. (1)컨센서스 다이버시티 플롯,(2)액티비티 프리 플로터(알프),(3)통합 분자 분석 플랫폼(푸마)(그림. 2). 게시된 용도를 포함하여 각 응용 프로그램의 주요 기능 및 용도에 대해서는 다음 섹션에서 설명합니다.

컨센서스 다이버시티 플롯(2419>

컨센서스 다이버시티 플롯은 여러 화학 라이브러리 다이버시티 메트릭의 통합적 렌더링을 달성하기 위해 개발되었다. 즉,분자 지문,스캐 폴드,물리 화학적 특성 및 화합물의 수(라이브러리 크기)입니다. 그러나 다른 다양성 메트릭을 구현할 수 있습니다. (그림. 2 에이),각 데이터 세트는 데이터 포인트로 표시됩니다. 도트의 색상은 연속 스케일을 사용하여 물리화학적 특성 다이버시티를 나타내고,그 크기는 데이터 세트의 상대적인 크기를 나타냅니다. 더 자세한 정보는 에 나와 있습니다. 한 가지 구체적인 예는”예:활성 환경 및 활성 억제제의 다양성”섹션에 제시되고 도 1 에 도시되어 있다. 4. 앞서 언급 한 바와 같이,합의 다양성 플롯을 생성하기위한 온라인 응용 프로그램은 디 툴에서 사용할 수 있습니다.2965>

활동 풍경 플로터

활동 풍경 모델링의 개념을 사용하여 사스 분석을 목표로,알프 서버는 사용자가 자신의 스크리닝 데이터를 사용하여 사스 및 사스와 같은 맵을 생성할 수 있게 한다. 일반적으로 이러한 지도는 화학적 유사성(분자 지문으로 측정)과 화합물 쌍의 효능 차이 사이의 관계를 묘사합니다. 예를 들어,하나의 분자 표적에 대한 활성 값입니다. 이 지도는 구조상 유사성을 나타냅니다. 두 개의 생물학적 끝점을 가진 복합 데이터 세트의 특별 행정구는 이중 활동 차이(아빠)맵을 사용하여 분석 할 수 있습니다. 두 그래프에서 색상은 한 쌍의 화합물의 최대 효능 및 데이터 요소 수와 같은 정보를 플롯에 추가합니다. 참고로,분석 결과는 쌍 구조 활동 정보(사용자가 다른 도구를 사용하여 추가 분석을 수행하려는 경우 후자)와 모든 원시 데이터를 포함하여 무료로 다운로드 할 수 있습니다.

통합 분자 분석 플랫폼(푸마)

푸마는 사용자가 제공 한 데이터 세트의 화학 정보 기반 다양성 분석 및 화학 공간의 시각화를위한 무료 온라인 응용 프로그램입니다. 푸마는 메트릭을 통합하여 복합 데이터베이스(예:스캐 폴드 콘텐츠)를 특성화하고 화학적 다양성을 분석하며 화학적 공간을 시각화합니다. 푸 마는 오픈 액세스 되 고 다운로드 하 고 설치 하지 않아도 같은 장점이 있습니다. 응용 프로그램이 실행 된 후 사용자의 기밀성을 유지하기 위해,데이터 세트는 개발자가 유지되지 않습니다. 푸마는”컨센서스 다이버시티 플롯”과”액티비티 프리 플로터”섹션에서 간단히 설명한 알프스와 알프스를 통합합니다.

화학 공간 및 다양성 분석

화학 공간 항법이라고도하는 화학 촬영은 약물 발견 및 분류에 점점 더 관련성이 높아지고 있습니다. 조합 화학 도서관의 특성을 위해 처음에 고안되었지만 의약 화학의 다른 영역에서의 잠재력은 인정되었습니다. 주어진 데이터 집합에 대한 화학적 공간을 차트로 작성하면 데이터 집합의 다양성에 대한 중요한 통찰력을 제공하고 관련 화합물의 클러스터를 식별 할 수 있습니다. 활동 데이터와 결합하면 화학 공간은 특별 행정구 분석을위한 강력한 도구가됩니다. 화학 공간을 도표로 나타내기를 위해 사용될 수 있던 다양한 분자 설명자가 있다는 것을 주의되어야 합니다.

후성 유전학의 화학 공간 차트

이것은 디파큄 연구 그룹의 주요 연구 라인 중 하나입니다. 2015 년,우리 그룹은 화학 공간,다양성,특별 행정구 및 비 계 분석을 포함 하 여 억제제-메 틸 트랜스퍼 라 제 1 의 포괄적인 특성 보고. 1 년 후,이 연구는 브로 모도 메인과 히스톤 데 아세틸 라제 억제제를 내기 위해 확장되어 이중 활성 억제제의 합리적인 설계 가능성을 논의했습니다. 후속 작업에서 우리 그룹은 구조 다중 활동 관계(스마트)를 탐색하여 여러 후성 유전 학적 표적에 대해 작용하는 화학 화합물의 설계에서”스마트하게”하는 방법을 제안했습니다. 현재 우리의 노력은 화학 정보 분석에 초점을 맞추고 있습니다. 우리는 이러한 연구가 이러한 목표에 대한 합리적인 약물 설계에 대한 관련 통찰력을 제공 할 것으로 기대합니다.

그림. 3
그림 3

활동 풍경 스위핑의 예는 억제제의 라이브러리에 적용. 본 연구실에서는 전체 라이브러리의 화학공간,주성분 분석을 통해 얻은 화학공간,클러스터에 의해 채색된 화학공간,클러스터에 의한 클러스터링,클러스터에 의한 클러스터링,클러스터에 의한 클러스터링,클러스터에 의한 클러스터링,클러스터에 의한 클러스터링,클러스터에 의한 클러스터링,클러스터에 의한 클러스터링,클러스터에 의한 클러스터링,클러스터에 의한 클러스터링,클러스터에 의한 클러스터링,클러스터에 의한 클러스터링,클러스터에 의한 클러스터링,클러스터에 의한 클러스터링,클러스터에 의한 클러스터링,클러스터에 의한 클러스터링,클러스터에 의한 클러스터링,5

데이터베이스 지문 및 켐 맵:최근,두 개의 새로운 일반적인 방법은 화학 공간을 탐구하고 표현하기 위해 디파 킴에 의해 개발되었다.

데이터베이스 지문

데이터베이스 지문은 섀넌 엔트로피의 개념을 기반으로 합니다. 기본적으로 데이터베이스 지문은 주어진 데이터 세트에서 가장 많이 표현되는 화학적 특징을 단일 지문으로 요약하도록 설계되었습니다. 두 데이터베이스 지문의 가장 간단한 응용 프로그램입니다:(1)대형 라이브러리의 화학 공간의 시각적 표현,과(2)가상 심사. 예를 들어,데이터베이스 지문은 최근 52 개의 후생 유전 학적 표적의 화학적 공간을 나타 내기 위해 적용되었습니다.

켐맵

구조적 특징에 기초한 화학적 공간의 시각적 표현은 계산상 비용이 많이 드는 것으로 간주된다. 간단 하 게 문제를 설명 하기 위해 이러한 접근 방식의 많은 차트로 화합물의 수가 증가 함에 따라 조합 폭발에 급속 하 게 리드 쌍으로 유사성 행렬을 계산 해야 합니다. 이 문제를 해결하기 위해 우리 그룹에서 켐맵이 개발되었습니다. 한 눈에,이 방법은 참조로 사용되는 분자 인”화학 위성”의 개념을 이용합니다. 마지막으로,쌍 유사성 따라서 크게 작업의 복잡성을 감소,위성의 감소 된 집합에 대 한 모든 분자에 대 한 계산 됩니다. 켐맵은 우리가 아는 한,차트로 작성되는 화학 라이브러리 내에서 위성을 선택하는 첫 번째 알고리즘이므로 이전 방법보다 높은 적응력을 제공합니다.

예:활동 풍경 및 활동 풍경 모델링의 개념을 사용 하 여 특별 행정구”섹션 및”화학 공간 및 다양성 분석”섹션에서 언급 하는 방법의 일부를 설명 하기 위해,우리는 화학 물질에서 얻은 활동 풍경 억제제의 데이터 집합을 고려 하자. 항암제는 항암제 개발에 유망한 목표이며,우리 그룹은 이전에 구조 기반 가상 스크리닝을 사용하여 새로운 화학 비계의 식별에 기여했습니다. 밀도 SAS 도의 데이터 세트의 AKT 억제물에서 얻은 ChEMBL 은 그림에 표시됩니다. 밀도 맵의 빈의 색상은 플롯의 각 영역에 속하는 화합물 쌍의 수를 나타냅니다. 플롯의 오른쪽 상단 영역 활동 절벽에 참고,즉,높은 구조적 유사성하지만 효능에 높은 차이와 화합물의 쌍,너무.그림 3 은 동일한 라이브러리의 화학적 공간을 나타냅니다. 화학물질으로부터 얻어진 악티트 억제제의 데이터 세트의 화학적 공간은 유사성 매트릭스의 주성분 분석의 두 개의 첫 번째 고유 벡터를 사용하여 매핑되었다. 화합물의 클러스터에 의해 확인되었다 케이-전체 분산의 약 40%를 모은 처음 6 개의 고유 벡터에서 클러스터링을 의미합니다. 그림 2 의 클러스터 2 와 5 의 클러스터 맵을 비교하십시오. 3 기음,디,각기. 클러스터 5 는 활동 절벽의 비율이 적고 전체적으로 클러스터 2 보다 부드러운 특별 행정구를 가지고 있습니다. 따라서 일부 예측 모델을 적용하기 전에 더 불규칙한 특수 행정구(예:클러스터 2)가있는 클러스터에서 화합물을 제거하는 것으로 간주 될 수 있습니다. 이러한 접근 방식은”활동 풍경 청소”라고하며 추가로 설명되어 있습니다.

그림. 4
그림 4

5 개의 데이터 세트(클러스터)에 적용되었습니다. 지문별 다이버시티(엑스-축)는 맥키 키/타니모토 유사성 행렬의 중앙값을 통해 계산되며,스캐 폴드 다이버시티(와이-축)는 순환 시스템 복구 곡선의 곡선 아래 영역을 나타냅니다. 두 지표 모두에 대해 낮은 값은 더 많은 다양성과 연결됩니다. 각 축에 대한 6 개의 데이터 집합의 해당 평균값을 고려하여 사분면으로 나누어집니다. 데이터 포인트의 크기는 화합물의 상대적인 수를 나타내는 반면,색상은 물리 화학적 특성의 유클리드 거리의 평균을 나타냅니다(붉은 색은 다양성을 덜 나타내고 녹색은 다양성을 더 나타냅니다). (컬러 그림 온라인)

우리가 지금 그림 5 클러스터의 총 다양성을 살펴 보자. 3 사용. 푸마와 함께,우리는 각 클러스터에 대한 물리 화학적 특성(주치의)의 유클리드 거리를 계산,쌍 지문 유사성의 중앙값(매크로 키 및 타니모토 계수를 사용하여)및 비계 복구 곡선 아래 영역. 이 데이터를 사용하여 응용 프로그램의 웹 사이트에서 사용할 수있는 템플릿을 채울 수 있습니다. 마지막으로,우리는 플롯을 렌더링하고 사용자 정의 할 수 있습니다. 결과는 그림 1 에 나와 있습니다. 4,각 점은 클러스터를 나타내는 경우,점의 크기는 클러스터 화합물의 수에 비례하고,색상은 데이터베이스 내 주치의 평균 유클리드 거리에 상대적이다,엑스-축은 맥킥스 쌍 유사성의 중앙값을 나타내고 와이-축은 스캐 폴드 복구 곡선 아래의 영역을 나타냅니다. 그것은 그림에서 볼 수 있습니다. 4 그 클러스터(5)는 또한 적어도 부분적으로,활동 절벽의 적은 비율을 설명 할 수있는,가장 다양하다. 반면 클러스터 1 은 가장 다양합니다. 무화과에 있는 결과를 고려해서. 2 및 3 클러스터 5 의 분자와 관련된보다 다양한 화합물의 실험 결과를 얻는 것이 좋습니다. 그러나 클러스터 5 의 화합물은 부드러운 특별 행정구를 감안할 때 예측 접근법에 더 적합합니다.

답글 남기기

이메일 주소는 공개되지 않습니다.