Generative AI

높은 처리량의 AI 기반 신약 개발 파이프라인

Reading Time: 4 minutes

신약 발견에 AI를 접목하면서 연구자들이 다양한 질병에 대한 새로운 치료법을 개발하는 방식이 혁신적으로 변화하고 있습니다. 기존의 방식은 시간과 비용이 많이 드는 경우가 많으며, 신약을 시장에 출시하는 데 최대 15년이 걸리고 1~2억 달러의 비용이 소요됩니다.

이제 연구자들은 AI와 첨단 계산 도구를 사용하여 신약 발굴을 가속화함으로써 신약 개발 프로세스에 소요되는 시간과 비용을 크게 줄일 수 있습니다.

기존 신약 개발의 과제

기존의 신약 개발 워크플로우에서는 연구자들이 먼저 질병 진행에 관여하는 단백질과 같은 생물학적 표적을 식별한 다음, 이 표적을 조절할 수 있는 분자를 검색합니다. 생물학적 시스템의 복잡성과 약 1060개로 추정되는 방대한 수의 잠재적 화학 구조가 결합되어 있어 이 과정은 매우 어려운 작업입니다.

기존의 컴퓨터 지원 신약 개발(CADD) 방법은 약물과 표적 간 상호작용의 복잡성을 포착하지 못하는 단순화된 모델과 가정에 의존하는 경우가 많아 임상시험에서 높은 탈락률을 초래합니다.

가상 스크리닝을 위한 AI 기반 접근 방식

Innoplexus는 NVIDIA Inception에 등록된 스타트업입니다. Innoplexus의 독점적인 딥 러닝 방법은 NVIDIA NIM 마이크로서비스를 사용하여 신약 개발 프로세스를 간소화합니다. 또한 다음과 같은 구성 요소를 갖춘 NVIDIA H100 GPU 클러스터를 사용합니다:

  • 가속기: NVIDIA H100 텐서 코어 GPU
  • 메모리: 80GB HBM3(고대역폭 메모리)
  • 상호 연결: NVIDIA NVLink 4.0
  • 클러스터 구성: 분산 트레이닝 및 추론을 위한 고속 인터커넥트를 갖춘 확장 가능한 멀티노드 클러스터

이 접근 방식은 생성형 가상 스크리닝을 위한 NVIDIA NIM Agent Blueprint를 기반으로 하며, 이는 분자 시뮬레이션 가속화를 위한 새로운 분자 구조의 신속한 AI 기반 생성 및 NIM 마이크로서비스와의 도킹을 가능하게 합니다.

Innoplexus의 전문성과 NVIDIA의 최첨단 AI 기술을 결합하면 혁신적인 치료법을 발견하고 시장에 출시하는 방식을 근본적으로 변화시켜 이 과정을 더 빠르고, 더 효율적이고, 더 정밀하게 만들 수 있습니다.

Innoplexus는 TDP-43 응집과 관련된 신경 퇴행성 질환에 대한 새로운 치료법의 시급한 필요성을 해결하기 위해 AI 기반 신약 개발 파이프라인을 개발했습니다.

Innoplexus의 딥러닝 방식

Innoplexus의 방법은 단백질 서열, 구조 정보, 분자 상호작용에 대한 대규모 데이터 세트를 학습한 맞춤형 인공 신경망(ANN)을 사용하여 단백질 표적 예측을 수행합니다.

그림 1. NVIDIA NIM 마이크로서비스를 사용한 구조 및 리간드 기반 신약 개발을 위한 워크플로우

Innoplexus는 다음과 같은 NVIDIA NIM 마이크로서비스를 사용합니다:

  • 단백질 구조 예측을 위한 AlphaFold2
  • 최적화된 리드 생성을 위한 MolMIM
  • 분자 도킹을 위한 DiffDock

이러한 고급 AI 툴을 결합함으로써 Innoplexus는 신약 개발 프로세스를 간소화하고 TDP-43을 효과적으로 타겟팅하고 이러한 쇠약성 질환의 진행을 완화할 수 있는 유망한 후보를 식별하는 것을 목표로 합니다. 이 혁신적인 접근 방식은 새로운 치료법 개발을 가속화하고 신경 퇴행성 질환에 걸린 환자들의 삶을 개선할 수 있는 잠재력을 가지고 있습니다.

단백질 구조 예측을 위한 AlphaFold2

사용자가 제공한 단백질 서열은 AlphaFold2 NIM 마이크로 서비스를 통해 처리되어 표적 단백질의 3D 구조를 정확하게 결정합니다. 이 단계에서는 서열을 알려진 단백질과 정렬하는 과정이 포함되며, 정확도를 높이기 위해 다양한 정렬 구성을 제공합니다.

그림 2. 아미노산 서열로부터 단백질의 3D 구조를 예측하는 AlphaFold2

최적화된 리드 생성을 위한 MolMIM

초기 화학 구조는 약물 유사성(QED), 용해도(페널티 로그 P) 및 분자 유사성과 같은 특정 특성에 최적화된 새로운 분자 구조를 생성하는 MolMIM NIM 마이크로서비스를 통과합니다.

생성된 분자는 요구 사항에 따라 여러 주기에 걸쳐 반복적으로 최적화됩니다.

분자 도킹을 위한 DiffDock

분자 도킹은 약물이 결합하는 표적 단백질의 최적 부위를 결정하는 데 도움이 됩니다. 최적화된 분자와 표적 단백질 구조는 단백질에 대한 분자의 결합 위치를 예측하는 DiffDock에 의해 처리됩니다.

포즈의 수와 기타 도킹 제약 조건을 정의하여 잠재적인 약물-표적 상호 작용을 종합적으로 분석할 수 있습니다.

그림 3. 분자가 단백질과 어떻게 상호작용하는지에 대한 3D 구조를 예측하는 Diffdock

후처리 ADMET 파이프라인

DiffDock 이후에는 분자의 약동학 및 약력학 특성을 평가하는 독점적인 ADMET(흡수, 분포, 대사, 배설 및 독성) 파이프라인을 사용하여 상위 1K 개의 저분자를 추가로 스크리닝합니다.

이 파이프라인에는 다음과 같은 구성 요소가 포함되어 있습니다:

  • ADMET 예측: 독점 모델은 용해도, 투과성, 대사 및 독성을 포함한 분자의 ADMET 특성을 예측합니다.
  • 필터링 및 순위 지정: 예측된 ADMET 특성에 따라 분자를 필터링하고 순위를 매겨 가장 유망한 후보 물질만 추가 개발을 위해 선택되도록 합니다.

Innoplexus ADMET 모델

ADMET 모델은 대규모 분자 구조 데이터 세트와 해당 ADMET 특성을 사용하는 맞춤형 설계 신경망입니다.

이 모델은 고급 기술을 사용하여 학습됩니다:

  • 멀티태스크 학습: 이 모델은 여러 ADMET 작업을 동시에 학습하여 전반적인 성능과 정확도를 향상시킵니다.
  • 전이 학습: 모델은 대규모 분자 구조 데이터 세트에 대해 미세 조정되어 보이지 않는 새로운 분자에 대해서도 잘 일반화할 수 있습니다.

워크플로우 최적화

파이프라인이 성능에 최적화되어 있습니다:

  • 데이터 병렬 처리: 여러 GPU와 노드에 걸쳐 분산된 트레이닝 및 추론.
  • 모델 병렬 처리: 대규모 모델을 여러 GPU와 노드에 걸쳐 분할.
  • 파이프라인 병렬 처리: 파이프라인 단계 간의 중복 계산 및 통신.
그림 4. GPU 가속 컴퓨팅으로 빠르고 효율적인 컴퓨팅 집약적 작업 가능

GPU의 적용과 가속 컴퓨팅을 위한 접근 방식은 이 솔루션의 컴퓨팅 집약적인 작업을 빠르게 수행하고 실제 일정 내에 완료하는 것을 가능하게 했습니다.

실제 적용 사례 및 시사점

NVIDIA H100 클러스터로 구동되는 Innoplexus의 AI 기반 파이프라인을 통한 신속한 화합물 식별은 분자 도킹과 더불어 생성된 분자의 가상 스크리닝을 최대 10배까지 가속화하여 연구자들이 다음과 같은 작업을 수행할 수 있게 해줍니다:

  • 580만 개의 작은 분자를 5~8시간 내에 스크리닝합니다.
  • 백만 개의 화합물에 대해 몇 시간 내에 ADMET 프로파일링을 통해 치료 가능성이 높은 상위 1%의 화합물을 식별합니다.
  • 90%의 정확도로 리드 화합물을 최적화하세요.
  • AI와 고성능 컴퓨팅의 힘을 활용하여 방대한 화학 공간을 빠르게 탐색하고 유망한 치료제 개발 후보를 정확히 찾아내어 신약 개발 프로세스를 크게 가속화할 수 있습니다.

시작하기

AI와 고성능 컴퓨팅은 신약 개발 분야를 혁신하여 잠재적인 신약 후보를 더 빠르고 정확하게 식별할 수 있게 해줍니다.

최첨단 신경망 알고리즘, 생성 모델 및 고급 분자 도킹 기술을 결합한 Innoplexus 가상 스크리닝 파이프라인은 신약 발견을 가속화하여 궁극적으로 환자 치료 결과를 개선하고 새로운 치료법을 시장에 출시하는 데 드는 비용과 시간을 단축하는 강력한 툴을 제공합니다.

생성적 가상 스크리닝을 위한 NVIDIA NIM Agent Blueprint를 시작하고 Innoplexus에 대해 자세히 알아보세요.

관련 리소스

Discuss (0)

Tags