Agentic AI / Generative AI

핵융합과 암 치료 혁신을 이끄는 AI co-scientist 

Reading Time: 5 minutes

AI는 과학 연구와 혁신의 방식을 근본적으로 바꾸고 있습니다. 과학자들은 AI를 활용해 과학 데이터를 생성하고, 요약하며, 통합하고, 분석할 수 있습니다. AI 모델은 인간 연구자가 놓친 데이터 속 패턴을 발견하거나, 겉보기에 무관해 보이는 분야와 현상 사이의 연결고리를 찾아내며, 검증 가능한 새로운 가설을 제안하기도 합니다.

AI co-scientist는 새로운 과학적 가설, 연구 제안서, 실험 계획을 생성하고 검토하며 정교화하는 데 있어 인간 연구자를 지원하도록 설계된 협업형 다중 에이전트 AI 시스템입니다. 이는 고도화된 추론 능력, 학제 간 지식 통합, 반복적 피드백을 기반으로 과학적 발견을 가속화하는 가상 연구 파트너입니다. 실험을 설계하고, 데이터를 분석하며, 인간 전문가와 함께 결과를 검증함으로써 엄밀하고 재현 가능한 연구를 가능하게 합니다.

거대 언어 모델(LLM)은 텍스트 기반 및 비텍스트 기반의 지식과 데이터를 바탕으로 맞춤화됩니다. AI co-scientist는 이러한 지식을 활용해 새로운 가설을 생성하고, 이를 검증하기 위한 시뮬레이션을 수행하는데요. 이 과정에서 인간의 개입과 협업은 필수적입니다.

이번 글에서는 NVIDIA가 이러한 AI co-scientist를 어떻게 지원하고 있는지를 살펴봅니다. 특히 Los Alamos National Laboratory(LANL)에서 개발 중인 두 개의 에이전트를 소개하며, 각각 과학계의 가장 어려운 과제 중 두 가지인 관성 밀폐 핵융합(ICF) 가설 생성과 암 치료 문제를 해결하기 위해 어떻게 활용되고 있는지를 조명합니다.

ICF 가설 생성을 위한 AI co-scientist

LANL과 NVIDIA는 ICF 핵융합 가설 생성을 위한 AI co-scientist 개발을 위해 다단계 협업 프로세스를 진행하고 있습니다.

핵융합은 별의 에너지원이 되는 과정이며, 지구상에서 이를 통해 에너지를 얻는 것은 인류가 직면한 가장 위대한 과학적 도전 중 하나입니다. 관성 밀폐 핵융합(ICF)은 레이저와 같은 고출력 에너지원을 이용해 연료가 담긴 작은 펠릿을 급격히 압축하고 가열하여, 원자핵이 융합하고 에너지를 방출하도록 만드는 방식입니다. ICF는 또한 목성과 같은 천체 내부에 존재하는 특이한 물질의 특성을 이해하거나 국가 안보 목적으로도 활용됩니다.

ICF는 강하게 결합된 다중 물리계(multiphysics)에 비선형성이 더해진 매우 복잡한 문제이기 때문에, 대규모 시뮬레이션 코드의 예측 가능성을 확보하는 것이 여전히 큰 과학적 도전 과제로 남아 있습니다. 이 복잡성은 ICF가 여러 물리 현상을 시뮬레이션해야 하며, 이들이 서로 예측 불가능한 방식으로 상호작용하고, 매우 다양한 시간 및 공간 척도에서 작동하기 때문에 발생합니다. 대형 레이저 시설에서 수행되는 실험 결과는 초기 조건이나 타깃 설계 파라미터의 선택에 따라 예측과 다르게 나타날 수 있습니다. 이러한 이해와 발전을 가속화하려면, AI를 포함한 모든 가용 도구를 적극적으로 활용하는 것이 필수적입니다.

그림 1. NVIDIA와 LANL은 ICF 핵융합 가설 생성을 위한 AI co-scientist를 개발 중입니다. 이 과정은 AI 에이전트 학습, 가설 생성 및 검증, 시뮬레이션 실행, 과학적 결과 검증 단계를 포함합니다.

프로세스의 첫 번째 단계에서 LANL은 오픈소스 NVIDIA NeMo 프레임워크 라이브러리를 활용하고 있으며, 주요 구성 요소는 다음과 같습니다:

  • NeMo Curator: 데이터 선별 및 정제
  • NeMo 2.0: 지속적인 사전학습 및 파인튜닝
  • NeMo RL: Llama Nemotron Super 1.5 모델에 대한 강화 학습 수행. 이 모델은 특정 도메인에 대한 추론 능력을 갖춘 AI로 발전하게 되며, 신뢰할 수 있는 AI co-scientist 구축의 기반이 됩니다.

그림 2는 Llama Nemotron Super 1.5를 ICF 물리 기반 추론 모델로 전환하는 과정을 보여줍니다. 이 과정은 도메인 적응 사전학습(DAPT), 지도 학습 기반 파인튜닝(SFT), 그리고 공개 데이터셋과 CORE, arXiv, OSTI.gov에 있는 물리 및 ICF 관련 공개 문서를 활용한 추론 기록(reasoning trace) 생성까지 포함합니다.

모델이 ICF 분야에 대한 전문 지식을 갖추고 있는지를 검증하기 위해, 전문가가 생성한 질문을 포함한 학술 벤치마크와 커스텀 벤치마크를 활용하고 있습니다.

그림 2. Llama Nemotron Super 1.5를 ICF 물리 기반 추론 모델로 전환하는 데 포함되는 단계들

이 연구의 궁극적인 목표는 National Ignition Facility와 OMEGA 레이저에서 진행 중인 ICF 붕괴 실험의 성능 향상을 포함해, 핵융합 연구에서 가장 어려운 문제들 중 일부를 해결하는 데 있습니다. 이를 위해 과학적 개념을 정립하고, 이를 계산 시뮬레이션 및 실제 실험과 비교해 검증하는 과정이 수반됩니다.

AI co-scientist는 실험 결과에서 얻은 피드백을 설계 개선에 반영함으로써, 현재와 차세대 ICF 시설에서 수행될 새로운 실험에 필요한 인사이트를 제공합니다. 이를 통해 보다 효율적이고 신뢰할 수 있는 핵융합 에너지 솔루션으로 나아가는 길을 열고, 물질의 근본적인 특성과 국가 안보와 관련된 핵심 과제들에 대해서도 해답을 모색할 수 있습니다.

암 치료를 위한 AI co-scientist

표적 알파 치료(TAT)는 방사성 원소를 정확하게 전달할 수 있을 경우 매우 효과적인 암 치료법이 될 수 있습니다. 이 방사성 원소들은 고에너지의 알파 입자를 방출해 주변의 암세포를 파괴합니다. 하지만 표적 전달이 정밀하지 않을 경우, 이러한 강력한 방사선이 건강한 조직까지 손상시켜 예상치 못한 부작용을 초래할 수 있습니다.

이러한 부작용을 최소화하기 위해, TAT에서는 방사성 원소를 종양 부위로 운반하는 특수 킬레이트 분자(chelator molecule)에 의존합니다. 그러나 생물학적으로 복잡한 환경에서도 안정성과 선택성을 유지할 수 있는 효과적인 킬레이트를 설계하는 것은 여전히 큰 연구 과제입니다.

TAT에 사용되는 금속 원소들은 원자 반지름이 크기 때문에, 이들과 안정적으로 결합하는 분자는 매우 제한적입니다. 이로 인해 새로운 치료제를 설계하는 데 있어 데이터 기반 접근법을 적용하는 데 어려움이 따릅니다.

LANL은 생성형 AI와 시뮬레이션을 단일 워크플로우에 통합한 에이전트 기반 AI 발견 플랫폼을 구축하고 있으며, 이를 통해 새로운 킬레이트 분자를 식별하고 개선하는 연구를 진행 중입니다. 방대한 화학 구조 공간을 빠르게 탐색함으로써, 이 연구는 더욱 안전하고 효과적이며 정밀한 치료법 개발을 앞당기고 있습니다.

AI는 “좋은 분자의 조건은 무엇인가?”, “어떤 분자가 이러한 특성을 갖는가?”와 같은 핵심 설계 질문에 답하는 데 있어 핵심 역할을 하는데요. 이를 위해 LANL은 NVIDIA Llama Nemotron Super 1.5GenMol 모델을 분자 발견과 최적화에 초점을 맞춰 커스터마이징했습니다.

그림 3. 특수 목적의 킬레이트 분자를 설계하기 위한 NVIDIA 기반 워크플로우

워크플로우 개요

이 워크플로우에서 에이전트는 가설 생성을 위해 Llama Nemotron Super 1.5를 활용합니다. 가설 생성은 문제에 대한 설명과 이전에 테스트한 가설 목록을 LLM에 제공하는 방식으로 진행되며, LLM은 축적된 지식과 과거 가설에 대한 평가를 바탕으로 다음 탐색 단계에서 가장 유망한 가설을 식별합니다.

이후 GenMol을 사용해 해당 가설을 테스트할 분자 세트를 생성합니다. GenMol은 기존 의약품과 유사한 분자를 생성하며, LLM의 가설에서 명시된 특성이나 과학자의 설계 요구사항에 따라 특정 과학적 기준을 만족하도록 조정할 수 있습니다.

다음 단계에서는 Architector를 이용해 킬레이트 분자와 방사성 원소 간의 화학 복합체를 구성합니다.

이후 워크플로우는 LANL의 NVIDIA 기반 슈퍼컴퓨터 Venado에서 수행되는 계산 모델링 단계로 전환됩니다. 고성능 양자 시뮬레이션을 통해 3D 분자 구조를 설계하고, 핵심 화학적 특성을 예측합니다.

최종적으로 이 시뮬레이션 데이터를 활용해 LLM이 제안한 가설의 타당성을 평가하고, 다음 단계의 의사결정에 반영합니다. 이 모든 도구는 최적의 성능 설정을 자동으로 선택해주는 NIMs(NVIDIA Inference Microservices) 형태로 패키징되어 있습니다. 가속 컴퓨팅을 통해 과학자들은 가설과 생성된 데이터 간의 순환 고리를 신속히 반복하며, 설계와 시뮬레이션을 빠르게 이어갈 수 있습니다.

이러한 워크플로우를 활용해 LANL과 NVIDIA의 공동 연구팀은 이미 Actinium 원자에 대해 결합 에너지가 개선된 분자들을 발견했습니다. 가설 기반 설계는 최적 분자 식별 속도를 높이고, 이들이 특히 유용한 이유가 되는 특성을 밝혀냅니다. 이 접근 방식은 AI와의 협업을 보다 효과적으로 수행할 수 있도록 설계 프로세스를 유연하게 만들며, 유망한 분자 후보의 정제 과정 또한 지원합니다.

이번 연구는 실제 응용이 가능한 새로운 분자를 설계하기 위한 전환점이자 출발점이 되는 성과입니다. 킬레이트 분자는 암 치료뿐만 아니라 중독의 신속한 치료, 금속의 효율적 정제, 그 외 다양한 화학적 응용에도 매우 유용하기 때문에, 그 파급력은 상당히 클 것으로 기대됩니다.

향후에는 이러한 기술의 실현 가능성, 약물 전달 시스템과의 통합, 잠재적 안전성 문제 등에 대한 평가에 중점을 둘 예정입니다.

“Los Alamos National Laboratory는 NVIDIA와 함께 연구 현장에서 AI co-scientist의 설계 및 실용화를 선도하고 있습니다.”라고 Simulation, Computing, and Theory 부문 부소장 Mark Chadwick는 말했습니다. “이러한 co-scientist는 복잡한 분야 전반에 걸쳐 빠른 가설 생성과 검증을 가능하게 합니다. 우리는 NVIDIA의 AI 역량과 도메인 전문 지식을 결합하여, 인류가 직면한 가장 중대한 과제들을 해결하기 위한 목적 지향형 AI co-scientist를 구축하고 있습니다.”

이번 연구는 미국 에너지부 산하 과학청 사용자 시설인 National Energy Research Scientific Computing Center(NERSC)의 Perlmutter 슈퍼컴퓨터 자원을 활용해 수행되었습니다.

AI co-scientist 구축 시작하기

과학적 발견에 AI를 활용하면 핵심 평가를 가속화하고, 개발 주기를 단축하며, 더 깊이 있는 과학적 통찰을 그 어느 때보다 빠르게 얻을 수 있습니다. 나만의 AI co-scientist 구축을 시작하려면, NVIDIA NeMoNemotron을 살펴보시기 바랍니다.

감사의 말씀

Ping Yang, Danny Perez, Logan Augustine, Pascal Grosset, Jiyoung Lee, Thomas Summers, Michael Taylor, Radha Bahukutumbi, David D. Meyerhofer의 기여에 감사드립니다.

Discuss (0)

Tags