Data Center / Cloud

NVIDIA BioNeMo Agent Toolkit으로 생명과학 연구를 위한 AI 사이언티스트 구축하기

2026년 6월 26일

By Kyle Tretina, Mahan Salehi, Neel Patel and Kris Kersten

Reading Time: 6 minutes

AI 사이언티스트는 과학 컴퓨팅의 새로운 인터페이스로 부상하고 있습니다. 이러한 에이전트들은 논문을 읽고, 코드를 작성하며, 가설을 세우고, API를 호출할 뿐만 아니라 파일을 검사하고 결과를 반복적으로 보완할 수 있습니다. 그러나 과학은 소프트웨어 엔지니어링과 다릅니다. 가설이 맞았을 때 초록불이 켜지는 테스트 제품군 같은 것은 없으며, 무언가를 발견해내는 과정은 반복적이고 불확실하며 물리적 세계에 기반을 두고 있습니다. 일반적인 코딩 에이전트를 가져와 생물학에 적용한다고 해서 새로운 의약품이 만들어지기를 기대할 수는 없습니다. 바이오 분자 연구에서 AI 사이언티스트의 역량 상한선은 신뢰할 수 있고 정확하며 효율적으로 사용할 수 있는 과학적 도구에 의해 결정됩니다.

범용 에이전트는 단백질 구조 예측(protein folding), 분자 도킹(molecular docking), 분자 생성, 서열 설계, 다중 서열 정렬, 단백질 백본 생성, 게놈 모델링 중 어떤 것이 특정 작업에 적합한지 파악할 수는 있습니다. 하지만 어떤 AI 모델을 호출해야 하는지, 요청 형식을 어떻게 구성해야 하는지, 어떤 입력 매개변수가 중요한지, 어떤 결과물이 생성될지, 그리고 그 결과를 어떻게 해석해야 하는지 등을 아는 데에는 도움이 필요합니다.

NVIDIA BioNeMo는 모든 에이전트의 이러한 공백을 메워주는 플랫폼입니다. 이 플랫폼은 NVIDIA의 가속화된 디지털 생물학 스택을 AI 사이언티스트가 사용할 수 있는 도구로 전환해 줍니다.

가속화된 도구 계층: NVIDIA NIM과 BioNeMo 오픈 모델은 구조 예측, 도킹, 분자 생성, 서열 설계, 정렬/검색, 유전체학을 포함한 핵심 바이오 분자 기능을 최적화되어 호출 가능한 서비스로 제공합니다. 이러한 기능들은 단순히 NVIDIA 하드웨어에서 실행되는 것에 그치지 않고, cuEquivariance(구조 모델) 및 Parabricks(유전체학)와 같은 NVIDIA 라이브러리를 통해 가속화됩니다.
에이전트 준비형 인터페이스: NVIDIA BioNeMo Skills는 에이전트가 올바른 도구를 선택하고, 유효한 요청을 보내고, 결과를 읽을 수 있도록 각 기능을 문서화되고 호출 가능한 리소스로 패키징합니다. 이러한 도구에는 사용 목적, 필수 입력값, 선택적 매개변수, 예상 결과물, 실패 모드 등이 포함됩니다. Model Context Protocol(MCP) 서버 래퍼는 아직 NIM으로 패키징되지 않은 오픈 모델을 에이전트가 호출할 수 있는 동일한 패턴으로 노출해 줍니다.

이 글에서는 에이전트를 플랫폼에 연결하고, BioNeMo Skill을 활용해 모델을 구동하고, 모델의 실행 위치를 선택하고, 에이전트의 반복 루프가 실제로 개선되는지 측정하는 실습 과정을 안내합니다(아래 그림 1 참조). Skills는 모델을 에이전트 도구로 전환하는 가장 직접적인 방법이므로, 이 글에서 집중적으로 다룹니다.

사전 요구 사항

BioNeMo Agent Toolkit Skills 리포지토리(https://github.com/NVIDIA-BioNeMo/bionemo-agent-toolkit) 접근 권한 (Skills 및 NIM 레퍼런스 포함)
Claude 또는 Codex 등의 에이전트 런타임
호스팅된 BioNeMo NIM 엔드포인트를 위한 NVIDIA API 키
(선택 사항) 로컬 NIM 배포를 위한 GPU 노드

BioNeMo로 AI 사이언티스트 구축하기

1. 과학적 워크플로우 계획 수립

먼저 AI 사이언티스트가 수행할 워크플로를 정의합니다. 유용한 생체 분자 AI 사이언티스트는 모델을 선택하고, 유효한 입력을 준비하고, 실행하고, 출력을 검사하고, 과학적 주의 사항과 함께 결과를 설명할 수 있어야 합니다.

예를 들어, AI 사이언티스트는 다음과 같은 작업을 수행할 수 있습니다.

MMseqs2로 다중 서열 정렬(MSA Search) 생성
Boltz-2 또는 OpenFold3로 펩타이드(peptide) 서열 접힘 예측
GenMol로 분자 생성
DiffDock으로 단백질 표적에 리간드(ligand) 도킹

플랫폼은 각 단계에 대한 배포 가능한 모델 계층을 제공합니다. NIM은 구조 예측, 분자 생성, 도킹, 서열 분석, 설계, 유전체학(예: Evo 2와 Parabricks)을 포함한 생체 분자 AI 모델을 최적화된 호출 가능 서비스로 패키징하여 호스팅 엔드포인트나 로컬 인프라를 통해 실행합니다.

BioNeMo Skills는 이러한 서비스 위에 위치하여 각 역량을 에이전트가 사용할 수 있게 합니다. 모델의 목적, 필수 입력, 선택적 파라미터, 예상 산출물, 오류 유형을 기술하여 AI 사이언티스트가 적합한 도구를 선택하고, 유효한 요청을 준비하고, CIF, SDF, FASTA, A3M, SMILES 파일 등의 출력을 해석할 수 있도록 합니다.

2. 에이전트를 플랫폼에 연결하기

단일 엔드포인트가 아닌 탐색부터 시작하십시오. 에이전트를 https://github.com/NVIDIA-BioNeMo/bionemo-agent-toolkit로 연결하여, 에이전트가 행동하기 전에 사용 가능한 역량을 열거하고 플랫폼 구조를 파악할 수 있도록 합니다. 이후 관련 Skill(또는 아직 NIM으로 패키징되지 않은 오픈 모델의 경우 MCP 서버 래퍼)이 에이전트에게 특정 모델 사용 방법을 알려줍니다. 무엇을 하는지, 언제 사용하는지, 요청을 어떻게 준비하는지, 어떤 산출물을 기대하는지 등을 안내합니다.

BioNeMo Skill을 단순한 엔드포인트 래퍼가 아닌 에이전트 역량으로 다루십시오. 동일한 프롬프트 패턴이 플랫폼의 모든 모델에 적용됩니다.

3. 호스팅 또는 로컬 배포 선택

NIM은 팀에게 유연한 배포 옵션을 제공합니다. 인프라, GPU 스케줄링, 컨테이너 설정, 모델 웜업, 대규모 지원 데이터베이스를 관리하지 않고 빠르게 접근해야 하는 비프로덕션 코드에는 호스팅 NIM 엔드포인트를 사용하십시오. 이는 광범위한 에이전트 접근, 평가, 간헐적 호출, 또는 MSA 검색처럼 인프라 집약적 서비스에 의존하는 워크플로에 최적의 출발점입니다.

동일 모델에 반복 호출이 필요하거나, 낮은 웜 레이턴시(warm latency), 데이터 로컬리티, 또는 더 세밀한 런타임 제어가 필요한 워크플로에는 로컬 NIM 배포를 사용하십시오. 이는 후보를 생성하고, 출력을 검사하고, 파라미터를 조정하고, 여러 번 재실행하는 반복적인 에이전트 루프에 적합합니다.

실용적인 기준은 다음과 같습니다. 쉬운 접근과 확장성을 위해 호스팅으로 시작하고, 레이턴시, 처리량, 보안, 또는 반복 실행이 추가적인 운영 제어를 정당화할 때 선택한 모델을 로컬로 이전하십시오. 단일 GPU를 사용한 내부 테스트에서 적합한 모델을 로컬로 이전하면 반복 호출 워크플로의 웜 호출당 레이턴시가 줄어든 반면, 일회성 호출은 호스팅 엔드포인트가 가장 적합하였습니다.

Skill 또는 MCP 래퍼는 에이전트에게 모델이 사용 가능한 위치, 호출 방법, 기대하는 산출물을 알려줌으로써 두 경로를 모두 지원해야 합니다.

4. Skill을 통한 모델 사용

모든 BioNeMo Skill에 동일한 프롬프트 구조를 사용하십시오. 아래 예시는 OpenFold3를 사용하지만, Boltz-2, DiffDock, GenMol, ProteinMPNN, MSA Search, RFdiffusion, Evo 2, 그 외 생물학용 NIM에도 동일하게 적용됩니다.

호스팅 OpenFold3 NIM 엔드포인트의 경우:

Use the OpenFold3 BioNeMo Skill to fold MKTVRQERLKSIVR with the NVIDIA API
endpoint at https://build.nvidia.com/openfold3

로컬 OpenFold3 NIM 배포의 경우:

Use the OpenFold3 BioNeMo Skill to fold MKTVRQERLKSIVR with the local NIM
endpoint at http://localhost:8000 (or the endpoint where NIM is deployed)

단순 래퍼를 넘어선 가속화 도구

이 플랫폼의 가치는 호출 시 빠르고 즉시 프로덕션에 적용할 수 있다는 점에 있습니다. BioNeMo NIM은 가장 널리 사용되는 대다수 모델을 위해 가속화되고 배포가 용이한 마이크로서비스를 제공합니다. BioNeMo NIM Skills는 이러한 마이크로서비스의 배포를 단순화하여 에이전트가 로컬에서 실행되거나 호스팅된 서비스를 사용할 수 있도록 지원합니다. 이를 통해 소스 코드를 기반으로 모델을 빌드하고 배포할 때 요구되는 의존성 관리의 복잡성이 제거됩니다.

AI 사이언티스트는 후보 생성, 결과물 검사, 매개변수 조정, 재실행이라는 반복적인 루프 속에서 작업합니다. BioNeMo NIM Skills로 활성화되는 BioNeMo NIM은 배포와 후속 추론 작업을 모두 간소화하여 이 루프를 개선하고 신속한 반복을 가능하게 합니다. 우리는 Skill을 보유한 에이전트와 그렇지 않은 동일한 에이전트를 비교하여, 에이전트가 도출한 결과의 품질과 각 실행의 효율성을 벤치마킹함으로써 이를 측정합니다.

또 다른 지표는 이러한 반복 워크플로우 구축에 필요한 도구를 에이전트가 얼마나 효율적으로 사용하는가입니다. 여기서는 Skill이 있는 에이전트와 없는 에이전트의 토큰 효율성을 측정합니다. 위 그림 2에 나타난 정확도를 고려하여, 전체 작업을 구성하는 개별 단계인 통과한 어설션(assertion) 수를 필요한 토큰 수와 비교함으로써 에이전트의 전반적인 성능을 평가할 수 있습니다.

BioNeMo NIM Skills를 사용하면 에이전트는 소비된 토큰당 통과한 어설션 수에서 평균 2배의 향상을 보입니다.

작업 수준의 결과물로 정확성을 평가합니다. 에이전트가 올바른 모델을 선택했는지, 유효한 입력값을 준비했는지, 예상된 결과물을 반환했는지, 그리고 결과를 정확하게 설명했는지 확인합니다. 효율성은 단일 호출 지연 시간, 매개변수 스윕(parameter‑sweep) 지연 시간, 토큰 사용량으로 평가합니다. 이러한 지연 시간과 사용량 지표를 종합하여, Skill이 에이전트로 하여금 더 적은 설정과 재시도, 그리고 더 빠른 반복으로 더 나은 과학적 결과를 도출하도록 돕는지 보여줍니다(위 그림 2 참조).

본문에 보고된 모든 지표는 GPT-5.5 fast를 탑재한 Codex CLI를 사용하여 측정되었습니다. 모든 BioNeMo NIM Skill은 특정 에이전트에 종속되지 않도록(agent-agnostic) 설계되었으므로, 다른 백엔드 및 모델을 사용하더라도 유사한 수준의 에이전트 성능을 기대할 수 있습니다.

문제 해결

예측된 구조의 신뢰도가 낮아 보인다면, 서열(sequence), MSA, 템플릿 또는 제약 조건이 생물학적으로 적절한지 확인하십시오.
도킹이나 결합(binding) 결과가 타당해 보이지 않는다면, 포즈(pose)나 점수를 신뢰하기 전에 생물학적 설정부터 확인하십시오.
생성된 분자나 단백질 디자인이 유망해 보이더라도, 다음 단계로 진행하기 전에 후속 과학적 기준에 따라 필터링을 거치십시오.
NIM이 사용하는 GPU와 호환되지 않는 최적화 프로필을 자동 선택하는 경우, 자동 선택에 의존하지 말고 모델 프로필을 명시적으로 설정하십시오.
build.nvidia.com URL의 엔드포인트는 소규모 개발 및 테스트 전용이므로, 프로덕션 수준의 추론에는 사용하지 마십시오.

더 나아가기

BioNeMo는 NVIDIA의 가속화된 생체 분자 스택을 어떤 에이전트든 실제 생물학 연구에 활용할 수 있는 호출 가능하고 탐색 가능한 도구로 전환합니다. 가속화된 모델 계층(cuEquivariance, Parabricks 등 라이브러리로 가속화된 NIM 및 오픈 모델)이 역량을 제공하고, BioNeMo Skills와 MCP 래퍼가 에이전트에게 각 모델의 올바른 사용법을 가르치며, 단일 저장소를 통해 에이전트가 첫날부터 전체 플랫폼을 탐색할 수 있습니다.

완전한 에이전트를 구축하는 팀을 위해, 오케스트레이션과 메모리를 위한 NVIDIA Nemotron 및 NVIDIA NeMo Agent Toolkit을 포함한 더 넓은 플랫폼이 동일한 접근 방식을 단일 도구 호출 너머로 확장합니다.

워크플로는 과학적 작업에서 시작하여 각 단계를 적합한 모델, 인터페이스, 배포 경로에 매핑합니다. 광범위한 접근과 사용 편의성을 위해 호스팅 NVIDIA NIM 엔드포인트로 시작하고, 레이턴시, 처리량, 보안, 또는 반복 실행이 더 많은 제어를 요구할 때 선택한 모델을 로컬로 이전하십시오. 이를 통해 생체 분자 AI를 단발성 모델 호출에서 반복적인 연구 루프로 전환할 수 있습니다.

시작하기

BioNeMo를 사용하면 AI 사이언티스트가 구조 예측, 분자 생성, 도킹, 서열 분석, 설계 및 유전체학을 호출 가능한 도구로 활용할 수 있습니다. 이를 통해 프롬프트에서 가설로, 가설에서 모델 호출로, 그리고 모델 출력에서 다음 과학적 의사결정으로 매끄럽게 나아갈 수 있습니다.

지금 바로 에이전트를 https://github.com/NVIDIA-BioNeMo/bionemo-agent-toolkit 으로 연결하고 BioNeMo Skill을 부여하여 시작해 보세요.

Discuss (0)

작성자 소개

Kyle Tretina 프로필
Kyle Tretina는 NVIDIA 바이오파마 및 NVIDIA 바이오네모의 제품 마케팅 책임자입니다. 그는 백신 및 신약 개발을 위한 멀티 오믹스 기술을 사용하여 10년간 학술 감염병 연구 분야에서 일했습니다. 또한 테크바이오에서 제품 관리 및 마케팅 업무를 수행한 경험이 있습니다. 가장 최근에는 인실리코 메디슨의 컴퓨터 지원 약물 설계 소프트웨어 제품군의 얼라이언스 매니저로 근무했습니다.

Kyle Tretina 의 작성글 모두 보기

Mahan Salehi 프로필
Mahan Salehi는 NVIDIA의 제품 관리 리더로, 회사의 생성형 AI 소프트웨어 포트폴리오 전략 및 개발을 이끌고 있습니다. Triton Inference Server, NIM, NeMo 마이크로서비스를 포함한 NVIDIA의 여러 플래그십 제품의 제품 책임자를 역임했습니다. 또한 NVIDIA BioNeMo의 제품 전략을 진두지휘하며 생명과학 및 생물학 분야에서 AI 기반 모델의 활용을 발전시키고 있습니다. NVIDIA에 합류하기 전에는 정신 건강 치료 개선을 위한 AI 스타트업의 CEO이자 공동 창업자로 활동했습니다. University of Toronto에서 엔지니어링 학위를 취득했습니다.

Mahan Salehi 의 작성글 모두 보기

Neel Patel 프로필
Neel Patel은 NVIDIA Jetson 임베디드 플랫폼에 주력하는 현장 애플리케이션 엔지니어입니다. 그는 열렬한 임베디드 시스템 애호가입니다. Neel은 산호세 주립대학교에서 컴퓨터 공학 석사 학위를 받았습니다.

Neel Patel 의 작성글 모두 보기

Kris Kersten 프로필
Kris Kersten은 NVIDIA에서 AI를 중심으로 활동하는 기술 마케팅 엔지니어로, 의료 분야의 주요 문제를 해결하기 위해 ML과 DL 솔루션을 확장하는 일을 하고 있습니다. NVIDIA에 합류하기 전에는 Cray Supercomputers에서 하드웨어 및 소프트웨어 성능을 연구했으며, 로우레벨 캐시 벤치마킹부터 대규모 병렬 시뮬레이션까지 다양한 성능 분석을 수행했습니다.

Kris Kersten 의 작성글 모두 보기