Data Center / Cloud

NVIDIA AI 소프트웨어로 엔터프라이즈급 AI 구축하기

Reading Time: 4 minutes

ChatGPT 도입 이후, 전 세계 기업들은 AI의 이점과 기능을 깨닫고 AI를 워크플로우에 도입하기 위해 경쟁하고 있습니다.

이러한 도입이 가속화됨에 따라 기업은 AI의 빠른 발전에 발맞추는 것은 물론 최적화, 확장성, 보안과 같은 관련 과제를 해결하는 것이 필수적이 되었습니다.

엔터프라이즈 AI 개발 여정은 일반적으로 데이터 ETL(추출, 변환, 로드) 단계로 시작되며, 이 단계에서 데이터를 학습할 수 있도록 준비합니다. 그 다음에는 AI 모델을 학습시킵니다. 모델이 학습되면 다음 단계는 배포 및 추론 실행입니다. 기업은 이러한 각 단계에 최적화되고 안전한 소프트웨어를 사용하여 프로덕션에 바로 사용할 수 있는 AI 애플리케이션을 구축해야 합니다.

NGC 카탈로그를 통한 AI 개발 가속화

NVIDIA NGC 카탈로그를 통해 기업은 GPU에 최적화된 소프트웨어 및 SDK 제품군을 컨테이너 형태로 제공함으로써 AI 개발을 가속화할 수 있습니다.

이 카탈로그에서 인기 있는 컨테이너로는 데이터 ETL 단계에 사용되는 RAPIDS, 모델 개발 단계에 사용되는 TensorFlowPyTorch, 모델 배포 단계에 사용되는 NVIDIA TensorRT NVIDIA Triton Inference Server 등이 있습니다.

그림 1은 NLP, 객체 감지, 추천 등 다양한 사용 사례에 사용할 수 있는 다양한 컨테이너를 보여줍니다. NGC 카탈로그를 살펴보고 사용 사례에 적합한 소프트웨어를 찾아보세요.

그림 1. NGC 카탈로그는 다양한 사용 사례에 맞는 컨테이너를 제공합니다.

NGC 컨테이너의 장점

카탈로그의 모든 컨테이너는 최신 NVIDIA 가속 컴퓨팅 스택에서 실행되도록 최적화되어 있으며, 동일한 하드웨어에서 향상된 성능을 제공하기 위해 정기적으로 업데이트됩니다. 컨테이너는 다양한 NVIDIA GPU에서 호환성 및 성능을 보장하기 위해 테스트를 거쳤습니다.

기업은 온프레미스, 멀티클라우드 및 하이브리드 클라우드 환경 등 어디에나 이러한 컨테이너를 배포할 수 있습니다. 컨테이너는 널리 사용되는 오픈 소스 플랫폼인 Kubernetes를 비롯한 다양한 컨테이너 오케스트레이션 시스템과 함께 배포할 수 있습니다. 또한 이 카탈로그는 다양한 Helm 차트를 제공하여 Kubernetes 클러스터에서 컨테이너를 쉽게 배포하고 관리할 수 있도록 도와줍니다.

보안과 신뢰는 카탈로그에서 제공되는 컨테이너와 모델의 필수적인 부분이기도 합니다. 모든 컨테이너는 CVE를 검사하고 보안 등급을 지정하여 기업이 다운로드하는 소프트웨어에 대해 확신을 가질 수 있도록 합니다. 그림 2는 컨테이너의 다양한 보안 등급을 보여줍니다.

그림 2. NGC 카탈로그에 있는 컨테이너의 다양한 보안 등급

일반적으로 컨테이너는 다음과 같은 몇 가지 다른 이점도 제공합니다:

  • 종속성 캡슐화(​​Encapsulation of dependencies): 컨테이너는 라이브러리 및 기타 소프트웨어 구성 요소와 같은 모든 종속성을 캡슐화하여 애플리케이션이 추가 구성 없이도 어떤 환경에서도 안정적으로 실행될 수 있도록 보장합니다.
  • 재현성(Reproducibility): 컨테이너에는 애플리케이션을 실행하는 데 필요한 모든 것이 포함되어 있으므로 배포된 위치에 관계없이 동일한 방식으로 작동합니다. 따라서 환경별 구성과 관련된 문제가 발생할 가능성이 줄어듭니다.
  • 시간 및 리소스 절약: 컨테이너는 배포 프로세스를 간소화하고 환경 전반에서 일관성을 보장함으로써 수동 설정 및 문제 해결에 소요되는 상당한 시간과 리소스를 절약할 수 있습니다.

기업 개발자는 카탈로그 소프트웨어를 사용하여 POC 구축과 솔루션 테스트를 시작할 수 있습니다. 기업이 프로덕션 환경으로 전환할 준비가 되면 비즈니스 애플리케이션에 AI를 통합하기 위한 요구 사항이 충족되는지 확인해야 합니다.

이러한 요구 사항에는 엔터프라이즈급 보안, 소프트웨어 스택 안정성, 엔터프라이즈 지원 및 관리 용이성이 포함됩니다. 개발에서 프로덕션으로 전환하는 데 도움이 되는 명확한 경로를 확보하는 것은 가치 실현 시간의 성공 요인 중 하나입니다.

개발에서 프로덕션으로의 원활한 전환

다양한 소프트웨어 구성 요소와 관련 상호 의존성으로 인해 안전하고 신뢰할 수 있는 AI 소프트웨어 스택을 유지하는 것은 특히 AI를 엔터프라이즈 애플리케이션에 배포하고 통합해야 하는 경우 대규모 작업이 될 수 있습니다. NGC 카탈로그는 개발용 커뮤니티 기반 소프트웨어와 프로덕션용 엔터프라이즈급 소프트웨어 브랜치를 모두 제공함으로써 엔터프라이즈 개발자가 원활하게 전환할 수 있도록 지원합니다.

예를 들어, 이 카탈로그는 NVIDIA Triton Inference Server를 위한 여러 컨테이너를 제공합니다(그림 3). NVIDIA Triton 추론 서버 기능 브랜치는 개발자가 최신 기능 및 성능 최적화에 액세스할 수 있도록 한 달 주기로 출시되는 최신 버전입니다.

그림 3. NVIDIA Triton 추론 서버에 사용할 수 있는 다양한 NGC 컨테이너

NVIDIA AI 엔터프라이즈에서만 사용할 수 있는 NVIDIA Triton 추론 서버 프로덕션 브랜치는 업무에 필수적인 AI 애플리케이션을 구축하기 위한 안정성과 안전한 환경을 제공하기 위해 특별히 구축된 프로덕션 등급 버전입니다. 프로덕션 브랜치는 API 안정성을 보장하기 위해 9개월의 수명을 가지고 6개월마다 릴리스됩니다. 9개월의 수명 주기 동안 NVIDIA는 중요한 취약점을 지속적으로 추적하고 소프트웨어 스택을 중단하지 않고 매월 CVE 패치 및 버그 수정을 릴리스합니다.

기업 개발자는 다양한 최적화된 AI 소프트웨어 옵션을 통해 카탈로그를 활용하여 보안을 유지하면서 특정 AI 파이프라인을 지원하는 적절한 소프트웨어 패키지를 선택할 수 있습니다.

NVIDIA AI 엔터프라이즈를 통한 중단 없는 AI의 우수성

엔터프라이즈급 AI에는 보안, 안정성 및 관리 용이성이 매우 중요합니다. 이러한 과제를 해결하기 위해 NVIDIA는 데이터 사이언스 파이프라인을 가속화하고 프로덕션급 AI 애플리케이션의 개발 및 배포를 간소화하는 엔터프라이즈급 소프트웨어 플랫폼인 NVIDIA AI Enterprise를 출시했습니다.

오픈 소스를 기반으로 구축되고 NVIDIA에서 선별, 최적화 및 지원하는 NVIDIA AI 엔터프라이즈는 여러 가지 지원 지점(프로덕션, 기능 및 장기 지원)을 제공합니다. 또한 엔터프라이즈급 보안, 안정성, 관리 용이성 및 NGC를 통한 AI 여정 전반에 걸친 지원이 포함됩니다.

요약

NGC 카탈로그와 NVIDIA AI 엔터프라이즈는 기업이 최적화, 확장성 및 보안과 같은 관련 과제를 해결하면서 AI의 빠른 발전에 발맞추는 데 필요한 도구를 제공합니다.

NGC 카탈로그를 방문하여 수백 가지의 사전 학습된 모델, 컨테이너, Helm 차트 및 Jupyter 노트북을 찾아보세요. NVIDIA AI 엔터프라이즈를 시작하려면 90일 무료 평가판을 신청하세요.

관련 리소스

Discuss (0)

Tags