Data Center / Cloud

Azure Machine Learning에서 NVIDIA AI Enterprise의 성능 활용하기

Reading Time: 5 minutes

AI는 빠르게 변하는 기술 환경에서 산업의 판도를 바꾸고 프로세스를 자동화하며 혁신을 위한 새로운 기회를 열어주고 있습니다. 더 많은 기업이 운영에 AI를 통합하는 것의 가치를 인식하게 되면서 이러한 기술을 효율적이고, 효과적이며, 안정적으로 구현해야 하는 과제에 직면해 있습니다. 

NVIDIA AI Enterprise는 조직이 보안, 안정성, API 안정성 및 엔터프라이즈급 지원을 통해 엔터프라이즈급 AI, 머신 러닝(ML) 및 데이터 분석을 대규모로 구현할 수 있도록 설계된 포괄적인 소프트웨어 제품군입니다.

NVIDIA AI Enterprise는 무엇인가요?

AI 솔루션을 배포하는 것은 복잡할 수 있으며 이러한 시스템을 개발하고 유지하려면 전문 지식은 물론 전문 하드웨어와 소프트웨어도 필요합니다. NVIDIA AI Enterprise는 엔터프라이즈 환경에 맞춤화된 도구, 라이브러리, 프레임워크 및 지원 서비스의 완전한 에코시스템을 제공하여 이러한 문제를 해결합니다. 

NVIDIA AI Enterprise는 GPU 가속 컴퓨팅 기능을 통해 엔터프라이즈에서 AI 워크로드를 더욱 효율적이고 경제적으로 규모에 맞게 실행할 수 있도록 지원합니다. NVIDIA AI Enterprise는 NVIDIA CUDA-X AI 소프트웨어 스택을 기반으로 구축되어 고성능 GPU 가속 컴퓨팅 기능을 제공합니다. 

제품군 구성:

  1. VMI: 주요 클라우드에서 GPU 가속 AI 워크로드를 지원하는 데 필요한 드라이버와 소프트웨어를 포함하는 사전 구성된 가상 머신 이미지입니다.
  2. AI 프레임워크: AI 개발 및 배포의 기반이 되는 VMI(PyTorch, TensorFlow, RAPIDS, TensorRT 및 ONNX 지원이 포함된 NVIDIA Triton 등)에서 실행할 수 있는 소프트웨어입니다.
  3. 사전 트레이닝된 모델: 있는 그대로 사용하거나 엔터프라이즈 관련 데이터에서 미세 조정할 수 있는 모델입니다.
  4. AI 워크플로우: AI 프레임워크와 사전 트레이닝된 모델을 활용하여 일반적인 비즈니스 문제 해결을 위한 AI 솔루션의 구축 방법을 보여주는 사전 패키징된 참조 예시입니다. 이러한 워크플로우는 NVIDIA 프레임워크를 구축하기 위해 사전 트레이닝된 모델 및 AI 모델 생성을 미세 조정하는 지침을 제공합니다. 애플리케이션을 만드는 파이프라인과 맞춤형 애플리케이션을 배포하고 이를 오케스트레이션 및 관리, 스토리지, 보안 및 네트워킹을 위한 소프트웨어와 같은 엔터프라이즈 환경에서 일반적으로 볼 수 있는 다양한 구성 요소와 통합하는 방법에 대한 의견을 중점적으로 다룹니다. 사용 가능한 AI 워크플로우는 다음과 같습니다.
  • 지능형 가상 도우미: 24시간 콜센터 지원을 통해 운영 비용을 절감합니다.
  • 오디오 전사: GPU 최적화 모델을 기반으로 하는 세계적 수준의 정확한 스크립트입니다.
  • 디지털 지문 위협 감지: 사이버 보안 위협을 감지하고 경고 우선순위를 지정하여 더욱 신속하게 식별하고 조치합니다.
  • 다음 상품 예측: 고객 참여 및 유지율 향상을 위해 맞춤형 제품을 추천합니다.
  • 경로 최적화: 자동차 및 로봇 경로 설정을 최적화하여 이동 시간과 연료 비용을 줄입니다.

릴리스 브랜치가 있는 지원 소프트웨어

NVIDIA AI Enterprise에서 사용 가능한 소프트웨어를 사용할 때의 주요 이점 중 하나는 NVIDIA가 지원하며 보안 및 안정성을 기본 원칙으로 한다는 것입니다. NVIDIA AI Enterprise에는 산업 및 사용 사례 전반의 다양한 요구 사항을 충족하는 세 가지 릴리스 브랜치가 포함되어 있습니다.

  1. 최신 릴리스 브랜치: 최고 수준의 소프트웨어 최적화가 필요한 사용자를 대상으로 하는 이 브랜치는 월간 릴리스 케이던스를 제공하여 사용자가 최신 기능 및 개선 사항에 액세스할 수 있도록 합니다. CVE 패치는 버그 수정과 함께 롤 포워드 릴리스에 포함될 것입니다.
  2. Production Release Branch: API 안정성을 우선시하는 환경을 위해 설계된 이 브랜치는 매달 CVE 패치 및 버그 수정을 받게 되고, 매년 2개의 새로운 브랜치가 도입되며 각 브랜치의 수명은 9개월입니다. 원활한 전환 및 지원을 위해 연속된 두 Production Branch 간에 3개월의 중복 기간이 있습니다. Production Branch는 2023년 하반기에 출시될 예정입니다.
  3. 장기 릴리스 브랜치: 장기 지원이 무엇보다 중요하며 규제가 엄격한 산업에 맞춤화된 이 브랜치는 분기별로 CVE 패치 및 버그 수정을 받게 되며 특정 릴리스에 대해 최대 3년간 지원합니다. 버전 간 전환이 원활히 이루어질 수 있도록 6개월의 중복 기간을 두어 이러한 장기 안정성을 보완하여 규제가 엄격한 산업에 필요한 지속성과 일관성을 제공합니다.
그림 1. NVIDIA AI Enterprise의 세 가지 릴리스 브랜치는 산업 및 사용 사례 전반의 다양한 요구 사항을 충족함

Microsoft Azure Machine Learning과 함께 NVIDIA AI Enterprise를 사용하는 방법

Microsoft Azure Machine Learning은 모델을 교육, 실험, 배포 및 모니터링하고 대규모 언어 모델을 위한 프롬프트 흐름을 설계 및 구성하는 서비스가 포함된 클라우드 및 온프레미스 AI 개발용 플랫폼입니다. 개방형 플랫폼인 Azure Machine Learning은 NVIDIA AI Enterprise를 포함하여 모든 인기 있는 머신 러닝 프레임워크 및 툴킷을 지원합니다. 

이 협업은 NVIDIA AI 소프트웨어를 Azure Machine Learning 트레이닝 및 추론 플랫폼과 통합하여 실행 환경을 최적화합니다. 사용자는 더 이상 트레이닝 환경을 설정하고, 패키지를 설치하고, 트레이닝 코드를 작성하고, 트레이닝 메트릭을 로깅하고, 모델을 배포하는 데 시간을 들일 필요가 없습니다. 이 통합을 통해 사용자는 Azure Machine Learning의 고성능 및 안전한 인프라를 보완하는 NVIDIA 엔터프라이즈 지원 소프트웨어의 성능을 활용하여 프로덕션 지원 AI 워크플로우를 구축할 수 있습니다. 

지금 시작하려면 다음 단계를 따르세요.

1. Microsoft Azure에 로그인하고 Azure Machine Learning Studio를 시작합니다.

2. NVIDIA AI Enterprise 미리보기 레지스트리에서 사전 구축된 모든 NVIDIA AI Enterprise 구성 요소, 환경 및 모델을 보고 액세스합니다(그림 2).

그림 2. Azure Machine Learning의 NVIDIA AI Enterprise 미리보기 레지스트리

3. 작업 공간 내에서 이러한 자산을 사용하여 간단한 드래그 앤드 드롭을 통해 디자이너 내에서 ML 파이프라인을 생성합니다(그림 3). 

그림 3. NVIDIA AI Enterprise 구성 요소를 사용하는 Azure Machine Learning의 파이프라인

Azure Machine Learning 레지스트리에서 NVIDIA AI Enterprise 샘플 자산을 찾아보세요. GitHub의 NVIDIA_AI_Enterprise_AzureML에서 미리보기 자산에 대한 코드를 확인하세요.

사용 사례: 신체 포즈 추정 

NVIDIA AI Enterprise 미리보기 레지스트리 내에서 다양한 요소를 쉽게 사용할 수 있습니다. 이 예시는 신체 포즈 추정을 위해 NVIDIA DeepStream을 사용하는 컴퓨터 비전 작업을 보여줍니다. NVIDIA TAO Toolkit은 신체 포즈 모델의 기반을 제공하며 새로운 데이터로 이를 개선하는 기능을 지원합니다.

그림 4는 신체 포즈 추정을 위해 NVIDIA DeepStream 샘플 앱을 실행하는 영상 분석 파이프라인의 예시를 보여줍니다. GPU 클러스터에서 실행되며 업데이트된 모델 및 비디오를 간편하게 활용할 수 있어 Azure Machine Learning 플랫폼의 성능을 극대화합니다.

그림 4. Azure Machine Learning을 통한 신체 포즈 추정을 위한 NVIDIA TAO Toolkit 및 NVIDIA DeepStream

이 예시에는 DeepStream 샘플 앱 명령 구성 요소에 대한 입력을 저장하기 위해 생성된 2개의 URI 기반 데이터 자산이 포함되어 있습니다. 데이터 자산은 사전 트레이닝된 모델을 활용하므로 NVIDIA AI Enterprise 레지스트리에서 즉시 사용할 수 있습니다. 추가 보정 및 레이블 정보도 포함됩니다.

DeepStream 신체 포즈 명령 구성 요소는 Microsoft Azure Blob Storage를 사용하도록 구성됩니다. 이 구성 요소는 추론이 필요한 새 영상 파일이 있는지 입력 디렉터리를 모니터링합니다. 영상 파일이 나타나면 구성 요소가 이를 선택하고 신체 포즈 추론을 수행합니다. 출력된 영상에는 바운딩 박스와 추적 라인이 포함되며 출력 디렉터리에 저장됩니다.

레지스트리 내에서 사용할 수 있는 추가 샘플은 다음과 같습니다.

  • bodyposenet
  • citysemsegformer
  • dashcamnet
  • emotionnet
  • fpenet
  • gazenet
  • gesturenet
  • lprnet
  • peoplenet
  • peoplenet_transformer
  • peoplesemsegnet
  • reidentificationnet
  • retail_object_detection
  • retail_object_recognition
  • trafficcamnet

각 샘플은 Transfer Learning을 수행하는 TAO Toolkit 기반 트레이닝 파이프라인으로 개선할 수 있습니다. 모델 출력은 특정 사용 사례에 맞게 변경됩니다. NGC에서 TAO Toolkit 컴퓨터 비전 샘플 워크플로우를 확인할 수 있습니다.

Azure Machine Learning에서 NVIDIA AI Enterprise 시작하기

NVIDIA AI Enterprise와 Azure Machine Learning의 강력한 조합은 GPU 가속 컴퓨팅과 포괄적인 클라우드 기반 머신 러닝 플랫폼 역할을 하며 비즈니스에서 AI 모델을 더욱 효율적으로 개발하고 배포할 수 있도록 지원합니다. 엔터프라이즈는 이러한 시너지 효과를 통해 클라우드 리소스의 유연성을 활용하는 동시에 NVIDIA GPU 및 소프트웨어의 성능 이점도 활용할 수 있습니다. 

Azure Machine Learning에서 NVIDIA AI Enterprise를 시작하려면 Tech Preview에 등록하세요. Azure Machine Learning의 NVIDIA AI Enterprise 미리 보기 레지스트리에서 사전 구축된 모든 구성 요소와 환경 및 모델을 이용할 수 있습니다.

관련 리소스

Discuss (0)

Tags

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 항목은 *(으)로 표시합니다