Anjali Shah

Anjali Shah는 NVIDIA의 개발자 지원 엔지니어링 그룹 소속 선임 딥 러닝 과학자로, 고객이 제너레이티브 AI 솔루션을 구축할 수 있도록 지원합니다. 경력 초기에는 소프트웨어 엔지니어로서 세계 유수의 금융 서비스 기업을 위한 미션 크리티컬 플랫폼을 구축했습니다. 그 후 수년간 의료 부문에서 대규모 의료(EHR) 시스템을 설계하고 구현했습니다. NVIDIA에 합류하기 전에는 선도적인 기술 기업에서 수년간 다양한 산업 분야에서 고객이 혁신적인 데이터 및 AI 솔루션을 구축할 수 있도록 지원했습니다. 생물 의학 정보학 및 응용 통계학 박사 학위와 컴퓨터 과학 및 공학 석사 및 학사 학위를 취득했습니다.

Posts by Anjali Shah

Agentic AI / Generative AI 2026년 5월 12일

NVIDIA Nemotron 3 Nano Omni: 단일 오픈 모델로 멀티모달 에이전트 추론을 가속화

NVIDIA Nemotron 3 Nano Omni가 텍스트·이미지·비디오·오디오를 하나로 통합한 30B-A3B 하이브리드 MoE 오픈 모델로 멀티모달 에이전트 추론을 가속화합니다. NVFP4 양자화와 함께 최대 9.2배 실효 시스템 용량을 제공해요. 8 MIN READ

Generative AI / LLMs 2025년 5월 28일

NVIDIA Blackwell 플랫폼 DeepSeek-R1 추론 성능에서 세계 기록 달성

NVIDIA는 NVIDIA GTC 2025에서 DeepSeek-R1 추론 성능 세계 기록을 발표했습니다. 9 MIN READ

Generative AI 2024년 12월 13일

NVIDIA TensorRT-LLM, 인플라이트 배치로 인코더-디코더 모델 가속화

NVIDIA는 최근 NVIDIA TensorRT-LLM이 인코더-디코더 모델 아키텍처를 가속화한다고 발표했습니다. 3 MIN READ

Generative AI 2024년 9월 25일

엣지에서 클라우드로 가속화된 Llama 3.2 배포하기

오픈 소스 Meta Llama 모델 컬렉션을 확장한 Llama 3.2 컬렉션에는 비전 언어 모델(VLM), 소규모 언어 모델(SLM)… 4 MIN READ

Generative AI 2024년 8월 2일

NVIDIA 플랫폼 전반에서 Llama 3.1 강화하기

Meta의 Llama 거대 언어 모델 컬렉션은 오늘날 오픈 소스 커뮤니티에서 가장 인기 있는 파운데이션 모델로, 다양한 사용 사례를 지원합니다. 5 MIN READ

Generative AI 2024년 5월 3일

NVIDIA TensorRT-LLM 및 NVIDIA Triton Inference Server로 Meta Llama 3 성능 강화

LLM 추론 성능을 가속화 및 최적화하는 NVIDIA TensorRT-LLM의 Meta Llama 3 모델 제품군에 대한 지원을 발표합니다. 5 MIN READ