NVIDIA Technical Blog
-
Agentic AI / Generative AILLM 메모리의 재구성: 컨텍스트를 학습 데이터로 활용해 테스트 타임에 스스로 학습하는 모델
-
Agentic AI / Generative AI소프트웨어 및 모델 최적화로 성능이 대폭 강화된 NVIDIA DGX Spark
-
Agentic AI / Generative AIRAG와 안전 가드레일을 적용한 음성 에이전트 구축 가이드
-
Data Center / CloudAI-Physics 기반 TCAD 시뮬레이션 가속화
-
Data Center / CloudNVIDIA MGX로 미래형 데이터 센터에 유연한 성능 제공
최신
2026년 1월 9일
LLM 메모리의 재구성: 컨텍스트를 학습 데이터로 활용해 테스트 타임에 스스로 학습하는 모델
요즘 LLM 소식에서는 대화 기록 전체나 수십 권의 책, 심지어 대규모 코드베이스까지 한 번에 처리할 수 있다는 방대한 컨텍스트 윈도우 사양이…
3 MIN READ
2026년 1월 9일
소프트웨어 및 모델 최적화로 성능이 대폭 강화된 NVIDIA DGX Spark
NVIDIA는 Grace Blackwell 기반 DGX Spark 출시 이후, 지속적인 소프트웨어 최적화와 오픈소스 커뮤니티 및 파트너사와의 긴밀한…
3 MIN READ
2026년 1월 7일
RAG와 안전 가드레일을 적용한 음성 에이전트 구축 가이드
단순히 API를 호출하는 것만으로는 제대로 된 에이전트를 만들 수 없습니다. 에이전트 구축의 핵심은 검색(Retrieval), 음성(Speech)…
6 MIN READ
2025년 12월 17일
AI-Physics 기반 TCAD 시뮬레이션 가속화
TCAD(Technology Computer-Aided Design) 시뮬레이션은 반도체 공정 시뮬레이션과 소자 시뮬레이션을 모두 포괄하며…
4 MIN READ
2025년 12월 12일
NVIDIA MGX로 미래형 데이터 센터에 유연한 성능 제공
AI 열풍은 컴퓨팅 환경을 빠르게 바꾸고 있으며, 2026년에는 그 속도가 더욱 빨라질 전망입니다. 모델 성능과 연산 능력의 발전으로 성장은…
4 MIN READ
2025년 12월 12일
AI 모델 추론을 가속화하는 핵심 최적화 기법 5가지
AI 모델이 점점 더 대형화되고 아키텍처가 복잡해지면서, 연구자들과 엔지니어들은 AI 시스템을 실제 환경에 적용하기 위한 성능 최적화 및 비용 절감…
5 MIN READ
2025년 12월 10일
NCCL Inspector로 AI 워크로드의 통신 성능 가시성 향상하기
딥러닝 훈련이나 추론 워크로드에서 AllReduce, AllGather, ReduceScatter 같은 집합 연산(collective…
4 MIN READ
2025년 12월 5일
알고리즘에 집중하도록—하드웨어 복잡성은 NVIDIA CUDA Tile이 해결합니다
CUDA 플랫폼이 2006년에 등장한 이후 가장 큰 혁신 중 하나로 평가되는 CUDA 13.1이 NVIDIA CUDA Tile을 새롭게 도입합니다.
3 MIN READ