Zijie Yan

Zijie Yan은 2021년에 NVIDIA의 DevTech 팀에 합류한 선임 DevTech 엔지니어입니다. 그는 대규모 언어 모델(LLM) 트레이닝 시스템의 효율성과 확장성을 개선하는 것을 전문으로 합니다. 현재 Zijie는 메가트론-코어에서 MoE 지원을 위한 엔지니어링 이니셔티브를 이끌고 있으며, 팀과 긴밀히 협력하여 MoE 트레이닝 시스템의 엔지니어링 개발 및 성능 향상을 위해 노력하고 있습니다. NVIDIA에 입사하기 전에는 Sun Yat-sen University에서 석사 과정을 밟으며 분산형 딥 러닝을 위한 통신 최적화에 대한 연구를 수행했습니다.

Posts by Zijie Yan

Conversational AI / NLP

새로운 NVIDIA Megatron-Core 기능으로 생성형 AI 모델을 더 효율적으로 훈련하기

2019년에 처음 소개된 NVIDIA Megatron-LM은 AI 커뮤니티에 혁신의 물결을 일으켰으며, 연구원과 개발자는 이 오픈 소스 라이브러리를… 6 MIN READ