3월 21일부터 24일까지 GTC에서 AI, 컴퓨터 비전, 자연어 처리, 로보틱스 등을 아우르는 최신 기술과 연구 사례를 살펴보세요!
900가지 이상의 세션 중 다음 분야에서 몇 가지 놓칠 수 없는 세션을 소개해드립니다.
컴퓨터 비전 / 비디오 분석
새로운 미래 엿보기: 업계용 세계 최대 규모의 합성 객체 인식 데이터 세트(SORDI) 생성하기
Jimmy Nassif, CTO, idealworks
Marc Kamradt, BMW 그룹 TechOffice Munich 대표
BMW는 56초마다 자동차를 만듭니다. 그들은 어떻게 품질을 높일 수 있을까요? 그들은 로봇을 사용하고 실제 데이터를 합성 자료로 보완합니다. BMW, 마이크로소프트, 엔비디아 등이 인공지능(AI) 기반 컴퓨터 비전을 통해 부품, 장애물, 사람을 인식해 생산과 품질을 가속화하는 과정을 알아보새요.
NVIDIA DeepStream을 통한 엣지 AI 앱 개발 및 최적화 방법
Carlos Garcia-Sierra, DeepStream 제품 매니저, NVIDIA
Jitendra Kumar, 수석 시스템 소프트웨어 엔지니어, NVIDIA
이 강연에서는 DeepStream SDK를 사용하여 엣지 AI 애플리케이션의 성능을 개발하고 최적화하기 위한 모범 사례를 다룹니다. 멀티센서, 멀티모델 설계에 깊이 빠져들어 개발 시간을 단축하고 AI를 활용해 성능을 극대화하는 방법을 배워보세요.
Chintan Shah, NVIDIA 수석 제품 매니저
Akhil Doca, NVIDIA 수석 제품 마케팅 매니저
기업이 직면하고 있는 주요 과제는 AI 모델을 만들어야 한다는 요구가 과학자가 사용할 수 있는 데이터 수를 크게 앞지른다는 것입니다. 개발자들은 쉽게 모델을 커스터마이징하고 그들의 AI를 더 빨리 시장에 출시할 필요가 있습니다. 이 세션에서는 이 문제를 해결하는 NVIDIA TAO의 성능과 용이성에 대해 설명합니다. GTC에서 Bring Your Own Model Weights, Rest APIs, TensorBoard visualization, 사전 교육된 새로운 모델 등을 포함한 TAO Toolkit의 새로운 기능에 대한 미리 보기를 확인하세요.
대화형 AI / NLP
Jimmy Nassif, CTO, idealworks
Marc Kamradt, 테크오피스 뮌헨의 책임자, BMW Group
가상 비서나 실시간 전사와 같은 인공지능 음성 애플리케이션 개발은 그 어느 때보다 쉬워졌습니다. 오늘날의 고급 도구와 기술을 통해 확장 가능하고 대응력이 뛰어난 애플리케이션을 쉽게 미세 조정하고 구축할 수 있습니다. 이 세션에서는 NVIDIA Riva를 사용한 최초의 엔드 투 엔드 대화형 AI 파이프라인을 구축 및 도입하는 방법을 보여 줍니다.
Andrew Breen, Text-to-Speech Research 선임 매니저, Amazon
TTS(Text-to-Speech) 연구 전문가 Andrew Breen은 채택된 접근법, 기술적 과제 및 미래 방향을 포함하여 신경 TTS의 최근 발전에 대한 개괄적인 개요를 제공합니다. Breen은 1993년에 IEE J. Langham Thomson 프리미엄을 받았으며, BT, MCI 및 Nuance로부터 비즈니스 상을 받았으며 BT 연구소에서 계관자 TTS 시스템을 발명했고 뉘앙스의 TTS 조직을 설립했습니다.
대규모 현지 언어 모델 구축: 데이터 준비에서 교육 및 배포, 실운영에 이르기까지
Miguel Martinez, 수석 딥러닝 솔루션 설계자, NVIDIA
Meriem Bendris, 수석 딥러닝 데이터 사이언티스트, NVIDIA
대규모 언어 모델에서의 자연어 처리(NLP)의 비약적인 발전으로 제로샷 번역과 감독에 의한 미세 조정으로 문제를 해결할 수 있게 되었습니다. 그러나 데이터 준비, 트레이닝 및 도입의 과제 때문에 현지화된 언어로 NLP 모델을 실행하는 것은 지역화된 언어에서 여전히 제한적입니다. 이 세션에서는 대규모 NLP 모델을 다른 언어로 교육하기 위한 프레임워크인 NVIDIA Nemo Megatron을 사용하여 NLP 모델을 최적화하는 방법을 보여주기 위한 확장 과제와 솔루션에 대해 설명합니다.
추천자 / 개인 설정
NVIDIA Merlin을 통해 쉽고 빠른 추천 시스템 구축하고 배포하기
Even Oldridge, 수석 매니저, Merlin 추천 시스템, NVIDIA
Merlin 전문가이자 Twitter 인플루언서 Even Oldridge는 최고의 성능과 확장성을 위해 권장 모델을 최적화하는 방법을 시연할 예정입니다. Oldige는 Twitter 인플루언서이며 컴퓨터 비전 분야에서 박사 학위를 취득했으며 8년 간의 추천 시스템 경험을 보유하고 있습니다.
딥러닝과 GPU의 힘을 활용한 AI 기반 추천 시스템 구축하기
Khalifeh AlJadda, 데이터 과학 수석 책임자, The Home Depot
AI 기반 추천 시스템의 과제, 경쟁업체와 차별화되는 맞춤형 경험을 제공하기 위한 모범 사례를 알아보세요. 대규모 분산 머신러닝 알고리즘을 검색 및 추천 엔진에 구현하는 전문가인 Kalifeh AlJadda의 이야기를 들어보세요. AlJadda는 The Home Depot에서 추천 데이터 과학, 검색 데이터 과학 및 비주얼 AI 팀을 이끌고 있습니다. 컴퓨터 공학 박사 학위를 취득했으며 CareerBuilder의 언어에 구애받지 않는 시멘틱 검색 엔진의 설계와 구현을 주도했습니다.
Serdar Kadioglu, AI 부사장 | 겸임 부교수, Fidelity Investments | Brown University
데이터셋이 제한적이거나 아예 없는 새로운 애플리케이션에서 항목 공간 선택을 공식화하기 위해 조합 최적화를 어떻게 사용할 수 있을까요? Serdar Kadioglu는 비지도 클러스터링 및 잠재 텍스트 임베딩과 같은 기술을 적용하여 비즈니스를 위한 다단계 프레임워크를 구축하는 방법에 대한 통찰력을 제공합니다. Kadioglu는 이전에 Oracle의 Advanced Constraint Technology R&D 팀을 이끌었으며 Adobe에서 근무했습니다. 브라운 대학의 컴퓨터 공학 부교수로서 Kadioglu의 알고리즘 연구는 AI와 이산 최적화의 교차점에 있으며 견고하고 확장 가능한 제품을 만드는 데 관심이 있습니다.
로보틱스
Mostafa Rohaninejad, 설립 연구원, Covariant.ai
공장과 같은 실제 세계에 실용적인 AI 로봇을 도입하는 것은 어렵습니다. Covariant.ai는 이 문제를 해결하기 위해 노력합니다. Mostafa Rohaninejad는 처음부터 Covariant에 AI 스택 전체를 구축한 핵심 팀원입니다. 그의 세션에서 그는 AI 로보틱스의 기술적 도전과 흥미로운 상업적 가능성을 모두 공유할 예정입니다.
임베디드 컴퓨팅을 활용하여 일반 환경에서의 자율성 실현하기
Andrea Thomaz, 공동 창업자 겸 CEO, Diligent Robotics
COVID-19의 대유행 기간 동안, 병원은 높은 간호사 이직율, 버닝아웃, 심각한 노동력 부족에 직면했습니다. 간호 스탭을 지원하고 일상 업무를 수행하는 Diligent Robotics의 로봇 Moxi를 소개합니다. Andrea Thomaz는 조립 GPU에 공급되는 여러 카메라 스트림을 통합하면서 물체 주변 조작이나 병실 탐색 등 바쁜 병원에서 로봇의 자율성을 실현했던 방법을 공유합니다.
Nick Peretti, CV/ML 엔지니어, Scythe Robotics
자율성은 실외 및 오프로드 로봇 공학에 있어 매우 중요하지만, 환경 및 작업 고유의 요구는 실내 또는 포장도로 환경과는 또다른 접근 방식을 필요로 합니다. Nick Peretti는 Scythe Robotics가 자사의 완전한 센스 플랜 액션 소프트웨어 스위트를 운용하기 위해 사용하는 NVIDIA Jetson 중심 접근방식을 자사의 자율 상업용 머신과 공유합니다. Skythe가 필드 유닛으로 신속하게 이동할 수 있었던 도구와 접근 방식, 그리고 그 과정에서 얻은 교훈을 공유합니다.