计算机视觉/视频分析

GTC 内幕指南:计算机视觉、 NLP 、推荐者和机器人

寻找不同的主题领域?留意我们的其他帖子!

3 月 21 日至 24 日,加入 GTC ,探索人工智能、计算机视觉、数据科学、机器人等领域的最新技术和研究!

有超过 900 个选项可供选择,我们的 NVIDIA 专家将安排一些不容错过的课程,帮助您开始:


计算机视觉/视频分析

创造未来:创建世界上最大的工业合成对象识别数据集( SORDI )
Jimmy Nassif , idealworks 首席技术官
马克·坎拉德,宝马集团慕尼黑技术办公室负责人

宝马每 56 秒制造一辆汽车。他们如何提高质量?他们使用机器人,用合成数据补充真实数据。了解宝马、微软和NVIDIA 如何通过基于人工智能的计算机视觉识别零件、障碍物和人员,从而加快生产和质量。

如何使用 NVIDIA DeepStream 开发和优化 Edge AI 应用程序
Carlos Garcia Sierra , DeepStream NVIDIA 产品经理
Jitendra Kumar ,NVIDIA 高级系统软件工程师

本讲座介绍了使用 DeepStream SDK 开发和优化 edge AI 应用程序性能的最佳实践。深入研究多传感器、多模式设计,学习如何在边缘使用人工智能来缩短开发时间并最大限度地提高性能。

用 NVIDIA TAO 简化人工智能模型
Chintan Shah ,NVIDIA 高级产品经理
Akhil Docca ,NVIDIA 高级产品营销经理

企业面临的一个主要挑战是,创建人工智能模型的需求远远超过了现有数据科学家的数量。开发者需要轻松定制模型,并更快地将人工智能推向市场。本课程将展示 NVIDIA TAO 解决这一问题的能力和易用性。在 GTC 预览 TAO 工具包的新功能,包括自带模型权重、 Rest API 、 TensorBoard 可视化、新的预训练模型等。


对话 AI / NLP

对话人工智能解谜
Sirisha Rella ,NVIDIA 产品营销经理

开发虚拟助手和实时转录等人工智能语音应用程序比以往任何时候都要容易。如今的先进工具和技术使微调和构建可扩展、响应迅速的应用程序变得容易。这个受欢迎的课程向用户展示了如何使用 NVIDIA Riva 构建和部署他们的第一个端到端对话 AI 管道。

表达性神经文本到语音
Andrew Breen ,亚马逊短信语音研究高级经理

文本到语音( TTS )研究专家安德鲁·布林( Andrew Breen )将对神经 TTS 的最新发展进行高水平概述,包括采用的方法、技术挑战和未来方向。 Breen 于 1993 年获得 IEE J.Langham Thomson premium ,并获得英国电信、 MCI 和 Nuance 颁发的商业奖项。他在英国电信实验室发明了 Laureate TTS 系统,并成立了 Nuance 的 TTS 组织。

构建大规模、本地化的语言模型:从数据准备到培训、部署到生产
Miguel Martinez ,NVIDIA 高级深度学习解决方案架构师
梅里姆·本德里斯,NVIDIA 高级深度学习数据科学家

自然语言处理( Natural Language Processing , NLP )在大规模语言模型上的突破提高了解决零镜头翻译和监督微调问题的能力。然而,由于数据准备、培训和部署方面的挑战,在本地化语言上执行 NLP 模型仍然受到限制。本课程重点介绍了扩展挑战和解决方案,以展示如何使用 NVIDIA NeMo 威震天优化 NLP 模型,这是一个用其他语言培训大型 NLP 模型的框架。


推荐/个性化

使用 NVIDIA Merlin 快速轻松地构建和部署推荐系统
甚至包括NVIDIA Merlin 推荐系统团队高级经理 Oldridge

Merlin 专家和 Twitter 影响者甚至 Oldridge 都将演示如何优化推荐模型,以获得最大的性能和规模。 Olrdige 是 Twitter 的影响者,拥有 8 年的推荐系统经验,并拥有计算机视觉博士学位。

利用深度学习和 GPU 构建基于人工智能的推荐系统
家得宝数据科学高级总监 Khalifeh AlJadda

应对基于人工智能的推荐系统挑战,并发现提供个性化体验的最佳实践,从而使您从竞争对手中脱颖而出。听取 Khalifeh AlJadda 的意见,他是在搜索和推荐引擎中实现大规模分布式机器学习算法的专家。 AlJadda 领导 Home Depot 的推荐数据科学、搜索数据科学和视觉 AI 团队。他拥有计算机科学博士学位,曾领导 CareerBuilder 的语言不可知语义搜索引擎的设计和实现。

多目标优化促进推荐系统的探索
Serdar Kadioglu ,副总裁 AI |富达投资|布朗大学兼职助理教授

在数据集有限或没有数据集的新应用程序中,如何使用组合优化将项域选择形式化? Serdar Kadioglu 将提供有关如何应用无监督聚类和潜在文本嵌入等技术为您的业务创建多层次框架的见解。卡迪奥格鲁曾在甲骨文公司领导高级约束技术研发团队,并在 Adobe 工作。作为布朗大学计算机科学系的兼职教授,卡迪奥格鲁的算法研究处于人工智能和离散优化的交叉点,对构建健壮且可扩展的产品感兴趣。


机器人技术

大规模交付人工智能机器人:幕后观察
Mostafa Rohaninejad ,协变的创始研究员。人工智能

把实用的人工智能机器人带入现实世界,比如在工厂里,是很困难的。协变正在努力解决这个问题。 Mostafa Rohaninejad 是核心团队的一员,该团队从一开始就在 Covarant 构建了完整的人工智能堆栈。在他的课程中,他将分享人工智能机器人的技术挑战和令人兴奋的商业可能性。

利用嵌入式计算解锁人类环境中的自主性
Andrea Thomaz ,勤奋机器人公司联合创始人兼首席执行官

在 2019 冠状病毒疾病流行期间,医院面临着护士的高流动率、记录的职业倦怠和危机水平的劳动力短缺。医院必须缓解这一人员配置危机。进入勤勉机器人公司和他们的机器人 Moxi ,它完成日常任务,帮助护理人员。 Andrea Thomaz 将分享在繁忙的医院实现机器人自主的独特挑战,比如在物体周围移动或导航到病房,同时集成多个摄像头流,并将其输入嵌入式 GPU 。

与 Jetson 一起,从地面到地面在公路外建立自治
Nick Peretti , Scythe 机器人公司 CV / ML 工程师

在户外和越野机器人技术中,自主性是至关重要的,但环境和特定任务的需求需要与室内或道路环境不同的方法。 Nick Peretti 将分享NVIDIA Jeason 为中心的方法, ScYes 机器人使用其完整的感觉计划行动软件套件与他们的自主商业割草机。他将重点介绍使 Scythe 能够快速进入野战部队的工具和方法,以及在此过程中吸取的经验教训。

 

Tags