Technical Walkthrough

使用 NVIDIA GPU 加速 AI 技术创建服装检测应用程序

这篇客串帖子由 Drishtic AI 首席开发者提交, Priti Gavali 和技术架构师, Archana Borawake 。

时装业在新技术和不断变化的消费趋势方面正在发生许多变化。作为零售业增长最快的行业之一,时装行业正在利用数据更好地了解消费者的服装品味和偏好。 Drishtic AI 的解决方案使用计算机视觉来分析照片和视频,解读最流行的款式,并将数据编译成对客户有用的格式。

服装公司可以利用这些数据来评估需求,并根据个人的年龄、性别和偏好来开发吸引他们的服装。通过生产流行的款式,服装公司可以减少浪费,创造一个更可持续的行业。

艾德里什蒂克使用 NVIDIA Metropolis 平台开发支持人工智能的视频分析应用程序。 Drishtic AI 的目标是使用先进的工具和全堆栈方法来实现更快的开发时间,并为开发 vision AI 应用程序创建高度计算优化的解决方案。为了创建其服装检测应用程序, Drishtic AI 使用了一个建立在 NVIDIA EGX 平台上的技术堆栈,将 NVIDIA – 认证系统与 NVIDIA GPU 结合起来。

Drishtic AI 团队首先主要从开源图像和视频构建数据集,使用 10400 张图像,每个服装类别使用 800 张图像。它为 13 种不同类别的服装—— t 恤、衬衫、短裤、裙子、上衣、连衣裙、裤子、牛仔、连帽衫、夹克、开襟羊毛衫、连体衣和毛衣——的所有图像添加了注释。他们使用 Detectnet _ V2 预先训练的模型与TAO 工具包相结合,以缩短他们的 AI 开发流程。为了部署应用程序,团队使用 NVIDIA 深流 SDK处理原始视频,优化视频解码,并实时加速图像转换。

以下视频演示了该应用程序如何识别人们穿着的 g ARM 隐形眼镜的类型,即使他们在不同的灯光设置之间移动或变换。这种深度学习模式对于帮助零售商和服装制造商获得当前和新兴时尚趋势的真实反馈至关重要。

Drishtic/ApparelDetection GitHub repo 中查看逐步开发服装检测应用程序的方法。