生成式 AI、算法处理各种类型的输入—例如文本、图像、音频、视频和代码—并生成新内容的能力正在以前所未有的速度发展。虽然这项技术在多个行业都取得了重大进展,但建筑、工程和施工 (AEC) 行业将从中受益匪浅。
历史上,AEC 公司一直在与支离破碎的数据系统作斗争。这导致各个部门或项目阶段的重要信息被隔离,从而导致效率低下、解释错误和增加项目成本。随着 生成式 AI 的出现,AEC 行业正处于转型的边缘。
这项前沿技术通过集成数据、自动执行设计任务和增强协作,有可能彻底改变 AEC 行业,从而打造更高效、更创新和更可持续的项目。
扩散模型:AEC 中生成式 AI 的关键组件
自推出生成式 AI 以来,GPT-4 等大型语言模型 (LLM) 一直处于前沿,以其在自然语言处理、机器翻译和内容创建方面的通用性而闻名。除此之外,OpenAI 的 DALL-E、Google 的 Imagen、Midjourney 和 Stability AI 的 Stable Diffusion 等图像生成器正在改变建筑师、工程师和施工专业人员可视化和设计项目的方式,从而实现快速原型设计、增强创造力和更高效的工作流程。
作为核心,扩散模型具有独特的能力。它们可以通过逐步添加和消除数据集中的噪声,从提示生成高质量数据。
训练扩散模型的方法是通过多次迭代向数百万张图像添加噪点,并在模型在反向过程中重新创建图像时奖励模型。训练完成后,模型就可以进行推理,从而使用户能够生成真实的数据,例如图像、文本、视频、音频或 3D 模型。
为什么是噪声:它有助于扩散模型模仿随机变化,理解数据,防止过拟合,并确保平滑转换。想象一下,你有建筑设计的草图。你开始在其中添加随机噪声,使其看起来越来越像一个凌乱的涂鸦。这是向前的过程。反向过程就像逐步清理那个凌乱的涂鸦,直到你返回到详细而清晰的建筑渲染。
该模型会学习如何很好地完成这一清理过程,以便从随机噪声开始,最终生成全新、逼真的建筑设计。借助这种创新方法,扩散模型可以生成非常准确和详细的输出,使其成为一种强大的工具。
Diffusion 模型因学习、解释和生成视觉效果的方式而难以控制。然而,ControlNets 是一组针对特定任务进行训练的神经网络,可以增强基础模型的功能。建筑师可以通过提供参考,对生成过程实施精确的结构和视觉控制。
例如,Sketch ControlNet 可以将建筑设计图纸转换为完全实现的渲染。
多个 ControlNet 可以组合在一起以实现额外的控制。例如,Sketch ControlNet 可以与适配器配对,该适配器可以整合参考图像,以应用特定的颜色和风格到设计中。
ControlNet 非常有效,因为它们可以处理各种类型的信息,为建筑师和设计师提供新的方式来管理设计和与客户交流想法。
利用 NVIDIA 加速计算能力,进一步提高了扩散模型的性能。NVIDIA 优化的模型(例如 SDXL Turbo 和 LCM-LoRA),可提供先进的性能和实时图像生成功能,这些模型显著提高了推理速度并降低了延迟,每秒可生成多达四张图像,从而大幅缩短生成高分辨率图像所需的时间。
Diffusion 模型为 AEC 领域提供了多种具体优势,增强了设计、可视化和项目管理的各个方面。
高质量的可视化效果
Diffusion 模型可以通过简单的草图、文本描述或组合生成逼真的图像和视频。这项功能对于创建详细的建筑渲染和可视化非常重要,可以帮助决策者理解和可视化拟议项目。
日光和能效
漫反射模型可以生成日光贴图,并分析自然光对建筑设计的影响。这有助于优化窗口位置和其他设计元素,以增强室内日光和能效,确保建筑物的舒适性和可持续性。
快速原型设计
通过自动生成设计方案和可视化(包括材料或对象定位),扩散模型可以显著加快设计流程,建筑师和工程师可以更快地探索更多设计方案,leading to 更创新和优化的解决方案。
成本节约和流程优化
Diffusion 模型支持自定义 BIM (Building Information Modeling) 策略,以满足特定区域和项目的需求。通过确保资源直接用于需求最大的区域,资源分配得到改善。这使得策略能够根据不同区域和项目的独特需求进行定制,从而降低项目成本并提高整体效率。
使用、自定义或构建您的扩散模型
组织可以通过多种方式利用扩散模型。它们可以按原样使用预训练模型,根据特定需求对其进行定制,或者从头开始构建新模型,并根据用户的独特需求对其进行定制,从而充分发挥其潜力。
预训练模型可立即部署,从而缩短上市时间并最小化初始投资。自定义预训练模型可以集成特定领域的数据,从而提高特定应用程序的准确性和相关性。从零开始开发模型虽然需要大量资源,但能够创建高度专业的解决方案,从而应对独特的挑战并提供竞争优势。
考虑 AEC 行业中的扩散模型,就像建造房屋一样。使用预训练模型与使用标准预制房屋类似,它们随时可以使用,节省时间和初始成本。自定义预训练模型就像修改标准现成房屋计划以满足特定要求,确保设计满足特定需求和偏好。从头开始构建模型与从头开始创建全新蓝图类似,这种方法具有最大的灵活性和定制性,但需要大量的专业知识、时间和资源。
每种方法都有其优缺点,使组织能够根据其项目目标和可用资源选择最适合的方法。
用于快速部署的预训练模型
对于许多组织而言,从扩散模型中受益的最快方法是使用预训练模型。这些模型通过NVIDIA API 目录提供,针对高性能进行了优化,并且可以直接部署到应用程序中。
NVIDIA NIM 为组织提供了一种精简高效的方法来部署扩散模型,从而能够根据文本提示生成高分辨率、逼真的图像。借助预构建的容器,组织可以在 NVIDIA 加速基础设施 (可从 NVIDIA 工作站、数据中心、云服务合作伙伴和私有本地服务器获取) 上快速设置和运行扩散模型。
这种方法简化了部署流程并最大限度地提高性能,使企业能够专注于构建创新生成式 AI 工作流程,而无需承担复杂的模型开发和优化工作。
开发者可以免费体验和实验 NVIDIA 托管的 NIM。
企业可以通过 NIM 通过NVIDIA AI Enterprise 软件平台在生产环境中部署 AI 应用。
自定义扩散模型
自定义扩散模型可以提高 AEC 组织的扩散模型的相关性、准确性和性能。它还使组织能够包含自己的知识和行业特定术语,并应对特定挑战。
微调包括采用预训练模型,并使用较小的特定领域数据集调整其参数,以更好地满足组织的特定需求和细微差别。这种定制方法可提高生成内容的质量和效用,并提供可扩展性和灵活性组织可以根据需求的变化调整模型。
对于希望通过用户友好型路径开始自定义扩散模型的公司,NVIDIA AI Workbench 提供了一个精简的环境,让数据科学家和开发者能够快速启动并运行生成式 AI。借助 AI Workbench,用户可以开始使用适应不同数据和用例的预配置项目,它是快速迭代开发和本地测试的理想选择。
微调扩散模型等示例项目可以进行修改,以支持生成建筑渲染等操作。此外,这种灵活性还扩展到支持的基础设施。用户可以在 NVIDIA RTX 助力的 AI 工作站上本地启动,然后扩展到几乎任何位置—数据中心或云—仅需几次点击。有关如何自定义扩散模型的更多详细信息,请探索 GitHub 项目。
另一种用于微调扩散模型的轻量级训练技术是 Low-Rank Adaptation 或 LoRA。LoRA 模型由于规模较小非常适合建筑公司,它们可以在本地工作站上进行管理和训练,而无需大量的云资源。
了解如何使用 NVIDIA NIM 无缝部署和扩展多个 LoRA 适配器。
对于高级自定义和高性能训练,NVIDIA NeMo 提供了一个全面、可扩展、云原生的平台。NeMo 提供了多种 自定义技术,并针对扩散模型的大规模推理进行了优化,具有多 GPU 和多节点配置。
集成到 NeMo 框架中的 DRaFT 算法,增强了对扩散模型的微调,并确保模型产生符合特定项目要求的多样化高质量输出。有关更多技术细节和访问 DRaFT 算法,请访问 GitHub 上的 NeMo-Aligner 库。
NVIDIA Launchpad 提供了一个免费的动手实验室环境,AEC 专业人员可以在其中学习使用自定义图像微调扩散模型,并针对特定任务(例如生成高质量建筑渲染或施工项目可视化)优化这些模型。
构建符合您风格的扩散模型
现在,我们已经介绍了预训练和自定义模型,让我们从头开始构建扩散模型。投资自定义扩散模型使 AEC 组织能够充分利用 AI 的全部潜力,从而获得更高效、更准确和更创新的项目成果。
例如,建筑事务所可能会构建自己的扩散模型,以生成符合其特定建筑设计风格和客户偏好的设计概念,而建筑公司可能会开发模型来优化资源分配和项目调度。
这种方法的一个例子是总部位于伦敦的设计公司 Heatherwick Studio 的工作,他们一直在设计过程中使用 AI。该工作室以其创新项目而闻名,包括位于伦敦和加利福尼亚州的 Google 总部、位于开普敦的非洲首个当代非洲艺术博物馆以及东京的一个新建地区。Heatherwick Studio 一直在开发使用其数据来简化设计流程、渲染和数据访问的工具。
“在工作室,我们不仅相信 AI 在改善行业方面的变革力量,而且还在日常工作中积极开发和部署内部自定义扩散模型,”Heatherwick studio 的几何与计算设计主管 Pablo Zamorano 说。
我们开发了一款基于 Web 的工具,可以实现快速设计挑战、快速渲染和图像编辑,以及一款可在我们的 BIM 工具中进行定制知识搜索的工具,这些工具为我们的设计师和可视化者的工作提供支持,并且现已成熟。
使用 NVIDIA 创建自定义扩散模型
NeMo 提供了一个功能强大的框架,为在本地、所有领先的云服务提供商或 NVIDIA DGX 云中构建和训练自定义扩散模型提供组件。它包括从 prompt 学习到参数高效微调 (PEFT) 的一套自定义技术,非常适合需要生成高质量建筑渲染和高效优化施工可视化的 AEC 客户。
或者,NVIDIA Picasso 是一家 AI Foundry,资产市场公司利用其构建和部署先进的生成式 AI 模型,以提供具有商业安全性的视觉内容的 API。
基于 Picasso 构建的生成式 AI 服务,由 Getty Images 提供用于图像生成和 Shutterstock 提供用于 3D 生成,创建商业上安全的视觉媒体从文本或图像。AEC 组织可以微调他们选择的 Picasso 支持的模型,以创建自定义扩散模型,从而从不同风格的文本提示或草图中生成图像。Picasso 支持从数据准备和模型训练到模型微调和部署的端到端 AI 模型开发,使其成为开发自定义生成式 AI 服务的理想解决方案。
通过扩散模型实现负责任的创新
使用 AI 模型涉及多个关键步骤,包括数据收集、预处理、算法选择、训练和评估。每个步骤都需要仔细考虑,以确保模型表现良好并满足项目的特定需求。
然而,在整个过程中集成负责任的 AI 实践同样重要。生成式 AI 模型尽管功能出色,但容易受到偏见、安全漏洞和意外结果的影响。如果没有适当的保障措施,这些模型可能会产生强化有害的陈规定型观念、区别对待某些人口结构或包含安全漏洞的输出。
此外,保护扩散模型的安全性对于生成式 AI 驱动的应用程序至关重要。NVIDIA 推出了加速机密计算
开始使用
生成式 AI(尤其是扩散模型)正在革新 AEC 行业,通过简单的草图或文本描述创建逼真的渲染和创新设计。
首先,AEC 公司应优先考虑数据收集和管理,确定可从自动化中受益的流程,并采用分阶段实施的方法。The NVIDIA 培训计划 帮助组织培训员工掌握最新技术,通过提供全面的技术实战研讨会和课程弥合技能差距。