由于 AI 和 ML 功能,网络安全软件现在变得越来越复杂。现在可以在没有直接人工干预的情况下自动执行安全措施。这些功能强大的解决方案在阻止违规、提供高度详细的警报和保护攻击面方面具有真正的价值。尽管如此,持怀疑态度是值得的。
此次对 NVIDIA 专家巴特利·理查德森( BartleyRichardson )和丹尼尔·罗勒( DanielRohrer )的采访涵盖了一些关键问题,如人工智能声称、部署的隐藏成本以及如何最佳利用演示。他们建议在考虑投资人工智能网络安全软件时向供应商提出一系列问题。
Richardson 领导着一个跨学科的 AI 基础设施和网络安全工程团队,致力于 ML 和深度学习技术以及网络安全的新框架。 Rohrer 是软件安全副总裁,在 NVIDIA 任职 22 年期间,他担任过各种技术和领导职务。
1 、您的软件中运行的是什么类型的 AI ?
许多供应商声称他们拥有用于网络安全的 AI 和 ML 解决方案,但只有一小部分供应商投资于使用 AI 解决作为数据问题的网络安全核心问题的深思熟虑的方法。供应商可以声称他们的解决方案可以做各种事情。但这些说法只有在生态系统中有 X 、 Y 和 Z 时才有效。他们声称的条件大部分时间都被掩盖了。
Rohrer: 这就像是说,如果你的网络上整天都有完整的 ptrace 日志,你就可以获得这些伟大的功能。谁有这个?没有人有这个。成本太高了。
哦,当然,我们可以为你做很多令人惊奇的事情。您只需要捕获、存储和编目通过网络的所有数据包。然后投入大量功能强大且价格昂贵的服务器来分析这些数据包,只需要 100 名新的网络安全专家来解释这些结果。每个人都有这些资源,对吗?
但说真的,人工智能不是魔法。这是数学。人工智能只是另一种技术。你必须批判地看待人工智能。询问您的供应商,他们的软件中运行的是什么类型的 AI ,他们在哪里运行?因为人工智能用于一切,但并非一切都是人工智能。过度销售和交付不足正在市场上造成“人工智能疲劳”。人们一直都在被这些东西轰炸。
2 、您可以提供哪些部署选项?
Rohrer: 许多人都有混合云环境和一个只在您的部分环境中工作的解决方案。当然,对于赛博来说,这往往是不足的。他们的部署有多灵活?它们能在云中运行吗?在 prem ?在 Linux 、 Windows 或任何需要保护数据并实现目标的环境中?
您需要正确的 multicloud 。例如,我们使用谷歌、阿里云、 AWS 和 Azure 。他们是否在所有这些环境中都有可部署的解决方案,还是仅在其中一个环境中?我们需要这个吗?有时我们不需要,有时我们需要。网络安全是我们需要来自任何地方的日志的用例之一。因此,请了解您的解决方案空间,并了解您的部署模型需要多大的灵活性才能解决您的问题。然后把它烤进去。
网络往往是最难实现的目标之一,因为我们有大量动态的短暂数据。我们经常处于许多复杂的异构环境中,这些环境都是数据密集型和 IO 密集型的。所以,如果你想要一个最坏的情况,网络往往是它。
Richardson : 部署中也可能存在隐藏成本。如果你有一个环境,供应商说你可以获得所有这些 AI ,但顺便说一句,你必须使用我们的云。如果您还不是云本地用户,并在时间、工程和金钱上将数据推送到云,则会产生相关成本。
Rohrer: 即使您是云计算原生用户,也会有 I / O 开销,无法将您拥有的任何数据推送到他们手中。突然间,你手头上有一个百万美元的项目。
3 、我需要购买什么新的基础设施来运行您的软件?
Rohrer: 部署模型需要什么基础架构?你有你需要的东西吗,或者你能在没有过高成本的情况下轻易地购买它吗?你买得起吗?如果这是一个 on-prem 解决方案,那么提案是否包括您将需要的其他基础架构?如果是基于云的,它是否包括所有云实例和数据进出费,或者这些都是额外的?
如果你告诉我有些东西是加性的,很好。如果你告诉我有些东西被撕碎并替换了,那就不同了。
4 、您将如何保护我的模型?
人们通常会询问数据。您如何保护我的数据? 是否隔离?安全吗?这些问题问得很好。但当服务提供商为我定制 AI 模型时会发生什么? 他们针对保护我的环境的微调模型的政策是什么?你是怎么保护我的模特的?
因为如果他们在用 ML 或深度学习做任何真实的事情,那么模型和它所训练的数据一样有价值。如果您对这些技术有足够的经验,可以从经过训练的模型中撤销训练和微调数据。
这意味着人们有可能访问我的敏感信息。我的数据没有泄漏,但我的神经网络的这个巨大的嵌入空间泄漏了,现在有可能有人做了大量的工作来备份我的训练数据。并不是很多人都在加密模型。持续的加密/解密会彻底影响吞吐量。应该制定保护这些模型的政策和程序,最好是可以自动实施的政策和程序。确保您的供应商遵循最佳实践,在这些模型包含数据嵌入时实现尽可能少的权限。
5 、你能对我的数据做什么?
Rohrer: 有许多服务提供商正在聚合客户的数据和事件,以改进每个人的模型,只要你能提前知道就可以了。但你知道,有一个问题是,你的数据是否被用来改进竞争对手或市场上其他人的模型? 并确保您对此感到满意。在某些情况下,如果是天气数据或其他什么,那也没关系。有时不太可能。因为其中一些数据和您从中构建的模型对您来说具有真正的竞争优势。
Richardson: 我总是回到 Facebook 和 Twitter 这样的公司。它们的真正价值是您的数据。因此,他们可以使用每个人的数据和培训,这给了他们卓越的能力和额外的价值。他们向您销售服务或产品,并使用您的数据进行改进。
6 、我可以把我的数据带到演示中吗?
Rohrer: 准备演示非常重要,因为这才是大多数人真正需要解决的问题。
是的,理想情况下你应该有一套标准。了解您的需求。也许你有一些事件或错误配置或问题。 AI 能解决这个问题吗? 我们是否可以看到它在客户环境中运行,而不仅仅是在您的沙箱环境中?
Rohrer: 将您的问题带到演示中。
7 、您的解决方案是否需要调整,如果需要,多久调整一次?
Rohrer: 一个建议是将您自己的一些数据带到表中。如何摄取数据? 我实际遇到的问题的有效性是什么,而不是演示团队告诉我应该遇到的问题?并查看它如何处理您的数据。如果除非他们对数据进行调整,否则它无法处理您的数据,那么您知道这不仅仅是购买和部署。现在,经过 3 个月、 6 个月甚至 9 个月的调整后,它就可以部署了。 现在,这不仅仅是购买产品。这是一份采购和集成合同,也是一份支持合同,在您意识到这一点之前,成本就会累计起来。
8 、您的解决方案对我们的工程师来说学习和使用有多容易?
Richardson : 很多人不评估人员负荷。我知道在审判中很难做到这一点。但无论是网络安全还是其他问题,都要让你的员工对此进行评估。让你的工程师参与这个过程。询问您的工程师每天将如何与新软件交互? 我们经常看到这一点,尤其是在网络安全领域,你在功能 X 中添加了一些东西。最终,这只会给你的人类带来更多的认知负荷。它产生的噪音超过了他们的处理能力,即使它的假阳性率很低。它是添加剂。
是的,准确率高达 99% ,但你的员工必须处理的事件数量增加了一倍。这对他们没有帮助。
人工智能不是魔法。这只是数学。但它是在魔法的背景下构建的。只要愿意批判地看待人工智能。这只是另一种技术。这不是解决你所有问题的灵丹妙药。我们还没有生活在未来。
关于 Bartley Richardson
BartleyRichardson 是 NVIDIA 网络安全工程总监,领导一个跨学科团队,研究 GPU 加速 ML 和深度学习技术,并创建新的网络安全框架。他的兴趣包括 NLP 和应用于网络数据集和威胁检测的基于序列的方法。 Bartley 拥有计算机科学与工程博士学位,致力于松散和非结构化逻辑查询优化,并拥有计算机工程学士学位,专注于软件设计和 AI 。
Bartley Richardson 的更多信息:
- 使用数据增强零信任安全| NVIDIA 技术博客
- 网络安全框架: NVIDIA 简介 Morpheus | NVIDIA 技术博客
- NVIDIA 推出 Morpheus 早期访问计划,以实现高级网络安全解决方案开发| NVIDIA 技术博客
关于 Daniel Rohrer
DanielRohrer 是 NVIDIA 软件产品安全副总裁。在 NVIDIA 的 23 年中,他担任过各种技术和领导职务。 Daniel 通过提供先进的技术解决方案、可靠的流程和战略投资来构建值得信赖的安全解决方案,利用他对“ NVIDIA 的一切”的综合知识来完善安全实践。他拥有北卡罗来纳大学教堂山分校计算机科学硕士学位。
Daniel Rohrer 的更多信息: