数据中心/云端

全球五大洲电信运营商正建立 NVIDIA 赋能的主权人工智能基础设施

AI 正在成为各行各业创新的基石,将创造力和生产力提升到新的水平,并从根本上重塑我们的生活和工作方式。AI 工厂是一种新型基础设施,可大规模制造智能,并为许多人认为的下一次工业革命奠定基础。

AI 工厂代表着传统云计算架构向专为 AI 工作负载设计和优化的加速计算基础设施的重置。这种架构转变为新参与者 (包括有时被称为“新云”的专业 AI 工厂提供商) 创造了机会。这些参与者通过向研究人员、初创公司和企业提供高性能、以 GPU 为中心的 AI 云服务来训练模型、微调和推理,从而取得了快速的成功。

新云提供商的成功推动了 AI 的普及,将强大的新 LLM 和 AI 模型带给数百万人。它还表明,从医疗健康到汽车,各行各业对 AI 工厂的需求是前所未有的,而且服务水平低下。

对 AI 工厂的巨大需求为电信服务提供商带来了新的商机。麦肯锡最近的研究表明,到 2030 年,电信公司可以解决的全球 GPU 即服务 (GPUaaS) 市场规模可能在每年 350 亿美元到 700 亿美元之间。

主权 AI 基础设施:国家当务之急

随着人工智能成为经济增长和创新的核心,各国日益认识到构建自己的主权 AI 基础设施的战略重要性。“计算鸿沟是新的数字鸿沟”这一概念与世界各地的技术领导者和决策者产生了强烈的共鸣。AI 超级计算系统现在被认为是关键的国家基础设施,对于以下目标至关重要:

  • 使国内 AI 发展与国家优先事项保持一致
  • 创造新的高技能工作和经济机会
  • 推动各行各业的生产力提升
  • 确保一个国家在全球 AI 经济中的竞争力
  • 培育国家 AI 创新生态系统,包括初创公司、企业以及学术和研究机构
  • 在医疗健康、教育和连接等领域大规模提供高效的市民服务

主权 AI 基础设施使各国能够根据其独特的文化、道德和经济重点来塑造 AI 发展,反映当地价值观,并应对特定的区域挑战。另一个关键驱动因素是在地理边界内保留对本地数据的控制、处理和所有权,包括遵守当地安全政策和法规。

电信公司:值得信赖的主权 AI 提供商

随着每个国家 地区都希望构建自己的 AI 基础设施,电信公司已成为非常适合的提供商。这并非偶然,而是源于电信公司拥有的一些内在优势:

  • 值得信赖的国家基础设施:电信公司已成为安全合规的国家数字和连接基础设施的支柱。他们与政府和企业建立了深厚的信任,成为托管敏感国家 AI 基础设施的天然合作伙伴。
  • 访问数据中心和光纤连接:电信公司已将大量数据中心设施作为其核心业务的一部分,从而在上市时间和成本效益方面占据优势。电信公司可以利用现有的空间和电力资源,快速实现现有 AI 数据中心的现代化,而不是从零开始建造新设施 (这需要数年的时间和巨大的资本投资) 。这些数据中心已经通过高速光纤网络 (另一种核心电信功能) 进行连接。
  • 在管理复杂系统方面的专业知识:电信公司在管理大规模任务关键型网络方面的经验很好地转化为运营 AI 工厂,而运营 AI 工厂需要相似的规模、可靠性、安全性和性能水平。
A black background with white logos of 18 global telcos that are building sovereign AI infrastructure with NVIDIA, including Cassava, Fastweb, FPT, Iliad/Scaleway, IOH, Reliance Jio, KDDI, Kazakhtelecom, Ooredoo, Singtel, SoftBank Corp., Swisscom, TELUS, Telconet, Telenor, Tata Communications, Viettel, and YTL.
图 1。至少有 18 家电信运营商在构建主权 AI 基础设施。

业界已认识到这些优势,在过去 18 个月中,18 家电信公司推出了由 NVIDIA 提供支持的 AI 工厂。这不是一次性现象,而是一个大趋势。今年,更多电信运营商正准备推出类似计划,为传统上以连接为重点的行业创造新的增长向量。

电信公司构建的主权 AI 基础设施示例

由 NVIDIA 提供支持的 18 家电信公司主导的 AI 工厂现已遍布五大洲:北美、南美、欧洲、亚洲和非洲。

  • 在日本,SoftBank Corp. 和 KDDI 已宣布进行重大投资,以建立大规模 AI 数据中心,并与合作伙伴合作开发自主开发的日语大语言模型和企业 AI 解决方案。
  • 在东南亚,印尼的 Indosat Ooredoo Hutchison 建立了该国首个主权 AI 工厂,为企业提供公民服务、医疗健康应用和基于印尼语的开源 LLM。新加坡的新加坡电信推出了 RE:AI,这是新加坡首个主权 AI 工厂,将为整个地区的企业、政府机构、研究人员和学术界提供 AI 云服务。它旨在通过普及 AI 来支持新加坡的国家 AI 战略 2.0。YTL AI Cloud 是一家由电信公司主导的主权 AI 工厂,支持马来西亚实现数字经济目标。FPT 已在越南和日本推出 AI 工厂,提供 NVIDIA GPU 加速计算平台和 20 余款即用型 AI 应用,助力企业和初创公司加速主权 AI 的开发和采用。在印度,Tata Communications 正在为制造、医疗健康、零售和金融服务等行业提供 AI 云基础设施。
  • 总部位于卡塔尔的 Ooredoo总部位于卡塔尔的 Ooredoo 正在中东和周边国家 地区投资建设 AI 工厂。其目标是为阿尔及利亚、科威特、马尔代夫、阿曼、突尼斯和卡塔尔的政府、企业和初创公司提供 GPUaaS 和本地化 AI 生态系统开发。
  • 在欧洲,Iliad Group 旗下子公司 Scaleway 通过高端 GPU 扩展了其在母国法国的 AI 云容量,以支持初创公司和企业。Telenor 在北欧推出了一个主权、安全和可持续的 AI 工厂,容纳内部和外部租户。从小型集群开始,Telenor 现在正准备扩展其新的数据中心。Swisscom 正在构建瑞士 AI 平台,该平台正在投资瑞士首个 NVIDIA SuperPOD。在意大利,Fastweb 推出了 NeXXt AI 工厂,为意大利 AI 模型提供支持,并为教育、金融和工业领域提供 AI 服务。
  • 在拉丁美洲,厄瓜多尔领先的电信运营商 Telconet 部署了一个 AI 工厂,通过 AI 改善城市安全,支持各种用途的实施,并将新一代 GPU 引入该地区。

电信驱动的主权 AI 工厂的发展势头继续增强,最近有几项公告宣布将该运动引入北美、非洲和中亚。

TELUS:加拿大旗舰主权 AI 工厂

TELUS 已成为首家加入 NVIDIA 云合作伙伴计划的北美服务提供商,旨在为加拿大带来一个全面的主权 AI 工厂。该计划将为加拿大企业、初创公司和研究人员提供先进的 AI 基础设施,帮助他们开发更智能的 AI 产品、简化运营并保持竞争力,同时维护数据主权。

TELUS 的 AI 工厂将部署在其可持续数据中心,这些数据中心由 99% 的可再生能源提供动力支持,首个集群预计将于今年夏天在魁北克推出。通过与 NVIDIA 和 Hewlett Packard Enterprise 密切合作,TELUS 正在实施完全兼容的 NCP 参考架构和软件堆栈,以确保最佳性能和安全性。

Cassava Technologies:泛非 AI 基础设施

  • 将 AI 用例融入非洲企业市场
  • 面向区域初创公司的初创加速计划
  • 通过 NVIDIA 深度学习培训中心 (DLI) 提升技能
  • 创建非洲 LLM,助力本地化服务
  • 开发用于应对农业、医疗健康、教育和移动支付领域区域挑战的用例

Kazakhtelecom:中亚的 AI 催化剂

哈萨克斯坦启动了一项广泛的国家 AI 计划,包括开发面向关键行业的国家 LLM 和 AI 应用。为了支持本地基础设施的形成,Kazakhtelecom 正在启动一个由 NVIDIA GPU 和 NVIDIA AI Enterprise 提供支持的商业 AI 工厂。它计划在今年夏天推出。该平台将作为云服务提供,确保全国公共机构、私营企业、初创公司和大学能够使用安全的 AI 基础设施。这将为航空公司、银行、建筑、采矿以及石油和天然气等关键行业提供先进的 AI 模型和应用。

多样化用途推动电信 AI 工厂发展

随着电信赋能 AI 工厂的成熟,出现了一些主要的用户和用例类别。随着规模的扩大,大多数提供商都会涵盖以下几个领域:

用户 推动需求的 AI 工作负载示例
国家 开发能够反映当地语言和文化背景的国家 LLM 医疗健康、农业和教育等关键部门的 AI 用例由 AI 提供支持的公民服务,简化政府互动和司法流程支持学校、大学、科研机构和其他组织的 AI 教育支持 AI 创新沙盒、工具和
企业 使企业能够构建自己的特定模型将代理式 AI 和推理功能集成到企业工作流医疗健康、制造、金融服务和零售垂直行业是带来各种 AI 工作负载的突出租户
模型创建者 创建新 AI 模型的初创公司开展基础研究的公共或私营机构
内部电信公司 * 客户服务、网络运营 (BSS/ OSS) 工作负载,由生成式 AI/ 代理式 AI 加速,例如数字人、现场运营 AI 智能体等。* 适用于员工使用、内部聊天机器人和企业 IT 工作负载的授权 LLM 集中式网络工作负载

在最初的产能建设结束后,由于需求不断增长,许多电信 AI 工厂提供商已经开始投资扩展。这一成熟的增长向量促使许多电信公司创建专门的子公司或互补品牌,将其定位为 AI 服务提供商,以及作为连接提供商的关键作用。从首次对话到首次部署的过程通常在一年内完成,这反映了这些电信公司在利用 AI 机会方面的发展速度。他们大多数也是 NVIDIA Cloud 合作伙伴,从价值实现时间的角度提供独特的优势,而不仅仅是上市时间。

NVIDIA NCP:电信 AI 工厂蓝图

A stack diagram showing NVIDIA NCP reference architecture, including NVIDIA-certified systems, compute, network, storage, and software with electricity and data as inputs; and intelligence, tokens and business outcomes as outputs.
图 2。电信公司正在采用 NVIDIA NCP 参考架构来提供全栈 AI 基础设施解决方案,为客户和内部运营提供 AI 服务。

这些由电信公司提供支持的 AI 工厂的核心是 NVIDIA 的云合作伙伴计划,该计划提供了一个全面的参考架构,其中包括:

用于优化性能和效率的全栈技术平台

  • NVIDIA AI Enterprise 软件套件,提供企业级 AI 工具和框架
  • 预训练模型、应用蓝图和 NIM 微服务,可访问 900 多个 SDK 和 AI 模型,从而加速开发
  • 简化大规模 AI 训练和推理工作流
  • 适用于多租户环境的全面安全功能

NVIDIA 生态系统支持需求生成的强大功能

  • 大型合作伙伴生态系统,包括全球系统集成商、独立软件供应商、应用程序提供商和数据平台
  • 覆盖 250 个国家 地区的 600 万开发者
  • 连接 27000 家 NVIDIA 初创加速计划初创公司
  • 营销支持,以提高知名度并提供进入市场的合作机会

提升技能的教育和支持

  • NVIDIA DLI 培训计划助力培养国内 AI 人才
  • 面向不同利益相关者 (从学生到开发者) 的专门课程
  • 通过编程马拉松激发本地创新

这种全面的方法使电信公司能够快速建立自己的 AI 云提供商地位,同时确保互操作性、性能和成本效益。

下一步是什么:借助 AI 工厂进行纵向扩展,借助 AI-RAN 进行横向扩展

虽然 AI 工厂最初的重点主要集中在训练大型模型上,但未来的两个关键发展方向与电信提供商的战略优势一致:

  • 推理机会 – 随着基础模型的广泛部署,对推理基础设施的需求正在爆炸式增长。电信公司拥有分布式边缘数据中心,非常适合创建更接近最终用户的推理引擎,从而降低延迟并提高 AI 应用的性能。
  • RAN 与 AI 的融合 – AI-RAN 已成为无线网络的下一次演进。它使 AI 和 5G 工作负载能够在通用的加速计算基础设施上运行,同时还能利用 AI 提高无线网络的性能和效率。这意味着无线接入网现在可以成为 AI 推理中心。

这为电信公司带来了下一个巨大机遇,而这也是他们唯一有能力实现的目标 — — 在全国范围内构建 AI 电网。AI 网格利用集中式 AI 工厂处理训练和推理等计算密集型 AI 工作负载,同时利用分布式 AI-RAN 数据中心处理边缘 AI 工作负载,包括推理。除了 NVIDIA Cloud Functions 等功能之外,NVIDIA 还为 AI 工厂和 AI-RAN 提供了一个连贯一致的参考架构,这是一种无服务器 API,可以在 AI 工厂和 AI – RAN 基础设施中无缝编排供需。

随着对 AI 的空前需求,电信公司可以通过构建由 NVIDIA 提供支持的 AI 网格来保持领先地位,该网格可以纵向扩展和横向扩展,使 AI 尽可能接近最终用户。SoftBank Corp. 和 IOH 正在通过构建 AI 工厂和 AI-RAN,以及与 NVIDIA 和合作伙伴合作开发新的 AI 应用,开辟 AI 电网之路。他们正在共同构建 RAN-Ready AI 基础设施,以在其国家 地区创建、分发和使用智能。

通过利用 NVIDIA 的 NCP 参考架构和生态系统,电信提供商正在成为连接和 AI 服务提供商,创造一个良性循环。随着国内 AI 应用的涌现,对 AI 基础设施的需求也在增长,随着基础设施的扩展,越来越多的开发者和企业可以参与 AI 经济。通过这一循环,电信公司不仅在构建数据中心,还在为包容性主权 AI 经济奠定基础,并在每个国家 地区的智能革命中起飞轮。

探索 NVIDIA 加速的主权 AI 工厂,并向行业领导者了解更多信息:

 

标签