Posts by Hao Wu
数据中心/云端
2025年 5月 14日
借助 NVIDIA Nemo 框架,在远程数据中心网络中加速 LLM 训练
多数据中心训练对 AI 工厂至关重要,因为预训练扩展会推动更大模型的创建,导致对计算性能的需求超过单个设施的能力。
2 MIN READ
数据科学
2022年 8月 31日
NVIDIA Merlin Distributed-Embeddings轻松快速训练TB 级推荐模型
Embedding在深度学习推荐模型中起着关键作用。它们被用于将输入数据中的离散特征映射到向量,以便下游的神经网络进行处理。
3 MIN READ
人工智能/深度学习
2021年 7月 20日
利用 NVIDIA TensorRT 量化感知训练实现 INT8 推理的 FP32 精度
深度学习正在彻底改变行业提供产品和服务的方式。这些服务包括用于计算机视觉的对象检测、分类和分割,以及用于基于语言的应用程序的文本提取、
5 MIN READ