Posts by Babak Hejazi
生成式人工智能/大语言模型
2025年 5月 1日
借助 NVIDIA cuBLAS 12.9 提高矩阵乘法速度和灵活性
NVIDIA CUDA-X 数学库助力开发者为 AI、科学计算、数据处理等领域构建加速应用。
3 MIN READ
对话式人工智能
2024年 6月 12日
在 cuBLAS 中引入分组 GEMM API 以及更多性能更新
最新版本 NVIDIA cuBLAS 库版本 12.5 将继续为深度学习(DL)和高性能计算(HPC)工作负载提供功能和性能。
2 MIN READ
对话式人工智能
2023年 2月 1日
NVIDIA Hopper GPU 上的新 cuBLAS 12.0 功能和矩阵乘法性能
NVIDIA H100 TensorCore GPU 基于 NVIDIA Hopper 架构 和第四代 NVIDIA Tensor…
5 MIN READ