Posts by Dongxu Yang
代理式 AI/生成式 AI
2025年 9月 22日
扩展 TensorRT-LLM 中的专家并行度:大规模 EP 的设计与实现
DeepSeek-V3 / R1 等模型采用大规模细粒度混合专家模型 (MoE) 架构,大幅提升了开源模型的质量。
10 MIN READ
数据科学
2024年 4月 3日
使用 WholeGraph 优化图形神经网络的内存和检索,第 2 部分
大规模图形神经网络 (GNN) 训练带来了艰巨的挑战,特别是在图形数据的规模和复杂性方面。这些挑战不仅涉及神经网络的正向和反向计算的典型问题,
2 MIN READ
数据科学
2024年 3月 8日
WholeGraph 存储:优化图形神经网络的内存和检索
图形神经网络 (GNN) 彻底改变了图形结构数据的机器学习。与传统神经网络不同,GNN 擅长捕捉图形中的复杂关系,
2 MIN READ