Posts by Sylendran Arunagiri
开发与优化
2025年 7月 9日
使用 NVIDIA NeMo-RL 进行强化学习:通过 GRPO 复制 DeepScaleR 配方
强化学习 (RL) 是交互式 AI 的支柱。它对于教导智能体推理和从人类偏好中学习、实现多轮工具使用等至关重要。
2 MIN READ
AI 平台/部署
2025年 7月 3日
新视频:使用 NVIDIA Data Flywheel Blueprint 构建可自我提升的 AI 代理
由大语言模型驱动的 AI 智能体正在改变企业工作流,但高昂的推理成本和延迟可能会限制其可扩展性和用户体验。为解决这一问题,
1 MIN READ
AI 平台/部署
2025年 6月 11日
利用 NVIDIA Data Flywheel Blueprint 通过模型蒸馏构建高效的 AI 智能体
随着企业加速采用代理式 AI,团队在扩展智能应用程序的同时管理推理成本方面面临着越来越大的挑战。大语言模型 (LLM) 提供强大的性能,
2 MIN READ
生成式人工智能/大语言模型
2025年 3月 18日
使用 NVIDIA NeMo 微服务和数据飞轮实现 AI 智能体性能最大化
随着 代理式 AI 系统 的发展并成为优化业务流程的关键,开发者必须定期更新这些系统,以适应不断变化的业务和用户需求。
3 MIN READ