Posts by Zhilin Wang
生成式人工智能/大语言模型
2024年 10月 3日
新的奖励模型有助于改善 LLM 与人类偏好的匹配
从人类反馈中进行强化学习(Reinforcement learning from human…
1 MIN READ
对话式人工智能
2023年 11月 27日
宣布推出 HelpSteer:用于构建实用 LLM 的开源数据集
NVIDIA 最近宣布了 NVIDIA NeMo SteerLM 技术,它是 NVIDIA NeMo 的一部分。
3 MIN READ
对话式人工智能
2023年 10月 11日
宣布推出 SteerLM:在推理期间自定义 LLM 的简单实用技术
近年来,随着大语言模型 (LLMs)例如 GPT-3、Megatron-Turing、Chinchilla、PaLM-2、
3 MIN READ