Sadaf Khan

Sadaf Khan 是 Data Factory 的一名数据科学家,从事对齐数据的质量保证、大语言模型的自动偏差评估以及人类内容安全红色团队工作。

Posts by Sadaf Khan

网络安全

定义 LLM 红色团队

在一项活动中,人们为生成式 AI 技术 (例如大语言模型 (LLMs)) 提供输入,以确定输出是否会偏离可接受的标准。 1 MIN READ