Posts by Shengyang Sun
生成式人工智能/大语言模型
2024年 12月 17日
利用 NVIDIA NeMo-Aligner 进行监督式微调的数据高效知识蒸馏
知识蒸馏是一种将更大的教师模型的知识转移到更小的学生模型的方法,理想情况下可生成紧凑、易于部署的学生,且准确度与教师相当。
2 MIN READ