Kazuki Fujii

Kazuki Fujii 于 2024 年毕业于东京工业大学 (Tokyo Institute of Technology),获得计算机科学学士学位,目前在东京工业大学 (2024 - 2026) 攻读硕士学位。Kazuki 负责 Swallow 模型系列的预训练和微调,Swallow 模型系列是截至 2023 年 12 月专门使用日语和英语的先进多语种大语言模型 (LLM).Kazuki 专注于分布式训练和构建可扩展的训练系统,以提高模型的性能和基础设施效率。

Posts by Kazuki Fujii

生成式人工智能/大语言模型

使用 NVIDIA Megatron-LM 构建强大日语能力的 1720 亿语言模型

生成式 AI 具有创建全新内容的能力,这是传统机器学习(ML)方法难以实现的。在自然语言处理(NLP)领域, 大型语言模型(LLMs)… 2 MIN READ