对话式人工智能/自然语言处理

区域 LLM SEA-LION 和 SeaLLM 服务于东南亚的语言和文化

在最近于迪拜举行的世界各国政府首脑会议上,NVIDIA 首席执行官黄仁勋强调了 主权人工智能 的重要性,即一个国家开发和部署人工智能技术的能力。当前,各国已经开始构建区域大型语言模型(LLM),将其文化、历史和智力编纂成文,并利用生成人工智能的优势为公民提供服务。

NVIDIA 近期优化并托管了两个开放的区域语言模型,分别是 SeaLLM 和 SEA-LION,现在这些模型已经可以通过 NVIDIA API 产品目录 获取。

SeaLLM

这个 SeaLLM 模型标志着我们在开发更具包容性和区域定制的人工智能技术方面取得了重大进展,该模型专门针对东南亚不同的语言和文化差异进行了定制。

SeaLLM 由阿里巴巴开发,以 Llama 2 为基础,经过广泛的预训练。它包含了扩展的词汇、专业指导和调整,以更好地掌握地区语言的复杂性。这使模型能够尊重和反映当地的文化习俗、风俗习惯、风格偏好和法律要求。

Screenshot of the SeaLLM language model running in the API catalog user interface, where the model understands natural language and generates responses based on user input prompt.
图 1。SeaLLM 模型从用户提示生成响应的示例

SeaLLM 模型系列在各种语言任务和遵循助手式指令方面表现出非凡的性能,超过了可比的开放模型。这些模型表现出与当地习俗、风格和法律框架相一致的文化敏感性。这一特性对于聊天机器人助手等应用程序尤其重要,可以确保与来自不同文化背景的用户进行自然和适当的互动。

SEA-LION

此外,SEA-LION 语言模型(LLM)是另一项重要的人工智能倡议,其目标是更好地代表东南亚地区的语言和文化多样性。

SEA-LION 由 AI Singapore 开发,接受了 11 种主要东南亚语言的培训,包括印尼语、泰语、越南语、菲律宾语、缅甸语、马来语、老挝语等。这种广泛的语言覆盖使该模型能够处理传统上在主要语言模型中代表性不足的语言。

SEA-LION 旨在支持广泛的应用程序,从翻译服务和客户服务聊天机器人到社交媒体平台上的内容审核。它能够理解和生成多种东南亚语言的文本,这对于需要跨不同语言群体进行有效沟通的地区企业和政府来说尤其有价值。

针对性能进行了优化

这些模型针对延迟和吞吐量进行了优化,使用 NVIDIA TensorRT LLM。它们涵盖了二十多个流行的人工智能模型,这些模型由 NVIDIA NIM 微服务提供,旨在简化性能优化的部署,以支持 NVIDIA AI Foundation 模型 和自定义模型的部署。借助 NIM,10 到 100 倍的企业应用程序开发人员能够为人工智能转型做出贡献。

NVIDIA 正与领先的模型构建商合作,在完全加速的堆栈上支持他们的模型。其中包括流行的型号,如 Llama3-70BLlama3-8BGemma 2BMixtral 8x22B 等。您可以访问 build.nvidia.com,在企业应用程序中体验、定制和部署这些模型。

开始使用

要开始使用 SeaLLM 和 SEA-LION,请访问 build.nvidia.com。使用免费的 NVIDIA 云信用,您可以开始大规模测试模型,并通过将应用程序连接到运行在完全加速堆栈上的 NVIDIA 托管 API 端点上来构建概念验证(Proof of Concept,POC)。

Tags