Featured image of post 上海AI实验室与商汤科技发布下一代"书生通用大模型体系",在多个领域取得巨大突破

上海AI实验室与商汤科技发布下一代"书生通用大模型体系",在多个领域取得巨大突破

上海 AI 实验室与商汤科技在 2023 世界人工智能大会发布全新的"书生通用大模型体系",引起广泛关注。

这一新一代模型体系包括三个基础模型:多模态、浦语和天际,并且提供了全链条的开源工具体系。在开源的过程中,他们发布了 InternLM-7B,一个具有 70 亿参数的轻量级版本,表现卓越且平衡,成功刷新了 7B 量级模型的世界纪录。

在改进方面,书生·浦语在多个领域取得了令人瞩目的突破。它在长输入、复杂推理和多轮对话等方面展现出了强大的能力,多语种和结构化表达能力得到了进一步加强,并支持二十多种语言和复杂信息的汇总与呈现。另外,在主流评测集上的表现也超越了 ChatGPT,证明了其在多维度能力方面的显著提升。

此外, InternLM-7B 的数理逻辑能力也有了明显进步。它在数值计算、函数运算和方程求解等方面表现出更高的准确性,并在高考数学选择题上的正确率提升超过 70%。同时,安全与对齐能力也得到了显著增强,通过更有效的指令微调,模型可以更可靠地遵循人类指令,提升了安全性和使用体验。

该模型的全链条开源体系包括数据、预训练、微调、部署和评测五大环节。其中,开放了包含超过 30 种模态的 5500 个公开数据集,以及面向轻量级语言大模型的训练框架 InternLM-Train。此外,还提供了全流程微调工具、部署推理工具链 LMDeploy 和开放评测平台 OpenCompass,以支持模型的开发和应用。

这一重大突破使得书生通用大模型体系成为当前人工智能技术创新的重要基石,并有望为多个领域和行业带来更多机遇和应用潜力。

GITHUB

相关报道