近日,在人工智能领域掀起了一股新的旋风。智谱AI公司宣布,其技术团队成功开发出GLM系列的第四代模型——GLM-4-9B,并正式对外开源。这一里程碑式的成果,不仅标志着人工智能技术的进步,也预示着AI模型在性能和应用方面的新飞跃。
自2023年3月14日GLM技术团队开源ChatGLM-6B以来,便以其卓越的性能和广泛的应用前景赢得了业界的广泛关注和认可。随后,ChatGLM3-6B的推出更是进一步提升了GLM系列模型的市场地位。如今,GLM-4-9B的开源,无疑将再次引领AI模型发展的新潮流。
据智谱AI官方介绍,GLM-4-9B在预训练阶段采用了大语言模型进行数据筛选,成功获得了高达10T的高质量多语言数据,这一数据量相比ChatGLM3-6B提升了3倍以上。同时,GLM-4-9B还采用了FP8技术进行高效的预训练,使得训练效率提高了3.5倍。在有限的显存条件下,GLM技术团队不断探索性能极限,最终决定将模型规模提升至9B,并将预训练计算量增加了5倍,以实现更强大的性能。
GLM-4-9B模型在性能上实现了全面升级。首先,其基础版本的GLM-4-9B(8K)在中英文综合性能上比ChatGLM3-6B提升了40%,这一提升将使得模型在文本生成、问答等任务上更加准确、流畅。其次,GLM-4-9B的对话版本GLM-4-9B-Chat(128K)和超长上下文版本GLM-4-9B-Chat-1M(1M)分别将上下文长度从128K扩展到1M tokens,相当于能够处理2本《红楼梦》或125篇论文长度的文本,这将极大地提升模型在处理长文本任务时的能力。
此外,GLM-4-9B还具备多语言、多模态和All Tools等能力。它支持26种语言,词表大小扩充到150k,编码效率提高30%,使得模型能够更好地处理多语言环境下的任务。同时,GLM-4-9B还具备Function Call能力,在Berkeley Function-Calling Leaderboard上表现优秀,展示了其强大的函数执行能力。此外,GLM-4-9B还首次推出了多模态版本GLM-4V-9B-Chat(8K),将文本、图像、音频等多种模态的信息进行融合,进一步提升了模型的性能和应用范围。
AI旋风认为,GLM-4-9B的开源将对人工智能领域产生深远的影响。首先,它将为开发者提供更加强大、灵活的AI模型,推动人工智能技术在各个领域的应用和发展。其次,GLM-4-9B的开源将促进AI技术的普及和共享,使得更多的研究者和开发者能够参与到AI技术的研究和应用中来。最后,GLM-4-9B的推出将进一步推动人工智能技术的创新和进步,为未来的智能化社会奠定坚实的基础。
总的来说,智谱AI的GLM-4-9B模型是一项具有里程碑意义的成果。它的开源将为人工智能领域带来更加广阔的发展空间和更加丰富的应用场景。我们期待着看到更多基于GLM-4-9B模型的优秀应用和创新成果的出现,共同推动人工智能技术的不断发展和进步。