近日,英伟达携手 Hugging Face 与 ServiceNow,推出新一代代码生成领域标杆——StarCoder2 LLMs模型系列。这一系列模型以其出色的性能、透明度及成本效益优势,致力于树立全新行业标准。
该系列囊括了由ServiceNow打造的30亿参数模型、Hugging Face训练的70亿参数模型,以及英伟达自身研发的150亿参数模型。
这一成就得益于名为Stack v2的庞大新代码数据集,其规模是Stack v1的七倍;同时,模型采用了新型训练技术,大幅提升了对于COBOL等资源较少编程语言、数学及源代码讨论的理解能力。
StarCoder2接受了619种编程语言的培训,专业能力覆盖源代码生成、工作流程构建及文本摘要等任务。英伟达强调,开发者可借助此模型进行代码补全、高级代码概括及代码片段检索等功能,极大提升工作效率。
与初代StarCoder LLMs相比,新的30亿参数模型经过优化,筛选出更优质的参数,其性能可媲美初始版本的150亿参数模型。
StarCoder2遵循BigCode Open RAIL-M许可证,提供免版税的访问和使用权限。
对于感兴趣的用户,可访问BigCode项目的GitHub页面获取源代码,并通过Hugging Face平台下载相应模型。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...