李开复旗下AI公司零一万物宣布开源新模型,Yi-9B被誉为“理科状元”

AI每日新闻10个月前发布 shen
457 0

3月6日,备受瞩目的AI领域传来一则重要消息。由李开复创新工场董事长兼CEO亲自挂帅的人工智能公司“零一万物 01AI”通过官方公众号正式宣布开源其最新研发的Yi-9B模型。该模型在官方声明中被赞誉为Yi系列模型中的“理科状元”,以其卓越的代码和数学能力傲视群雄,成为了AI界的一颗耀眼新星。

据悉,Yi-9B模型的实际参数达到了惊人的8.8B,其默认上下文长度更是设定为4K tokens,这一数据指标无疑展示了该模型在处理复杂任务时的强大能力。值得一提的是,Yi-9B是在已有的Yi-6B模型基础上,通过进一步使用0.8T tokens进行训练而得到的,训练数据截止至2023年6月,这一持续优化的过程使得Yi-9B在继承Yi-6B优势的基础上,性能得到了显著提升。李开复旗下AI公司零一万物宣布开源新模型,Yi-9B被誉为“理科状元”

在综合能力评估(Mean-All)方面,Yi-9B的表现尤为出色,其性能在尺寸相近的开源模型中脱颖而出,超越了DeepSeek-Coder、DeepSeek-Math、Mistral-7B、SOLAR-10.7B以及Gemma-7B等众多知名模型,展现出了强大的综合实力。

在代码能力(Mean-Code)方面,Yi-9B同样表现不俗,其性能仅次于DeepSeek-Coder-7B,成功超越了包括自家前辈Yi-34B在内的SOLAR-10.7B、Mistral-7B和Gemma-7B等模型,再次证明了其在代码处理领域的领先地位。

而在数学能力(Mean-Math)的比拼中,Yi-9B同样展现了强大的实力,虽然其性能略逊于DeepSeek-Math-7B,但依旧超越了SOLAR-10.7B、Mistral-7B和Gemma-7B等模型,显示出了其在数学逻辑处理上的卓越才能。

至于常识和推理能力(Mean-Text),Yi-9B同样表现出色,与Mistral-7B、SOLAR-10.7B和Gemma-7B等模型不相上下,这一成绩再次证明了Yi-9B在多个维度上的均衡发展和全面优化。李开复旗下AI公司零一万物宣布开源新模型,Yi-9B被誉为“理科状元”

除了强大的性能表现,Yi-9B模型还具备出色的易用性和经济性。官方宣称,无论是Yi-9B(BF 16)还是其量化版Yi-9B(Int8),均能在消费级显卡上轻松部署,这无疑大大降低了模型的使用门槛,使得更多的开发者和研究者能够轻松利用这一强大工具进行创新和探索。同时,其较低的使用成本也使得Yi-9B成为了一款开发者友好的模型,有望推动AI技术在更广泛领域的应用和普及。

AI旋风了解到,零一万物公司此前已推出Yi-34B和Yi-6B两个开源大模型,并承诺对学术研究完全开放,同步开放免费商用申请。这一举措不仅彰显了公司对于推动AI技术发展的决心和担当,也为广大研究者和开发者提供了宝贵的资源和平台。

Yi-9B模型的开源和发布,无疑为AI领域注入了新的活力和动力。其强大的性能和友好的使用方式,将有望推动AI技术在更多领域的应用和创新。同时,零一万物公司的开放态度和持续创新的精神,也为整个AI行业树立了良好的榜样。我们期待在未来看到更多像Yi-9B这样的优秀模型问世,共同推动AI技术的发展和进步。

© 版权声明

相关文章

暂无评论

暂无评论...