AI开发编程 AI开发编程 开源项目
CodeGemma-开源代码模型

谷歌发布的代码辅助工具

标签:

CodeGemma,一个基于Google DeepMind的Gemma模型构建的开源代码模型家族,已经在代码生成和理解领域引起了巨大关注。这个模型不仅提高了代码生成能力,还保留了强大的自然语言理解能力,为各种应用场景提供了强大的支持。

 评估

CodeGemma在代码补全和生成任务上进行了全面评估,结果显示2B模型在速度和质量上都有出色表现。7B模型则在Python编程基准测试中显著超越了Gemma基模型。在多语言编程基准测试中,CodeGemma也展现了强大的编程能力。在自然语言理解和数学推理方面,CodeGemma保留了Gemma模型的大部分能力。

CodeGemma-开源代码模型

CodeGemma 作为 Gemma 模型的开放访问系列推出,针对代码开发场景进行优化、微调(fine-tuned)。该套件包括三种不同的模型:

  • 20 亿参数的基础模型:优化补全和生成代码,在注重延迟和隐私的情况下主要为代码提供快速高效的解决方案。

  • 70 亿参数基础模型:整合代码补全和自然语言处理,增强了其在完成代码和理解语言生成任务时的实用性。

  • 用于指导追踪的 70 亿参数模型:用户参与有关代码、编程和数学推理的对话,是开发人员寻求指导或注释的宝贵资源。

CodeGemma 的上述 3 个模型利用了预先训练的 Gemma 检查点,此外还训练了英语、数学和各种编码语言的另外 5000 亿个词块,在逻辑和数学推理方面的超凡能力,为代码生成和完成树立了新的标杆。

70 亿参数模型在 Python、Java、JavaScript 和 C++ 等各种编程语言中均表现出色。在 HumanEval 和 MultiPL-E 基准测试中取得的优异成绩充分证明了这一能力。此外,该模型在 GSM8K 评估中名列前茅,也证明了它的多功能性和有效性。

开源项目地址:

相关导航

暂无评论

暂无评论...