阿里巴巴云的 Qwen 团队推出了 Qwen2-Math 系列大型语言模型,专门用于解决复杂的数学问题。其特点是数学问题准确率高。Qwen2-Math是 "Qwen2 "系列的衍生模型,以 "Qwen2生成的数学相关信息 "作为学习数据。

并且这些建立在现有 Qwen2 基础上的新模型在解决算术和数学难题方面表现出了非凡的能力,并超越了以前的行业领先者。

Qwen 团队使用庞大而多样的数学专用语料库精心打造了 Qwen2-Math。该语料库由丰富的高质量资源组成,包括网络文本、书籍、代码、试题以及由 Qwen2 本身生成的合成数据。

在中英文数学基准(包括 GSM8K、Math、MMLU-STEM、CMATH 和高考数学)上进行的严格评估显示了 Qwen2-Math 的卓越能力。值得一提的是,旗舰机型 Qwen2-Math-72B-Instruct 在各种数学任务中的表现超过了 GPT-4o 和 Claude 3.5 等专有机型。

在这里插入图片描述
Qwen2-Math 有基本模型 “Qwen2-Math-1.5B”、"Qwen2-Math-7B "和 “Qwen2-Math-72B”,以及命令调整模型 “Qwen2-Math-1.5B-Instruct”、"Qwen2-Math-7B-Instruct "和 “Qwen2-Math-72B-Instruct”。从图中可以看出,"Qwen2-Math-72B-Instruct "的数学解题能力高于 “GPT-4o”、“Claude-3.5-Sonnet”、"Gemini-1.5-Pro "和 "Llama-3.1-405B "等模型。

介绍 Qwen2-Math | Qwen
https://qwenlm.github.io/blog/qwen2-math/

QwenLM/Qwen2-Math:我们的 Qwen2 系列中的一系列数学专用大型语言模型。
https://github.com/QwenLM/Qwen2-Math

以下是大规模语言模型的数学性能基准测试结果。即使是在 Qwen2-Math 指令调整模型中参数最少的 “Qwen2-Math-1.5B-Instruct”,也在大多数基准测试中优于 “Llama-3.1-70B-Instruct”。
在这里插入图片描述

在撰写本文时,Qwen2-Math 只支持英文,中文版将很快发布。各模型可从以下链接获取。

Qwen (Qwen)
https://huggingface.co/Qwen

在这里插入图片描述
感谢大家花时间阅读我的文章,你们的支持是我不断前进的动力。期望未来能为大家带来更多有价值的内容,请多多关注我的动态!

Logo

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!

更多推荐