点击上方关注 “终端研发部

 
 
设为“星标”,和你一起掌握更多数据库知识

论国内大模型,还得是阿里

这回全家桶齐全,Qwen2.5 全家桶果然是吊的一批,这三大类模型一共有10多个版本,包括0.5B、1.5B、3B、7B、14B、32B和72B,适用于个人、企业以及移动端、PC等不同人群不同业务场景的模型

其涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架100多个模型:

  • Qwen2.5: 0.5B、1.5B、3B、7B、14B、32B 和 72B

  • Qwen2.5-Coder:1.5B、7B 和 32B(即将发布)

  • Qwen2.5-Math:1.5B、7B 和 72B。

Qwen2.5系列性能测试

2b39e9473409990c15f14ba42cedcde7.jpeg

先看一下,这张截图

尽管Qwen2.5的参数规模仅为720亿,却在多项基准测试中超越了Meta的4050亿参数开源Llama-3.1模型,以及Mistral的最新Large-V2模型,成为当前最强的开源模型之一。

fa5a6068f4fe666aaaf0dbcaf0d0898e.jpeg

多模态模型方面,广受期待的视觉语言模型Qwen2-VL-72B正式开源,Qwen2-VL能识别不同分辨率和长宽比的图片,理解20分钟以上长视频,具备自主操作手机和机器人的视觉智能体能力。

464a62ffe58e83da1f04cad04fc941a4.jpeg

日前权威测评LMSYS Chatbot Arena Leaderboard发布最新一期的视觉模型性能测评结果,Qwen2-VL-72B成为全球得分最高的开源模型。

2.5到底有什么亮点呢

1、有着更大的数据集

Qwen2.5语言模型通过在18T tokens大规模数据集上的预训练,相较于前代Qwen2,在知识(MMLU:85+)、编程(HumanEval 85+)和数学能力(MATH 80+)方面取得显著提升。

2、支持更强的指令遵循能力

新模型增强了指令遵循能力,包括执行复杂指令、生成长文本(>8K标记)、处理结构化数据和生成JSON等结构化输出,对各种system prompt适应性更强,提升了角色扮演和聊天机器人的条件设置功能。

3、更强的文本能力

Qwen2.5支持长达128K tokens的长文本生成,多语言能力覆盖29种以上语言。专业领域如编程(Qwen2.5-Coder)和数学(Qwen2.5-Math)的模型能力也得到增强,特别是在编程评估和数学推理方法的整合上。

4、多种语言支持

59e8069f9e8e975a0fbd12bb0396648a.png

同时,Qwen2.5-Math 支持 中文 和 英文,并整合了多种推理方法

3f2046e82798976ef27c3b589d8c809d.png

Qwen2.5-3B作为这一趋势的代表,凭借约30亿参数便展现出卓越性能,凸显了其相较于先前模型的高效能和强大实力。

9b15d7fba49de69a4301793991b95381.jpeg

目前的累计下载量已突破4000万,成为仅次于Llama的世界级模型群

果然,论大模型,阿里也是煞费苦心了!

0966a7ab7931305b0e9172163ac1237d.jpeg

回复 【idea激活】即可获得idea的激活方式

回复 【Java】获取java相关的视频教程和资料

回复 【SpringCloud】获取SpringCloud相关多的学习资料

回复 【python】获取全套0基础Python知识手册

回复 【2020】获取2020java相关面试题教程

回复 【加群】即可加入终端研发部相关的技术交流群

阅读更多

用 Spring 的 BeanUtils 前,建议你先了解这几个坑!

lazy-mock ,一个生成后端模拟数据的懒人工具

在华为鸿蒙 OS 上尝鲜,我的第一个“hello world”,起飞!

字节跳动一面:i++ 是线程安全的吗?

一条 SQL 引发的事故,同事直接被开除!!

太扎心!排查阿里云 ECS 的 CPU 居然达100%

一款vue编写的功能强大的swagger-ui,有点秀(附开源地址)

相信自己,没有做不到的,只有想不到的

在这里获得的不仅仅是技术!

4f6be7d25a5da8cc379ba8817b470d25.png

f602dc3fdd44bd49485daeb026edc215.gif

喜欢就给个“在看fc3b65cc2e76a3bb146d44f9d09d0523.gif 

Logo

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!

更多推荐