不知不觉间,日历已经翻过了立夏,而开源模型的世界中似乎并没有春夏秋冬。在刚刚过去的四月份,见证了开源社区又一次蓬勃发展的浪潮。以Qwen3家族为代表,一系列新模型的开源为整个生态注入了新的活力。通过全面覆盖多种规格的 dense 与 MoE 模型架构,Qwen3 首次在开源模型中引入“快思考与慢思考” 双模式的支持,获得了广大开发者的热烈欢迎,成为新一代开源大模型的标杆之作。

在5·1“劳动节”前夕,DeepSeek也发布了其新一代的数学推理模型DeepSeek Math Prover,让更多的开发者对其下一代旗舰模型的开源充满期待。与此同时,我们热烈欢迎小米也正式入驻ModelScope社区,并交出了在开源模型领域的首份答卷——MiMo系列模型。业界在前沿多模态模型的探索也从未停止,阶跃推出的Step1X图像编辑模型,以及ACE-Step打造的音乐生成大模型,均在社区引起了不小的反响,同时Wan2.1系列也补齐了首尾帧视频模型的生态,让视频生成更加可控。

在ModelScope团队内部,为了探索与GPT-4o的图像生成,图像编辑以及图像理解等能力的对齐,我们结合LLM的语言推理和Diffusion模型的图像合成,训练并开源了Nexus-Gen模型,希望推进社区对于全模态模型的理解与进一步探索。

在社区的生态建设方面,我们持续推进MCP广场的建设与优化。截至目前,平台上已上线超过 3000 个 MCP Server。同时秉承开放的态度,我们把ModelScope MCP广场通过标准API对外开放,支持被不同的应用生态所集成。目前,ModelScope MCP广场已经被包括Cherry-Studio,通义灵码在内的不同工具集成,方便广大开发者更好地使用。

· 站点更新

1. MCP开放生态建设:

  • 上线 ModelScope MCP OpenAPI,提供诸多API方便三方开发者在不同应用中集成ModelScope MCP广场;

  • 与Cherry-Studio合作,在Cherry-Studio客户端可同步并使用在ModelScope MCP 广场已配置连接的Hosted MCP服务;

  • 与通义灵码合作,在通义灵码插件端MCP广场即可发现、安装并使用 ModelScope全量MCP服务。

2. MCP服务链接页面整体改版和功能完善,支持服务重置/取消等能力。同时包括工具测试等一系列功能完成在移动端页面补齐。

3. AIGC专区x/y/z对比生图功能优化,Y/Z选项调整为非必选。新增高清聚合能力,便于用户直观对比图像矩阵差异。

4. 对于模型详情页右边栏进行改版,支持信息密度更高、更便捷的模型生态关联入口。同时模型血缘关系添加“Repackaged”关系支持,更准确描述尤其在AIGC领域常见的模型重组血缘关系

5. 模型交流反馈专区整体改版上线,支持社区更好的围绕模型进行沟通讨论。同时支持评论作者组织信息展示。

6. 为了方便开发者在熟悉的配置下对模型进行深入了解,我们尝试将模型介绍页面的语言,根据浏览器配置做自动匹配,也期望收到大家对于这一改动的反馈。

7. 支持链接PAI Model Gallery,进行模型的评测。

8. 创空间Gradio版本升级到支持5.29版本,提供了Gradio as MCP等功能。

· 开源SDK与工具链更新

1. SWIFT 3.4.0以及3.4.1版本发布。

  • 全方面支持Qwen3系列模型(包括dense和MoE),包括使用Megatron训练(CPT/SFT),在MoE模型上实现比transformers训练速度10倍的提升。同时支持了基于Qwen3底座训练VL模型。

  • Agent训练引入template模式,支持agent数据集在不同模型之间的训练切换。添加了在PT/SFT/DPO阶段使用Ulysses序列并行的支持。兼容deepspeed、packing、flash_attn、streaming等训练技术。

  • GRPO支持自定义奖励模型逻辑。Megatron训练支持到达max_epochs时停止训练并保存权重。

  • 感谢招商银行技术团队贡献freeze/activate parameters的正则表达式支持,以及初始化策略指定。

2. EvalScope更新到0.15.1。全面支持Qwen3系列评测,包括对于切换思考模式之间的评测对比。完善了对于多选场景下的评测功能。EvalScope整体添加文生图场景下的评测,首期覆盖了MPS、HPSv2.1Score等8个指标,并支持EvalMuse、GenAI-Bench等评测基准。

3. 主库1.26版本发布。对于importlib使用场景上细化的代码安全控制,并支持模型下载中更精准的文件列表控制。对于云上环境,提供自适应的模型下载全链路加速。

4. DiffSynth:完成Step1X,Flux-Controlnet,Phantom,Wan-Fun v1.1等模型的接入和推理优化。发布ImagePulse数据集,以及对应数据集搭建工具的开源。基于数据集以及DiffSynth框架训练了Nexus-Gen模型初版,已开源,模型效果进一步优化进行中。

5. ModelScope-agent: 密集开发支持MCP生态中,敬请期待。

 

魔搭核心开发者共创会 | 邀请函

5月23日 14:00-17:00,在杭州 · 阿里云云谷园区,魔搭社区ModelScope核心开发者共创会来袭!本次活动聚焦大语言模型应用开发、AIGC轻量化训练、Agent开发框架等技术方向,与新老朋友们共同探讨开源社区共建、企业AI应用落地!

✨扫描海报下方二维码即可报名参与,名额有限!

Logo

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!

更多推荐