ModelScope魔搭25年6月发布月报

从2022年11月的青涩发布，魔搭现今已进入第三个年头，成为中国最大最活跃的开源模型社区，与超过1600万的开发者同行。

魔搭ModelScope社区

21人浏览 · 2025-06-17 18:07:03

魔搭ModelScope社区 · 2025-06-17 18:07:03 发布

叮叮叮！从2022年11月的青涩发布，魔搭现今已进入第三个年头，成为中国最大最活跃的开源模型社区，与超过1600万的开发者同行。上个月我们在杭州举办了“搭友来碰头”的核心开发者共创会，本月底，我们将在北京·海淀香格里拉饭店举办首届魔搭开发者大会（ModelScope DevCon 2025），诚邀广大开发者与我们在6月30号欢聚北京，共建开源技术生态！

过去一个月，社区依然保持活跃发展态势。我们迎来了DeepSeek-R1的一个“小更新”，Qwen也补齐了开源序列中的Embedding和Rerank模型。小米 MiMo 开源系列新增了 MiMo-VL 模型。而来自字节 Seed 系列的开源项目迎来一波发布浪潮，包括Seed-Coder，SeedVR以及在多模态模型结构方面进一步创新探索的 BAGEL 模型。来自面壁的MiniCPM小钢炮更新到了4.0版本，进一步探索端侧智能的极限。mistralAI，小红书hilabs，腾讯混元，通义万相……无论是业界熟悉的团队，还是新晋AI研究力量，都在过去一个月中活跃于社区，并贡献了多个最新开源模型。

在平台建设方面，ModelScope 站点已完成对各主要板块的页面样式、排版及字体的整体重构升级，同时优化了开发者暗黑模式的展示效果，旨在为 AI 开发者提供更符合使用习惯的浏览体验。MCP广场提供了开发者自主贡献MCP Server的链路，以更开放的姿势，拥抱开源模型与MCP的联合生态。同时，MCP 广场的 OpenAPI 接口文档已正式发布，便于更多工具和生态体系实现灵活集成。ModelScope 的 MCP 实验场功能已通过 ModelScope-Agent 项目实现开源。围绕以 MCP 为代表的工具生态需求，ModelScope-Agent 目前也正经历全面重构与功能升级。在平台多元素间的血缘关联方面，我们优化了论文板块与模型等元素的自动关联机制，让广大学术范的开发者，可以在平台上直接完成从模型到模型技术报告/论文的全闭环✌️。在AIGC专区，过去一个月我们进一步完善了视频生成能力的支持体系，在扩展模型规格的同时，新增了图生视频、首尾帧生视频等功能，为社区开源模型的标杆视频生成能力，实现了服务化和外化，期望开发者能够通过这些模型服务能力，更快的上手体验模型能力。

· 站点更新

1. 站点主要板块排版/字体等更新重构，希望在为广大开发者保障页面信息密度的同时，确保视觉浏览上的舒适度

2. MCP开放生态建设

- 开放MCP server的开发者自主贡献链路，更积极的拥抱MCP与开源模型的联合生态。

上线 ModelScope MCP OpenAPI，提供诸多API方便三方开发者在不同应用中集成ModelScope MCP广场

- ModelScope的MCP-实验场的实现改版，并通过我们的ModelScope-Agent项目完成了开源。

3. Hosted MCP连接时支持设置有效期。

4. MCP服务详情页增加交流反馈区，方便社区用户向MCP所有者提交问题与讨论。

5. AIGC专区

- 视频生成模块，添加了基于通义万相Wan2.1-14B的一系列新功能，包括图生视频，首尾帧生视频等。同时针对Wan2.1-14B模型，同时提供文生视频以及LoRA训练等全系列能力。

- AIGC推理链路中，模型下载支持异步化来加速整体推理速度，同时视频生成推理引擎端的加速优化发布。
- AIGC模型转载提示上线

6. 论文与模型/数据集等其他元素的自动双向血缘关联发布，支持社区上模型研究与学习氛围的进一步推进。同时对论文的搜索，支持了基于arxiv id的精确搜索。

7. ModelScope国际站（modelscope.ai）在移动端H5上线，国际站整体的内容以及文案持续优化中。

8. SwingDeploy链路体验改进上线。

9. 全局搜索展示优化，并覆盖MCP等更完整多数据源

10. 模型关联内容展示种类切换模式，修改为tab样式。

· 开源SDK与工具链更新

1. SWIFT 3.5.0 版本发布。

- GRPO功能完善：包括完成针对长文本训练优化，并添加ulysses序列并行的支持；对vLLM做了更完善的支持，包括对v1 engine原生的支持以及外部vLLM服务器的对接；添加liger kernel loss的支持；对于自定义采样的批量配置，提供更细化的参数配置。
- 训练功能方面：对于CPT/SFT/DPO/GRPO模式下，支持padding free的训练；对多模态模型的训练，对于不同模块的LR以及gradient checkpoint等参数，支持对立配置；CPT/SFT支持对不同channel数据集独立统计loss，以及use_logits_to_keep等参数；对于Qwen2.5-VL/Omni模型支持输入图像目录进行训练。
- Megatron-SWFIT: 支持通过max-epochs自动控制训练轮数并添加了megatron参数的直接透传。
- 新模型支持：添加对DeepSeek-R1-0528，Qwen3-embedding，Qwen-Long，MiMo-VL，MiniCPM4等模型的支持。

2. EvalScope更新到0.16.1。