ModelScope魔搭25年6月发布月报
从2022年11月的青涩发布,魔搭现今已进入第三个年头,成为中国最大最活跃的开源模型社区,与超过1600万的开发者同行。
叮叮叮!从2022年11月的青涩发布,魔搭现今已进入第三个年头,成为中国最大最活跃的开源模型社区,与超过1600万的开发者同行。上个月我们在杭州举办了“搭友来碰头”的核心开发者共创会,本月底,我们将在北京·海淀香格里拉饭店举办首届魔搭开发者大会(ModelScope DevCon 2025),诚邀广大开发者与我们在6月30号欢聚北京,共建开源技术生态!
过去一个月,社区依然保持活跃发展态势。我们迎来了DeepSeek-R1的一个“小更新”,Qwen也补齐了开源序列中的Embedding和Rerank模型。小米 MiMo 开源系列新增了 MiMo-VL 模型。而来自字节 Seed 系列的开源项目迎来一波发布浪潮,包括Seed-Coder,SeedVR以及在多模态模型结构方面进一步创新探索的 BAGEL 模型。来自面壁的MiniCPM小钢炮更新到了4.0版本,进一步探索端侧智能的极限。mistralAI,小红书hilabs,腾讯混元,通义万相……无论是业界熟悉的团队,还是新晋AI研究力量,都在过去一个月中活跃于社区,并贡献了多个最新开源模型。
在平台建设方面,ModelScope 站点已完成对各主要板块的页面样式、排版及字体的整体重构升级,同时优化了开发者暗黑模式的展示效果,旨在为 AI 开发者提供更符合使用习惯的浏览体验。MCP广场提供了开发者自主贡献MCP Server的链路,以更开放的姿势,拥抱开源模型与MCP的联合生态。同时,MCP 广场的 OpenAPI 接口文档已正式发布,便于更多工具和生态体系实现灵活集成。ModelScope 的 MCP 实验场功能已通过 ModelScope-Agent 项目实现开源。围绕以 MCP 为代表的工具生态需求,ModelScope-Agent 目前也正经历全面重构与功能升级。在平台多元素间的血缘关联方面,我们优化了论文板块与模型等元素的自动关联机制,让广大学术范的开发者,可以在平台上直接完成从模型到模型技术报告/论文的全闭环✌️。在AIGC专区,过去一个月我们进一步完善了视频生成能力的支持体系,在扩展模型规格的同时,新增了图生视频、首尾帧生视频等功能,为社区开源模型的标杆视频生成能力,实现了服务化和外化,期望开发者能够通过这些模型服务能力,更快的上手体验模型能力。
· 站点更新
1. 站点主要板块排版/字体等更新重构,希望在为广大开发者保障页面信息密度的同时,确保视觉浏览上的舒适度
2. MCP开放生态建设
-
- 开放MCP server的开发者自主贡献链路,更积极的拥抱MCP与开源模型的联合生态。
- 上线 ModelScope MCP OpenAPI,提供诸多API方便三方开发者在不同应用中集成ModelScope MCP广场
-
- ModelScope的MCP-实验场的实现改版,并通过我们的ModelScope-Agent项目完成了开源。
3. Hosted MCP连接时支持设置有效期。
4. MCP服务详情页增加交流反馈区,方便社区用户向MCP所有者提交问题与讨论。
5. AIGC专区
-
- 视频生成模块,添加了基于通义万相Wan2.1-14B的一系列新功能,包括图生视频,首尾帧生视频等。同时针对Wan2.1-14B模型,同时提供文生视频以及LoRA训练等全系列能力。
-
- AIGC推理链路中,模型下载支持异步化来加速整体推理速度,同时视频生成推理引擎端的加速优化发布。
- AIGC模型转载提示上线
6. 论文与模型/数据集等其他元素的自动双向血缘关联发布,支持社区上模型研究与学习氛围的进一步推进。同时对论文的搜索,支持了基于arxiv id的精确搜索。
![]() |
![]() |
![]()
|
|
![]() |
7. ModelScope国际站(modelscope.ai)在移动端H5上线,国际站整体的内容以及文案持续优化中。
8. SwingDeploy链路体验改进上线。
9. 全局搜索展示优化,并覆盖MCP等更完整多数据源
10. 模型关联内容展示种类切换模式,修改为tab样式。
· 开源SDK与工具链更新
1. SWIFT 3.5.0 版本发布。
-
- GRPO功能完善:包括完成针对长文本训练优化,并添加ulysses序列并行的支持;对vLLM做了更完善的支持,包括对v1 engine原生的支持以及外部vLLM服务器的对接;添加liger kernel loss的支持;对于自定义采样的批量配置,提供更细化的参数配置。
- 训练功能方面:对于CPT/SFT/DPO/GRPO模式下,支持padding free的训练;对多模态模型的训练,对于不同模块的LR以及gradient checkpoint等参数,支持对立配置;CPT/SFT支持对不同channel数据集独立统计loss,以及use_logits_to_keep等参数;对于Qwen2.5-VL/Omni模型支持输入图像目录进行训练。
- Megatron-SWFIT: 支持通过max-epochs自动控制训练轮数并添加了megatron参数的直接透传。
- 新模型支持:添加对DeepSeek-R1-0528,Qwen3-embedding,Qwen-Long,MiMo-VL,MiniCPM4等模型的支持。
2. EvalScope更新到0.16.1。
-
- 支持Needle-in-a-Haystack测试, DocMath和FRAMES长文档评测,以及配置测试数据集百分比等功能。
- 支持Needle-in-a-Haystack测试, DocMath和FRAMES长文档评测,以及配置测试数据集百分比等功能。
-
- 支持模型服务性能压测支持设置多种并发,并输出格式化性能压测报告:
-
- 支持ToolBench-Static数据集评测模型的工具调用能力,DROP和Winogrande评测模型的推理能力。支持use_cache重用评测结果
3. 主库1.27版本发布。新版添加了scan-cache功能,方便对本地下载cache文件的梳理。支持模型无需提前单独创建,通过命令行直接上传(默认直接创建)。ModelScope 命令行运行环境添加ASCII logo 😆。放松单repo支持文件数到5w。
4. modelscope-agent: 完成了对于MCP工具生态的支持,并作为MCP广场实验场的实现底座。更多针对负责Agent场景的全面重构和功能升级进行中。
5. DiffSynth:推理 pipeline 和训练框架重构中,Wan/VACE/Fun1.1等模型同步进行中。Nexus-Gen模型更新版本,大幅提升图像生成的文本提示鲁棒性。
魔搭开发者大会 | 邀请函
首届魔搭开发者大会 预热提前报名通道开启 🎉🎉🎉
200余位顶级学者专家,数万名AI开发者们齐聚
✨早鸟票已开启,就等你来!点击阅读原文,即可报名~
更多推荐
所有评论(0)