
ModelScope魔搭25年3月发布月报
在这个春天里,小鲸鱼的DeepSeek-R1系列在模型社区掀起的巨大浪潮尚未平息,我们又迎来了千问的QwQ-32B正式版本,社区在Reasoning模型上的热情还在升温。除此之外,业界其他模型在过去一
本月上新
在这个春天里,小鲸鱼的DeepSeek-R1系列在模型社区掀起的巨大浪潮尚未平息,我们又迎来了千问的QwQ-32B正式版本,社区在Reasoning模型上的热情还在升温。除此之外,业界其他模型在过去一个月里持续的、高强度的开源开放,为广大开发者带来一波波新的惊喜。但过去的一个月也不是专属于大语言模型的。我们携手各个模型团队,迎来了Wan2.1,StepFun,Hunyuan等系列中的新模型发布,为视频生成领域,注入了新鲜的活力。
为了更好的服务广大的社区开发者,我们对ModelScope的模型存储和下载等服务做了整体优化,来更支撑广大开发者的热情,以及因此剧增的社区下载流量。同时ModelScope的开源工具链生态,也针对Reasoning模型所需的训练微调,评估,推理等全链路需求提供支持,并对Wan 2.1等视频生成模型的推理和训练,进行了全方位的优化。我们希望这些开源工具链,能支持广大开发者更方便地把模型真正用起来。我们的AIGC专区,也在用户体验升级持续快速迭代的同时,第一时间就引入了基于Wan2.1 视频模型提供的视频生成、训练定制等能力,满足广大开发者对于高质量内容创作和技术探索的需求,欢迎大家到AIGC专区体验。ModelScope的Paper板块,则引入了AI解读论文的能力,方便大家探索模型背后的技术细节。
在刚结束不久的GDC(全球开发者大会)上,我们和众多的开发者做了线下面基,感谢大家对社区一直以来的支持!这是一个模型发展真正日新月异的时代,ModelScope团队非常有幸和大家一起见证社区模型技术一日千里的发展,我们也持续致力于平台服务的完善,以及我们的开源生态的打造。今天准时带来三月份ModelScope社区Release Notes,请大家查收。也欢迎广大开发者通过各种渠道,为大家共同的社区的建设与发展,提供反馈与建议。
· 站点更新
1. 模型下载速度优化:为了在社区巨大的流量下,依旧能持续为广大开发者提供稳定高速的模型下载,我们对后端模型服务和存储做了整体的优化和升级,当前已全面上线。更多的优化还在路上~~
2. 论文板块升级:让模型和背后的技术解读更近一点!ModelScope的Paper板块新增了“AI读论文”能力,帮助大家在我们的ModelScope社区上,不仅能迅速找到模型相关的研究与论文,而且能更方便的通过论文对模型和相关技术的细节,进行深入的理解。
3. AIGC专区
-
首页内容瀑布流改版:专区的首页整体内容布局,切换为更直观的瀑布流设计,使浏览更加便捷和高效。
-
支持视频生成&训练功能:基于Wan2.1视频模型,推出视频生成与训练能力,并支持用户在社区内分享自己生成的创意视频作品。
添加图片注释,不超过 140 字(可选)
-
关联模型可视化:在作品详情页中增加了关联模型的可视化展示,方便直接查看作品背后的模型信息,便于理解和评估。
-
作品区排序筛选:支持根据最新或热度对作品反馈进行排序筛选,帮助大家更快找到想要的灵感和创意。
4. 合集广场等页面的加载速度进行了整体的优化,同时对模型等元素页面关联合集的逻辑进行修订,确保高质量的合集能优先展示给开发者。
5. 模型系谱血缘优化上线,保证更准确的显示,包括AIGC专区的模型。
添加图片注释,不超过 140 字(可选)
6. 模型介绍页面的代码准确性提升:对于ModelScope上的模型,依托transformers/diffusers/peft等库的接入的代码,对模型卡片上的代码自动转写逻辑进行了完善。整体范例代码的可用性有了较好的提升。
7. 创空间Gradio完成5.20.1新版本支持并上线。
添加图片注释,不超过 140 字(可选)
8. Langflow 创空间迭代:在魔搭Langflow创空间使用模板快速创建工作流时,对模板工作流中的模型节点默认设置为 ModelScope 节点,方便社区用户快捷使用魔搭推理API-Inference构建工作流应用;同时支持了一键发布工作流为独立的Playground创空间,方便应用更好地被分享、体验。
添加图片注释,不超过 140 字(可选)
· 开源SDK与工具链更新
1. 模型的命令行下载提供了单独的token入口,支持一条命令完成需要鉴权的模型下载。原生的pipeline提供了对于LLM更完善的支持。对于即将发布的ModelScope国际站上资源的下载,提供了更好的支持。
2.SWIFT 3.2版本发布:针对Reasoning模型训练的需求,提供了一系列围绕GRPO训练的支持。包括LLM和多模态模型的GRPO在单节点和多节点上的训练,模型权重的分批加载,ORM支持,以及GRPO训练过程中需要的灵活多样的推理配置。添加了embedding模型的训练支持,并完善了sampler的能力。在infer方面,对于接入的多种引擎提供了更完善的功能对接。
3.EvalScope更新到0.13,支持了对于Reasoning模型思考效率的评估,并针对推理模型特点,支持对模型输出进行后处理后的评测,以及对reasoning_content字段的特殊处理等等。引入LLM-as-a-Judge的评测方式,支持大模型打分评估。添加AIME25, MuSR, ProcessBench, SuperGPQA, SimpleQA, Chinese SimpleQA, LiveCodeBench等一系列新的benchmark。
4.DiffSynth在第一时间全面支持了Wan2.1系列模型的显存优化、FP8 量化、多种训练方式等能力,并提供了对多种attention机制的支持。发布后DiffSynth-Studio项目再次上榜GitHub Trending #2,感谢广大开发者的支持。
更多推荐
所有评论(0)