登录社区云,与社区用户共同成长
邀请您加入社区
魔搭ModelScope本期社区进展: 1173个模型:Magistral-Small-2506、dots.llm1、MonkeyOCR等; 143个数据集:saisdata、OpenThoughts3-1.2M、MMVU等; 76个创新应用:BMMR-Leaderboard-detailed、RedNoob、openaudio-s1-mini等; 10 篇内容: 告别‘人海战术’!
在知识爆炸、信息过载的时代,如何洞悉 AI 领域前沿趋势?OpenMMLab 联合 Hugging Face、ModelScope、知乎及机智流等重磅推出 AI Insight Talk
01.前言 生成式模型在文本生成图片等领域的快速发展,为社区带来了日新月异的诸多文生图模型。如何对这些多样化的模型进行模型效果上的客观评估,已经成为技术选型与优化的关键。传统的模型评测方法高度依赖人工标注与主观判断,往往需投入大量人力进行样本筛选、质量评分及结果分析,不仅周期长、成本高,还可能因评审者主观偏好导致结果偏差,这在图片生成领域尤为突出。例如,在文本-图像对齐度评测中,人工评分过程会涉及
01.摘要 近年来,人工智能快速发展,大语言模型(LLM)在数学、代码等领域展现出强大的推理和生成能力,正在被广泛应用于各种场景。为了更准确评估LLM 的推理能力,之前有研究者们陆续构建了多个标准化数据集,以数学领域为例,如GSM8K、MATH、UGMathBench 等,用于衡量模型解决数学问题的准确性。 然而,与数学相比,物理推理任务更具挑战性:不仅依赖数学推导能力,更需掌握物理法则、理解物理
尽管最新的基于大规模预训练视觉语言模型(VLMs)的研究在少样本异常识别领域取得了一些进展,但这些方法通常依赖于少量正常样本与查询样本的直接特征匹配。
如何开发自己的一个MCP server
“一丹一世界”三等奖 |咖菲猫咪_商业海报案例分享
近日,小红书开源了首个大模型dots.llm1。
近日,趣丸千音(All Voice Lab)MCP正式首发上线魔搭社区。用户只需简单文本输入,即可调用视频翻译、TTS语音合成、智能变声、人声分离、多语种配音、语音转文本、字幕擦除等多项能力。
想一年不如实实在在干两天 | 52小时创业森林开启报名