登录社区云,与社区用户共同成长
邀请您加入社区
Nanonets团队开源了 Nanonets-OCR-s,该模型基于Qwen2.5-VL-3B微调,9G显存就能跑。
2025 魔搭开发者大会,来了! 6月30日,北京海淀 · 香格里拉饭店 AI领域重量级嘉宾前瞻演讲 200+国内外顶级学者与模型研发团队思想交锋 聚焦最前沿模型、最新最热工具链 Agent与MCP生态发展、科研智能 即刻起,免费报名 (席位有限,先到先得) 详情请见 点击链接链接,直达报名 https://hd.aliyun.com/form/6263?hid=35462&c
01.前言 MiniMax最新发布了全球首个开源大规模混合架构的推理模型——MiniMax-M1! M1在面向生产力的复杂工作场景,包括软件工程、长上下文与工具使用上表现优异,超过国内的闭源模型,接近海外的最领先模型,同时又有业内最高的性价比。 M1支持目前业内最高的100万上下文的输入,与Gemini 2.5 Pro 一致,以及业内最长的8万Token的推理输出,长于Gemini 2.5的 6
从2022年11月的青涩发布,魔搭现今已进入第三个年头,成为中国最大最活跃的开源模型社区,与超过1600万的开发者同行。
魔搭ModelScope本期社区进展: 1173个模型:Magistral-Small-2506、dots.llm1、MonkeyOCR等; 143个数据集:saisdata、OpenThoughts3-1.2M、MMVU等; 76个创新应用:BMMR-Leaderboard-detailed、RedNoob、openaudio-s1-mini等; 10 篇内容: 告别‘人海战术’!
在知识爆炸、信息过载的时代,如何洞悉 AI 领域前沿趋势?OpenMMLab 联合 Hugging Face、ModelScope、知乎及机智流等重磅推出 AI Insight Talk
01.前言 生成式模型在文本生成图片等领域的快速发展,为社区带来了日新月异的诸多文生图模型。如何对这些多样化的模型进行模型效果上的客观评估,已经成为技术选型与优化的关键。传统的模型评测方法高度依赖人工标注与主观判断,往往需投入大量人力进行样本筛选、质量评分及结果分析,不仅周期长、成本高,还可能因评审者主观偏好导致结果偏差,这在图片生成领域尤为突出。例如,在文本-图像对齐度评测中,人工评分过程会涉及
01.摘要 近年来,人工智能快速发展,大语言模型(LLM)在数学、代码等领域展现出强大的推理和生成能力,正在被广泛应用于各种场景。为了更准确评估LLM 的推理能力,之前有研究者们陆续构建了多个标准化数据集,以数学领域为例,如GSM8K、MATH、UGMathBench 等,用于衡量模型解决数学问题的准确性。 然而,与数学相比,物理推理任务更具挑战性:不仅依赖数学推导能力,更需掌握物理法则、理解物理
尽管最新的基于大规模预训练视觉语言模型(VLMs)的研究在少样本异常识别领域取得了一些进展,但这些方法通常依赖于少量正常样本与查询样本的直接特征匹配。
如何开发自己的一个MCP server