
今日热门论文推荐:MM-Eureka、FedRand、EasyControl、FEA-Bench
由Skolkovo科技学院等机构提出的这项研究,聚焦于人工智能文本检测(ATD)的可解释性提升。利用Sparse Autoencoders(SAE)从Gemma-2-2b模型中提取特征,该工作揭示了现
作者:InternLM、Qwen 等 LLM每日一览热门论文版,顶会投稿选题不迷惘。快来看看由「机智流」和「ModelScope」社区推荐的今日热门论文吧!
Feature-Level Insights into Artificial Text Detection with Sparse Autoencoders
论文链接:
https://modelscope.cn/papers/123418
简要介绍:
由Skolkovo科技学院等机构提出的这项研究,聚焦于人工智能文本检测(ATD)的可解释性提升。利用Sparse Autoencoders(SAE)从Gemma-2-2b模型中提取特征,该工作揭示了现代大语言模型(LLM)与人类文本的差异,尤其是在信息密集领域,展现了独特的写作风格,为ATD提供了新的见解和方法。
核心图片:
SEAP: Training-free Sparse Expert Activation Pruning Unlock the Brainpower of Large Language Models
论文链接:
https://modelscope.cn/papers/125314
简要介绍:
中国人民大学等团队提出了SEAP,一种无需训练的剪枝方法,通过选择性地保留与任务相关的参数,降低大语言模型推理成本。实验表明,SEAP在50%剪枝率下超越WandA和FLAP超20%,展现了高效性和可扩展性,为优化大规模LLM开辟了新路径。
核心图片:
MM-Eureka: Exploring Visual Aha Moment with Rule-based Large-scale Reinforcement Learning
论文链接:
https://modelscope.cn/papers/125149
简要介绍:
上海AI实验室等机构推出了MM-Eureka,将基于规则的大规模强化学习(RL)扩展到多模态推理。该模型在多模态数学任务中展现了视觉“顿悟时刻”,数据效率远超传统方法,且开源了完整pipeline,推动了多模态推理研究。
核心图片:
Taking Notes Brings Focus? Towards Multi-Turn Multimodal Dialogue Learning
论文链接:
https://modelscope.cn/papers/125186
简要介绍:
北京大学等团队提出了MMDiag数据集和DiagNote模型,旨在提升多模态大语言模型(MLLM)在多轮对话中的推理能力。受人类视觉处理启发,DiagNote通过“深思”和“注视”模块协同工作,显著提升了多模态信息整合能力。
核心图片:
Automated Movie Generation via Multi-Agent CoT Planning
论文链接:
https://modelscope.cn/papers/124513
简要介绍:
新加坡国立大学Show Lab提出了MovieAgent,通过多智能体Chain of Thought(CoT)规划实现自动化电影生成。给定剧本和角色库,该框架能生成连贯的多场景长视频,显著减少人工干预,开创了电影生成新范式。
核心图片:
FedRand: Enhancing Privacy in Federated Learning with Randomized LoRA Subparameter Updates
论文链接:
https://modelscope.cn/papers/124596
简要介绍:
由韩国研究团队开发的FedRand,通过随机选择LoRA子参数更新,增强了联邦学习(FL)的隐私保护。仅将非私有参数上传至服务器,该方法有效抵御成员推理攻击,同时保持高准确率。
EasyControl: Adding Efficient and Flexible Control for Diffusion Transformer
论文链接:
https://modelscope.cn/papers/124672
简要介绍:
Tiamat AI等团队提出了EasyControl,为Diffusion Transformer(DiT)引入高效灵活的控制框架。通过轻量级LoRA模块和因果注意力机制,该方法提升了图像生成的效率和多样性,适用于多种应用场景。
核心图片:
FEA-Bench: A Benchmark for Evaluating Repository-Level Code Generation for Feature Implementation
论文链接:
https://modelscope.cn/papers/125249
简要介绍:
微软亚洲研究院和北京大学合作推出了FEA-Bench,首个评估LLM在代码库级别增量开发能力的基准。基于83个GitHub仓库的PR数据,该基准揭示了LLM在特征实现任务中的挑战,推动了自动化软件工程研究。
核心图片:
AlphaDrive: Unleashing the Power of VLMs in Autonomous Driving via Reinforcement Learning and Reasoning
论文链接:
https://modelscope.cn/papers/124998
简要介绍:
华中科技大学等团队提出了AlphaDrive,将强化学习(RL)和推理能力融入视觉-语言模型(VLM),优化自动驾驶规划。引入GRPO奖励和两阶段训练策略,该方法显著提升了规划性能和安全性。
核心图片:
SurveyForge: On the Outline Heuristics, Memory-Driven Generation, and Multi-dimensional Evaluation for Automated Survey Writing
论文链接:
https://modelscope.cn/papers/123886
简要介绍:
上海AI实验室等机构推出了SurveyForge,通过启发式大纲生成和记忆驱动的内容优化,自动化生成高质量综述论文。搭配SurveyBench基准,该框架在结构和引用质量上超越了AutoSurvey等现有工作。
核心图片:
今热门论文推荐就到这里结束啦,这些论文展现了AI在文本检测、隐私保护、自动驾驶等领域的最新突破,每一项都值得深入探索。喜欢这期内容?别忘了点赞、分享和关注我们,明天见!🌟
-- 完 --
欢迎在「机智流」公众号后台回复「cc」,加入机智流大模型交流群,与我们一起探索 AI 与人类潜能的未来,一起共赴 AI 浪潮!
更多推荐
所有评论(0)