作者:InternLM、Qwen 等 LLM每日一览热门论文版,顶会投稿选题不迷惘。快来看看由「机智流」和「ModelScope」社区推荐的今日热门论文吧!


Feature-Level Insights into Artificial Text Detection with Sparse Autoencoders

论文链接:
https://modelscope.cn/papers/123418  

简要介绍:
由Skolkovo科技学院等机构提出的这项研究,聚焦于人工智能文本检测(ATD)的可解释性提升。利用Sparse Autoencoders(SAE)从Gemma-2-2b模型中提取特征,该工作揭示了现代大语言模型(LLM)与人类文本的差异,尤其是在信息密集领域,展现了独特的写作风格,为ATD提供了新的见解和方法。

核心图片:


SEAP: Training-free Sparse Expert Activation Pruning Unlock the Brainpower of Large Language Models

论文链接:
https://modelscope.cn/papers/125314  

简要介绍:
中国人民大学等团队提出了SEAP,一种无需训练的剪枝方法,通过选择性地保留与任务相关的参数,降低大语言模型推理成本。实验表明,SEAP在50%剪枝率下超越WandA和FLAP超20%,展现了高效性和可扩展性,为优化大规模LLM开辟了新路径。

核心图片:


MM-Eureka: Exploring Visual Aha Moment with Rule-based Large-scale Reinforcement Learning

论文链接:
https://modelscope.cn/papers/125149  

简要介绍:
上海AI实验室等机构推出了MM-Eureka,将基于规则的大规模强化学习(RL)扩展到多模态推理。该模型在多模态数学任务中展现了视觉“顿悟时刻”,数据效率远超传统方法,且开源了完整pipeline,推动了多模态推理研究。

核心图片:


Taking Notes Brings Focus? Towards Multi-Turn Multimodal Dialogue Learning

论文链接:
https://modelscope.cn/papers/125186  

简要介绍:
北京大学等团队提出了MMDiag数据集和DiagNote模型,旨在提升多模态大语言模型(MLLM)在多轮对话中的推理能力。受人类视觉处理启发,DiagNote通过“深思”和“注视”模块协同工作,显著提升了多模态信息整合能力。

核心图片:


Automated Movie Generation via Multi-Agent CoT Planning

论文链接:
https://modelscope.cn/papers/124513  

简要介绍:
新加坡国立大学Show Lab提出了MovieAgent,通过多智能体Chain of Thought(CoT)规划实现自动化电影生成。给定剧本和角色库,该框架能生成连贯的多场景长视频,显著减少人工干预,开创了电影生成新范式。

核心图片:


FedRand: Enhancing Privacy in Federated Learning with Randomized LoRA Subparameter Updates

论文链接:
https://modelscope.cn/papers/124596  

简要介绍:
由韩国研究团队开发的FedRand,通过随机选择LoRA子参数更新,增强了联邦学习(FL)的隐私保护。仅将非私有参数上传至服务器,该方法有效抵御成员推理攻击,同时保持高准确率。


EasyControl: Adding Efficient and Flexible Control for Diffusion Transformer

论文链接:
https://modelscope.cn/papers/124672  

简要介绍:
Tiamat AI等团队提出了EasyControl,为Diffusion Transformer(DiT)引入高效灵活的控制框架。通过轻量级LoRA模块和因果注意力机制,该方法提升了图像生成的效率和多样性,适用于多种应用场景。

核心图片:


FEA-Bench: A Benchmark for Evaluating Repository-Level Code Generation for Feature Implementation

论文链接:
https://modelscope.cn/papers/125249  

简要介绍:
微软亚洲研究院和北京大学合作推出了FEA-Bench,首个评估LLM在代码库级别增量开发能力的基准。基于83个GitHub仓库的PR数据,该基准揭示了LLM在特征实现任务中的挑战,推动了自动化软件工程研究。

核心图片:


AlphaDrive: Unleashing the Power of VLMs in Autonomous Driving via Reinforcement Learning and Reasoning

论文链接:
https://modelscope.cn/papers/124998  

简要介绍:
华中科技大学等团队提出了AlphaDrive,将强化学习(RL)和推理能力融入视觉-语言模型(VLM),优化自动驾驶规划。引入GRPO奖励和两阶段训练策略,该方法显著提升了规划性能和安全性。

核心图片:


SurveyForge: On the Outline Heuristics, Memory-Driven Generation, and Multi-dimensional Evaluation for Automated Survey Writing

论文链接:
https://modelscope.cn/papers/123886  

简要介绍:
上海AI实验室等机构推出了SurveyForge,通过启发式大纲生成和记忆驱动的内容优化,自动化生成高质量综述论文。搭配SurveyBench基准,该框架在结构和引用质量上超越了AutoSurvey等现有工作。

核心图片:


今热门论文推荐就到这里结束啦,这些论文展现了AI在文本检测、隐私保护、自动驾驶等领域的最新突破,每一项都值得深入探索。喜欢这期内容?别忘了点赞、分享和关注我们,明天见!🌟

-- 完 --

欢迎在「机智流」公众号后台回复「cc」,加入机智流大模型交流群,与我们一起探索 AI 与人类潜能的未来,一起共赴 AI 浪潮!

Logo

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!

更多推荐