📄 Deep Tech

ArXiv 最新

Modeling/ˈmɑdəlɪŋ/ LLM Agent Reviewer/rivˈjuər/ Dynamics/daɪˈnæmɪks/ in Elo-Ranked/eloranked*/ Review System

Hsiang-Wei Huang, Junbin Lu, Kuang-Ming Chen 2026-01-13 cs.CL | cs.AI

In this work, we explore the Large Language Model (LLM) agent reviewer dynamics in an Elo-ranked review system using real-world conference paper submissions. Multiple LLM agent reviewers with different personas are engage in multi round review interactions moderated by an Area Chair. We compare a ba...

查看中文翻译

在这项工作中,我们使用真实世界的会议论文提交来探索 Elo 排名评审系统中的大型语言模型 (LLM) 代理审稿人动态。具有不同角色的多名法学硕士代理评审员参与由区域主席主持的多轮评审互动。我们将基线设置与包含 Elo 评级和审稿人记忆的条件进行比较。我们的模拟结果展示了一些有趣的发现,包括合并 Elo 如何提高区域主席决策的准确性,以及审稿人的自适应审稿策略,该策略利用我们的 Elo 系统而不提高审稿工作量。我们的代码可在 https://github.com/hsiangwei0903/EloReview 获取。

阅读原文 →

Motion Attribution/ˌætrɪˈbjuʃən/ for Video Generation/ˌʤɛnərˈeɪʃən/

Xindi Wu, Despoina Paschalidou, Jun Gao 2026-01-13 cs.CV | cs.AI

Despite the rapid progress of video generation models, the role of data in influencing motion is poorly understood. We present Motive (MOTIon attribution for Video gEneration), a motion-centric, gradient-based data attribution framework that scales to modern, large, high-quality video datasets and m...

查看中文翻译

尽管视频生成模型取得了快速进展,但人们对数据在影响运动中的作用却知之甚少。我们提出了 Motive(视频生成的 MOTIon 归因),这是一种以运动为中心、基于梯度的数据归因框架,可扩展到现代、大型、高质量的视频数据集和模型。我们用它来研究哪些微调剪辑可以改善或降低时间动态。 Motive 通过运动加权损失掩模将时间动态与静态外观隔离,从而产生高效且可扩展的运动特定影响计算。在文本到视频模型上,Motive 可以识别强烈影响运动的剪辑,并指导数据管理,从而提高时间一致性和物理合理性。利用Motive选择的高影响力数据,我们的方法提高了VBench上的运动平滑度和动态程度,与预训练的基础模型相比,实现了74.1%的人类偏好获胜率。据我们所知,这是第一个在视频生成模型中归因于运动而不是视觉外观并使用它来管理微调数据的框架。

阅读原文 →

MemRec: Collaborative/kəˈlæbərˌeɪtɪv/ Memory-Augmented/memoryaugmented*/ Agentic Recommender/recommender*/ System

Weixin Chen, Yuhan Zhao, Jingyuan Huang 2026-01-13 cs.IR | cs.AI

The evolution of recommender systems has shifted preference storage from rating matrices and dense embeddings to semantic memory in the agentic era. Yet existing agents rely on isolated memory, overlooking crucial collaborative signals. Bridging this gap is hindered by the dual challenges of distill...

查看中文翻译

推荐系统的发展已经将偏好存储从评级矩阵和密集嵌入转变为代理时代的语义记忆。然而现有的智能体依赖于孤立的记忆,忽视了关键的协作信号。弥合这一差距受到双重挑战的阻碍:提取大量图形上下文而不用认知负荷压倒推理代理,以及有效地发展协作记忆而不产生过高的计算成本。为了解决这个问题,我们提出了 MemRec,这是一个在架构上将推理与内存管理解耦的框架,以实现高效的协作增强。 MemRec 引入了专用的、经济高效的 LM_Mem 来管理动态协作内存图,为下游 LLM_Rec 提供合成的高信号上下文。该框架通过一个实用的管道进行操作,该管道具有高效的检索和经济高效的异步图形传播,可在后台演化内存。对四个基准的大量实验表明 MemRec 实现了最先进的性能。此外,架构分析证实了其灵活性,建立了一个新的帕累托前沿,通过支持包括本地开源模型在内的多种部署来平衡推理质量、成本和隐私。代码:https://github.com/rutgerswiselab/memrec 和主页:https://memrec.weixinchen.com

阅读原文 →