news 2026/4/21 5:28:17

每日一篇:AgentDR

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
每日一篇:AgentDR

AgentDR: Dynamic Recommendation with Implicit Item-Item Relations via LLM-based Agents

这篇文章主要分为两步:
step1:用大模型整合不同传统推荐模型的输出
step2:用大模型判断用户的兴趣偏好(购买同质or互补商品or无偏好),来对step1的结果进行重排

step1:个性化整合多推荐模型输出

动机

认为不同结构的推荐模型,可能对不同用户的表现是不同的。文中举了一个例子:一个用户在读《哈利波特》的过程中,序列推荐可能表现会更好,但当他读完这一系列之后,可能通过协同过滤找到相似用户,可以更好地反应他的兴趣。

做法

对每个用户维护一个memory数组,用于存储不同结构的推荐模型对该用户的适配度。
memory的更新方式为:

通过大模型判断各个传统推荐模型的预估结果与真实结果哪个更适合。根据大模型的评分,对memory进行增量更新。
基于这个memory,可以对所有推荐模型的输出进行聚合(这一步可以看成分权重投票),得到聚合后的输出结构。
step2:基于用户偏好重排序
动机
期望通过大模型判别用户目前的兴趣偏好:更偏好替代品、补充品 或者无特殊偏好。
做法
对每个用户维护一个memory2数组,用于存储不同用户当前的偏好评分。
memory2更新方式:

截取掉最近k次作为label。通过大模型生成出最近c次交互商品的 替代品、补充品。再用大模型判断真实的label与这些 替代品、补充品的相关性,从而反应出该用户的当前偏好(倾向替代品、倾向补充品)。对于无偏好的概率,文章通过完整的交互序列直接生成。

随后通过生成的替代品、补充品,去对Step1的预估结果进行重排序。

而“无偏好”重排结果,则通过提供用户信息进行。

最终将(替代品、补充品、无偏号)重排结果进行混合后,给出最终排序结果。
实验消融

思考
本篇文章主要依靠agent去自动寻找适合该用户的推荐模型、并自动分析用户兴趣偏好(相似or补充or无偏好)。
前者像ensemble,特点是引入了文本模态。不知道如果直接用模型学习ensemble权重效果怎么样。
后者同样主要依靠文本模态来进行分析,如果能将多模态信息引入传统推荐模型,后者的作用应该不会这么大。
总结:感觉主要收益来源于多模态信息的补充和利用。但是整体流程比较傻瓜式,没有什么参数可以调整,比较好打通。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/21 5:25:42

04-12-02 技术小组长 - 学习笔记

04-12-02 技术小组长 - 学习笔记 章节信息 核心主题: Tech Lead 的角色定位、工作内容、项目管理方法、技术路线与管理路线的选择 学习目标: 理解 Tech Lead 的职责边界、掌握技术项目管理方法、明确职业发展方向 关键要点: Tech Lead 是半管理半技术的角色、项目管理的核心是沟…

作者头像 李华
网站建设 2026/4/21 5:22:25

Qwen-Image-2512+Pixel Art LoRA部署案例:高校数字媒体课程实验平台搭建

Qwen-Image-2512Pixel Art LoRA部署案例:高校数字媒体课程实验平台搭建 1. 项目背景与价值 在高校数字媒体艺术专业的教学实践中,像素艺术创作一直是重要的基础课程内容。传统教学方式面临两个主要挑战: 学生需要花费大量时间掌握专业绘图…

作者头像 李华
网站建设 2026/4/21 5:21:25

Kimi-VL-A3B-ThinkingGPU算力优化:vLLM动态批处理使A10吞吐提升210%

Kimi-VL-A3B-Thinking GPU算力优化:vLLM动态批处理使A10吞吐提升210% 1. 模型概述 Kimi-VL-A3B-Thinking是一款高效的开源混合专家(MoE)视觉语言模型,在多模态推理领域展现出卓越性能。这个模型仅激活语言解码器中的2.8B参数&am…

作者头像 李华
网站建设 2026/4/21 5:18:14

CSS如何高效命名样式类_掌握BEM规范提升语义化程度

直接用 btn-red 等视觉化命名会导致样式与外观强耦合,修改设计需改类名并牵连 HTML;多人协作时语义模糊,易误用、难维护。应以角色(如 btn-primary)而非外观命名,禁用纯状态词和单单词类名。为什么直接用 b…

作者头像 李华
网站建设 2026/4/21 5:10:16

记录一次长时间未提交事务造成的慢SQL

目录 问题描述 问题分析 1、了解前后信息 2、分析执行计划 3、分析生产环境系统负载 4、分析数据库性能 5、初步锁定根因为长时间未提交事务导致 6、最终根因定位 7、原理分析 问题描述: 开发反馈执行某条select语句的时候,生产环境和测试环境耗时相差非…

作者头像 李华