02_Augmenting Sequential Recommendation with Balanced Relevance and Diversity

Posted Mar 2, 2025 Updated Aug 28, 2025

By hhhi21g

7 min read

来源： AAAI‘25 https://doi.org/10.48550/arXiv.2412.08300

代码：https://github.com/KingGugu/BASRec.

增强数据的相关性和多样性之间的不平衡仍需要解决；
直接合并两个增强序列将会破坏原始序列模式，并且不相关或重复的项将会被保存；
现有的方法缺少对跨序列偏好模式和语义信息的注重；
lack consideration for the cross-sequence preference patterns and semantic information.

提出BASRec, Balanced data Augmentation plugin for Sequential Recommendation

user sets: 𝒰

item sets: 𝒱

Each user u∈𝒰 is associated with a sequence of interacted items in chronological(按时间前后顺序排列的) order s_u = [v₁,…,v_j,…v_{|s_u|}]

给出交互物体序列|s_u|, 任务是正确的预测: 用户u在时间步长为|s_u|+1时最可能交互的物体v^*

在输入空间中实现线性插值来构建虚拟训练数据

It implements linear interpolation in the input space to construct virtual training data.

给出两个输入样本x_i，x_j，以及标签y_i，y_j，混合过程如下：

λ ∼ Beta(α, α)为beta分布中的混合参数

beta分布：

其取值范围为(0,1)，所以它经常用于表示概率或系数的权重，比如在Mixup里决定两个样本的混合比例。

在Mixup数据增强中：

下面两个增强模块是独立的增强路径，即通过单序列增强生成的序列表示不会被fed into跨序列增强中。

Look-up操作：给定原始的用户交互序列 s_u=[v₁,v₂,…,v_|su|], 通过Look-up操作从物体嵌入矩阵中获取该序列对应的物品嵌入表示: Eu=[m_v1,m_v2,…,m_v|su|]；

省略对短序列的填充和对长序列的截断；

(1) M-Reorder:

不像传统操作那样使用一个固定不变的rate, 这里rate从均匀分布(Uniform distribution)中选取:

rate ~ Uniform(a,b)。a,b为超参数，且0<a<b<1

随机打乱子序列：
[v_i , … , v_i+c-1]打乱为[v_i^’ , … v_i+c-1^’] ，再与子序列外的项拼接得到：
s_u^’ = Record(s_u) = [v₁ , v₂ , … v_i^’ , … v_i+c-1^’ … ,v_n]
混合序列：

E_u^In is augment representation used for model training.

(2) M-Substitute

随机选取c = rate · |s_u| different indices {idx₁, idx₂, ….. ,idx_c}, rate选取方式同M-Recorder；
再进行M-Recorder中的混合序列操作，得到E_u^In。

(3) 自适应损失加权(Adaptive Loss Weighting)

这个过程能够指导模型辨别原始表示中被注入了多少新的表示，提高模型的鲁棒性。

跨序列增强通过混合不同的序列输出，以发现不同用户之间的偏好知识。

将序列表示E_u和E_u^In输入到编码器，获得序列的输出表示H_u和H_u^In;
推荐系统中，用户表示通常是隐式的，因此H_u和H_u^In也可以看作用户表示；
这里想要应用不同的权重给H_u里的每一个参数，但是，这种混合策略会造成显著的计算开销；
因此提出一种分解这个过程的方式，分解为：Item-wise mixup和Feature-wise mixup

具体实现：

给出一组序列{s_u}_u=1^B,能够获得相应的表示{H_u}_u=1^B ∈ R^{B * N * D}, (B: 批量大小；N：最大序列长度；D：嵌入维度)

从批处理的视角洗牌H_u: {H’_u}_u=1^B = Shuffle{H_u}_u=1^B

For Item-wise Nonlinear Mixup:
从Beta(α, α)中抽取一个混合的权重矩阵 Λ_I∈R^B*N ，混合操作如下（Hadamard product)：
For Feature-wise Nonlinear Mixup:
从Beta(α, α)中抽取一个混合的权重矩阵 Λ_F∈R^B*N,作相似操作：