12_DIFF:Dual Side-Information Filtering and Fusion for Sequential Recommendation

Posted Sep 22, 2025 Updated Oct 5, 2025

By hhhi21g

6 min read

来源：SIGIR‘25 https://arxiv.org/abs/2505.13974

代码：https://github.com/HyeYoung1218/DIFF

Side-information Integrated Sequential Recommendation(SISR): 对于稀疏交互和冷启动序列是有效的，其分为三类：

但存在下面的问题：

Dual Side-Information Filtering and Fusion model (DIFF)

Frequency-based Noise Filtering: 使用离散傅里叶变换将序列转为频域信号，对于每个序列应用属性级别的过滤；
Dual Multi-sequence Fusion:
- ID-centric Fusion (intermediate): 捕捉属性内的相关性；
- Attribute-enriched Fusion (early): 捕捉不同属性间的相关性。

item集合：I = {i₁, . . . , i_n }

用户物品序列：s = [i₁, . . . , i _|s| ]

每个item i包含它独特的ID和多个属性，表示为i_j = {v_j, a_1,j, … , a_m,j}

DFT: 将一个序列由时间域转为频率域，表示为：F : R^N → C^N

结果可被分为两部分：低频成分和高频成分

相反，inverse discrete Fourier transform(IDFT), 表示为：F^-1 : C^N → R^N

Frequency-based Filtering:

低频信号：代表在一个序列内很少变化的稳定模式(长期且一致的兴趣)：关键

高频信号：信号出现快速的扰动(短期且不稳定的兴趣)：可能不重要且有噪声

实验表明，β会被训练为很小

(1) ID-centric Fusion: 捕捉ID间的相关性，中间融合

(2) Attribute-enriched Fusion

早期融合，对融合后的embedding使用自注意力：

(3) 用户表示：

使用一个对比性损失去对齐ID和属性的embedding空间

计算ID和融合属性embedding之间的相似性：
- E_a: 属性的融合矩阵，这里使用求和，将所有属性的embedding矩阵逐元素相加；
- τ：可学习温度系数，用于缩放。
最终对齐损失：
- 当Y=1时，让属性和ID相似度向更大的方向优化，实际优化embedding矩阵；
- Y的定义：在第i个序列中，如果有两个item在属性上的embedding一致，则把该两个item的Y标为1