标签分布系统定义
A label distribution system is a tuple
S
=
(
X
,
Y
)
S=(\mathbf{X},\mathbf{Y})
S=(X,Y) where
X
=
[
x
i
j
]
n
×
m
∈
R
n
×
m
\mathbf{X} = [x_{ij}]_{n\times m} \in \mathbb{R}^{n\times m}
X=[xij?]n×m?∈Rn×m is the data matrix,
Y
=
[
y
1
,
y
2
,
?
?
,
y
n
]
∈
[
0
,
1
]
?
st.
?
∑
i
=
1
n
y
i
=
1
\mathbf{Y}=[y_1,y_2,\cdots,y_n] \in [0,1]\, \text{st.} \, \sum_{i=1}^n y_i=1
Y=[y1?,y2?,?,yn?]∈[0,1]st.∑i=1n?yi?=1,
n
n
n is the number of instances,
m
m
m is the number of features.
对论文中数学表达式的分析
-
论文名: A Hybrid Recommender System Based on User-Recommender Interaction -
Definition 1: Let
U
=
{
u
1
,
u
2
,
?
?
,
u
n
}
U=\{u_1,u_2,\cdots,u_n\}
U={u1?,u2?,?,un?} and
M
=
{
m
1
,
m
2
,
?
?
,
m
k
}
M=\{m_1,m_2,\cdots,m_k\}
M={m1?,m2?,?,mk?} be two sets of objects. Any
R
?
U
×
M
R \subseteq U \times M
R?U×M is a binary relation from
U
U
U to
M
M
M. 涵义:
U
U
U 是用户的集合,大小为
n
n
n,
M
M
M 是电影的集合,大小为
k
k
k 。用户集合到电影集合的二元关系可以用
R
R
R 来表示。 -
Definition 2: Let
U
=
{
u
1
,
u
2
,
?
?
,
u
n
}
U=\{u_1,u_2,\cdots,u_n\}
U={u1?,u2?,?,un?} be the set of all users and
T
=
{
t
1
,
t
2
.
?
?
,
t
m
}
T = \{t_1,t_2.\cdots,t_m\}
T={t1?,t2?.?,tm?} the set of all items. The user interest matrix is
u
m
n
×
m
um_{n \times m}
umn×m? where
u
m
i
,
j
=
{
1
,
?if?
u
i
?is?interested?in?
t
j
0
,
?otherwise?
u m_{i, j}= \begin{cases}1, & \text { if } u_{i} \text { is interested in } t_{j} \\ 0, & \text { otherwise }\end{cases}
umi,j?={1,0,??if?ui??is?interested?in?tj??otherwise?? 涵义:
U
U
U 是用户的集合,一共
n
n
n 个用户,
T
T
T 是物品的集合,一个有
m
m
m 个物品。
u
m
n
×
m
um_{n \times m}
umn×m? 是用户兴趣矩阵,当第
i
i
i 个用户对第
j
j
j 个物品感兴趣时,矩阵的
i
i
i 行
j
j
j 列为1。 -
Definition 3: Let
T
i
?
T
T_i \subseteq T
Ti??T be the interests set of user
u
i
u_i
ui? and
T
r
=
{
t
x
1
,
t
x
2
,
?
?
,
t
x
N
}
T_r = \{t_{x_1},t_{x_2},\cdots, t_{x_N}\}
Tr?={tx1??,tx2??,?,txN??} the recommended set.
T
c
=
T
i
∩
T
r
T_c = T_i \cap T_r
Tc?=Ti?∩Tr? is the candidate browse set. 涵义:对于单个用户
u
i
u_i
ui? 感兴趣的物品集合,可以用
T
i
T_i
Ti? 来表示,且
T
i
T_i
Ti? 是所有物品集合的子集。
T
r
T_r
Tr? 表示在交互系统中系统推荐给用户的商品列表。
T
c
T_c
Tc? 指推荐列表中用户感兴趣的物品集合,表示为
T
i
T_i
Ti? 和
T
r
T_r
Tr? 的交集。 -
Definition 4: If
t
x
j
∈
T
c
t_{x_j} \in T_c
txj??∈Tc? and
?
k
∈
{
1
,
2
,
?
?
,
j
?
1
}
\forall k \in \{ 1,2,\cdots,j-1\}
?k∈{1,2,?,j?1},
t
x
k
?
T
c
t_{x_k} \notin T_c
txk??∈/?Tc?,
t
x
j
t_{x_j}
txj?? is the first match. 涵义:
t
x
j
t_{x_j}
txj??是推荐列表中的第
j
j
j 个物品,并且是用户感兴趣的物品,而用户对
t
x
j
t_{x_j}
txj?? 之前的其他物品都不感兴趣,则
t
x
j
t_{x_j}
txj?? 是第一匹配。 -
k
k
kNN switch
k
NN?switch
=
{
?true,?
?if?
∣
b
r
(
u
i
)
∣
≥
T
R
?false,?
?otherwise?
k\text{NN switch} =\left\{\begin{array}{ll}\text { true, } & \text { if }\left|b r\left(u_{i}\right)\right| \geq T R \\ \text { false, } & \text { otherwise }\end{array}\right.
kNN?switch={?true,??false,???if?∣br(ui?)∣≥TR?otherwise?? 涵义:
∣
b
r
(
u
i
)
∣
\vert br(u_i) \vert
∣br(ui?)∣ 为用户浏览过的商品数量,当其大于阈值
T
R
TR
TR 时,使用
k
k
kNN 推荐算法,否则使用随机算法。从而解决推荐系统冷启动和多样性的问题。 -
Definitoin 5: The interactive recall of user
u
i
u_i
ui? on a set of items
T
T
T through an RS is
ir
?
(
u
i
,
T
)
=
i
r
(
b
m
,
u
m
,
u
i
)
=
∣
{
t
j
∈
T
∣
b
m
i
,
j
=
1
}
∣
∣
{
t
j
∈
T
∣
u
m
i
,
j
=
1
}
∣
=
∑
k
=
1
m
b
m
i
,
k
∑
k
=
1
m
u
m
i
,
k
\begin{aligned} \operatorname{ir}\left(u_{i}, T\right) &=i r\left(b m, u m, u_{i}\right)=\frac{\left|\left\{t_{j} \in T \mid b m_{i, j}=1\right\}\right|}{\left|\left\{t_{j} \in T \mid u m_{i, j}=1\right\}\right|} \\ &=\frac{\sum_{k=1}^{m} b m_{i, k}}{\sum_{k=1}^{m} u m_{i, k}} \end{aligned}
ir(ui?,T)?=ir(bm,um,ui?)=∣{tj?∈T∣umi,j?=1}∣∣{tj?∈T∣bmi,j?=1}∣?=∑k=1m?umi,k?∑k=1m?bmi,k??? 涵义:
b
m
i
,
j
bm_{i,j}
bmi,j?是浏览矩阵,表示用户
u
i
u_i
ui? 是否浏览了物品
t
i
t_i
ti? ,是则矩阵
i
i
i 行
j
j
j 列元素取值1,否则取0。作者重新定义了召回率来衡量推荐系统的性能,针对一个用户的召回率表示为所有物品中用户浏览的物品数量与感兴趣的物品数量的比值。由于矩阵元素只有在用户感兴趣/浏览过时为1,其他时候为0,因此还能表示为
b
m
i
,
j
bm_{i,j}
bmi,j? 矩阵与
u
m
i
,
j
um_{i,j}
umi,j? 矩阵第
i
i
i 行上所有元素和的比值。 -
Definition 6: The interactive recall of an RS is
i
r
(
U
,
T
)
=
i
r
(
b
m
,
u
m
)
=
∑
i
=
1
n
∑
k
=
1
m
b
m
i
,
k
∑
i
=
1
n
∑
k
=
1
m
u
m
i
,
k
ir (U, T)=i r(b m, u m)=\frac{\sum_{i=1}^{n} \sum_{k=1}^{m} b m_{i, k}}{\sum_{i=1}^{n} \sum_{k=1}^{m} u m_{i, k}}
ir(U,T)=ir(bm,um)=∑i=1n?∑k=1m?umi,k?∑i=1n?∑k=1m?bmi,k?? 涵义:推荐系统的召回率表示为所有用户浏览过的物品数量与所有用户感兴趣的物品数量之比,即浏览矩阵中所有值之和与兴趣矩阵中所有值之和的比值。 -
规范:表达式中所有集合,向量和矩阵都未使用粗体表示。
|