线上服务阶段采用odds:
e
x
e^{x}
ex作为观看时长的评测指标。
(Odds 的定义:事件发生概率与不发生概率的比值,公式为:
o
d
d
s
=
p
1
?
p
odds=\frac{p}{1-p}
odds=1?pp?)
注1: 逻辑回归(LR)的odds是怎么得到的?
根据odds的定义,可推到出逻辑回归对应的odds为
1
e
x
1
1
?
e
x
=
e
x
\frac{\frac{1}{e^x}}{\frac{1}{1-e^x}}=e^{x}
1?ex1?ex1??=ex,
注2: 为什么odds可以用来评测观看时长?
因为这里采用的是Weight LR,将观看时长
T
i
T_i
Ti?作为权重对正样本
i
i
i 而言,其对预测结果的影响提升了
T
i
Ti
Ti倍,
o
d
d
s
i
=
T
i
?
p
i
odds_i=T_i*p_i
oddsi?=Ti??pi?, 因此odds可以用来评估观看时长。
设N为总样本书,k为正样本数,当样本足够多时,频率可用于估算概率,因此
o
d
d
=
∑
T
i
N
?
k
odd=\frac{\sum{T_i}}{N-k}
odd=N?k∑Ti??
分子分母同时除以N,得:
o
d
d
s
=
E
(
T
)
1
?
p
odds = \frac{E(T)}{1-p}
odds=1?pE(T)?
其中
p
p
p 代表样本为正的概率。
根据等比公式:
1
+
p
+
p
2
+
.
.
.
+
p
n
=
1
?
p
n
1
?
p
1+p+p^2+...+p^n=\frac{1-p^n}{1-p}
1+p+p2+...+pn=1?p1?pn?
因为在此
p
p
p值很小,因此上式可等价于:
1
+
p
=
1
1
?
p
1+p=\frac{1}{1-p}
1+p=1?p1?
因此:
o
d
d
s
=
E
(
T
)
(
1
+
p
)
≈
E
(
T
)
odds=E(T)(1+p)\approx E(T)
odds=E(T)(1+p)≈E(T)
因此odds可以用来表征观看时长。