| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 游戏开发 -> 潜在结果框架(Potential outcomes)与工具变量(Instrumental variable)介绍 -> 正文阅读 |
|
[游戏开发]潜在结果框架(Potential outcomes)与工具变量(Instrumental variable)介绍 |
Potential outcomes framework什么是potential outcome呢?考虑在医学中,X=0表示不吃药,X=1表示吃药,那么很显然,一个人是没有办法同时吃药与不吃药的,所以我们只能够观测到其中的一个结果,即 Y ( 0 ) \displaystyle Y( 0) Y(0)或 Y ( 1 ) \displaystyle Y( 1) Y(1),而X只是用于选择观测的结果。 然而每个人对于吃药的结果是有可能不同的,比如有的人不管吃不吃都没法变好,有的人吃了就能恢复了,有的人吃了反而更难受了,还有的不管吃不吃都能恢复,对应着以下四类。 可记为 P ( Y ( 0 ) = 0 , Y ( 1 ) = 0 ) = P ( N R ) P ( Y ( 0 ) = 0 , Y ( 1 ) = 1 ) = P ( H E ) P ( Y ( 0 ) = 1 , Y ( 1 ) = 0 ) = P ( H U ) P ( Y ( 0 ) = 1 , Y ( 1 ) = 1 ) = P ( A R ) P( Y( 0) =0,Y( 1) =0) =P( NR)\\ P( Y( 0) =0,Y( 1) =1) =P( HE)\\ P( Y( 0) =1,Y( 1) =0) =P( HU)\\ P( Y( 0) =1,Y( 1) =1) =P( AR) P(Y(0)=0,Y(1)=0)=P(NR)P(Y(0)=0,Y(1)=1)=P(HE)P(Y(0)=1,Y(1)=0)=P(HU)P(Y(0)=1,Y(1)=1)=P(AR) 基于上面的各种情况,我们用Average Causal Effect(ACE)计算的因果效应将是: A C E ( X → Y ) ≡ E [ Y ( 1 ) ? Y ( 0 ) ] = 0 ? P ( N R ) + 1 ? P ( H E ) + 0 ? P ( H U ) + 1 ? P ( A R ) ? ( 0 ? P ( N R ) + 0 ? P ( H E ) + 1 ? P ( H U ) + 1 ? P ( A R ) ) = P ( H E ) + P ( A R ) ? P ( H U ) ? P ( A R ) = P ( H E ) ? P ( H U ) ∈ [ ? 1 , 1 ] \begin{aligned} ACE\left( X\rightarrow Y\right) & \equiv E[ Y( 1) -Y( 0)]\\ & =0*P( NR) +1*P( HE) +0*P( HU) +1*P( AR)\\ & -( 0*P( NR) +0*P( HE) +1*P( HU) +1*P( AR))\\ & =P( HE) +P( AR) -P( HU) -P( AR)\\ & =P( HE) -P( HU) \in [ -1,1] \end{aligned} ACE(X→Y)?≡E[Y(1)?Y(0)]=0?P(NR)+1?P(HE)+0?P(HU)+1?P(AR)?(0?P(NR)+0?P(HE)+1?P(HU)+1?P(AR))=P(HE)+P(AR)?P(HU)?P(AR)=P(HE)?P(HU)∈[?1,1]? 从随机试验估计ACE那么ACE能不能从样本总估计呢?当满足ignorebility的时候就可以: X ⊥ Y ( 0 ) , ? X ⊥ Y ( 1 ) X\bot Y( 0) ,\ X\bot Y( 1) X⊥Y(0),?X⊥Y(1) 于是 P ( Y ( 0 ) = y ) = P ( Y ( 0 ) = y ∣ X = 0 ) = P ( Y = y ∣ X = 0 ) P ( Y ( 1 ) = y ) = P ( Y ( 1 ) = y ∣ X = 1 ) = P ( Y = y ∣ X = 1 ) P( Y( 0) =y) =P( Y( 0) =y|X=0) =P( Y=y|X=0)\\ P( Y( 1) =y) =P( Y( 1) =y|X=1) =P( Y=y|X=1) P(Y(0)=y)=P(Y(0)=y∣X=0)=P(Y=y∣X=0)P(Y(1)=y)=P(Y(1)=y∣X=1)=P(Y=y∣X=1) 此外 P ( Y = 1 ∣ X = 1 ) ? P ( Y = 1 ∣ X = 0 ) = P ( H E ) ? P ( H U ) P( Y=1|X=1) -P( Y=1|X=0) =P( HE) -P( HU) P(Y=1∣X=1)?P(Y=1∣X=0)=P(HE)?P(HU) 得到。 反事实与随机试验从上面的分析我们可以发现,我们只能从实验数据中得到4类人群比例的两两组合,却没有办法得到精确的 P ( N R ) , P ( H E ) , P ( H U ) , P ( A R ) \displaystyle P( NR) ,P( HE) ,P( HU) ,P( AR) P(NR),P(HE),P(HU),P(AR)的值。 为什么我们需要在意他们每个人群的比例呢?直接算ACE不就好了?其实,ACE是一个“不太完善”的指标,因为ACE只是考虑的人群中的平均有效性,但忽略了那些会因为吃药而因此受伤的人,如果要正确的评价药效,那么我们应该用以下“完善”的指标: 吃 药 收 益 = a P ( N R ) + b P ( H E ) + c P ( H U ) + d P ( A R ) 不 吃 药 收 益 = e P ( N R ) + f P ( H E ) + g P ( H U ) + h P ( A R ) 吃药收益=aP( NR) +bP( HE) +cP( HU) +dP( AR)\\ 不吃药收益=eP( NR) +fP( HE) +gP( HU) +hP( AR) 吃药收益=aP(NR)+bP(HE)+cP(HU)+dP(AR)不吃药收益=eP(NR)+fP(HE)+gP(HU)+hP(AR) 其中a,b,c,d对应了每个不同人群下,吃药的收益,而e,f,g,h则是每一类人不吃药的收益,我们的目标是看看上述那个收益较大。显然,通过设置不同的收益,我们会有不同的决策。 但可惜的是,这是一个counterfatual问题,你是无法知道每一类人的比例的,为什么?不妨想想自己属于哪类人?你肯定无法给出答案,毕竟你无法同时知道自己吃药与不吃药后的状态,你只能观测其中一个。 所以我们观测的只是反事实的一小部分而已。 反事实与非随机试验(纯观测数据)如果没有随机试验,这意味着ignobility是无法满足的,此时,我们没有办法从纯观测数据中得到正确的ACE了,那么我们能不能找到ACE的一个范围呢?考虑以下例子, 有的人使用了安慰剂,有的人使用了药,但是是否决定用药是非随机的。在这种情况下,我们尝试分析下, P ( H E ) \displaystyle P( HE) P(HE)和 P ( H U ) \displaystyle P( HU) P(HU)的最大值和最小值。 首先HE是吃了药才好,但不吃药就不好的人。首先
P
(
Y
=
0
∣
X
=
0
)
\displaystyle P( Y=0|X=0)
P(Y=0∣X=0)里面可能有HE,也可能有NR,就是永远不好的人,另外,
P
(
Y
=
1
∣
X
=
1
)
\displaystyle P( Y=1|X=1)
P(Y=1∣X=1)中可能有HE,也可能有AR,即吃不吃药都好的人。因此
P
(
H
E
)
\displaystyle P( HE)
P(HE)的最大值就是当NR,AR都是0的时候,即 那么HU的最小值是什么呢?类似的, P ( Y = 1 ∣ X = 0 ) \displaystyle P( Y=1|X=0) P(Y=1∣X=0)包含了AR和HU的人, P ( Y = 0 ∣ X = 1 ) \displaystyle P( Y=0|X=1) P(Y=0∣X=1)包含了NR和HU的人,那显然最小值就是这两拨人中,全是AR和NR的人了,于是 m i n ? P ( H U ) = 0 min\ P( HU) =0 min?P(HU)=0 从而 m a x ? A C E = 6 + 7 20 ? 0 \displaystyle max\ ACE=\frac{6+7}{20} -0 max?ACE=206+7??0. 类似的, m i n ? P ( H E ) = 0 m a x ? P ( H U ) = 4 + 3 20 = 0.35 min\ P( HE) =0\\ max\ P( HU) =\frac{4+3}{20} =0.35 min?P(HE)=0max?P(HU)=204+3?=0.35 从而 m i n ? A C E = 0 ? 4 + 3 20 \displaystyle min\ ACE=0-\frac{4+3}{20} min?ACE=0?204+3?. 所以一个伤心的事实是,我们没有办法从纯观察数据中推断出ACE到底是正面还是负面的效果,他必然是经过0点的。 上面是一个比较直接的做法,我们可以尝试严格地证明一下这个bound。 P ( Y = 0 , X = 0 ) + P ( Y = 1 , X = 1 ) = P ( X = 0 , N R ) + P ( X = 0 , H E ) + P ( X = 1 , H E ) + P ( X = 1 , A R ) = P ( X = 0 , N R ) + P ( H E ) + P ( X = 1 , A R ) ? P ( H E ) \begin{aligned} & P( Y=0,X=0) +P( Y=1,X=1)\\ = & P( X=0,NR) +P( X=0,HE) +P( X=1,HE) +P( X=1,AR)\\ = & P( X=0,NR) +P( HE) +P( X=1,AR)\\ \geqslant & P( HE) \end{aligned} ==??P(Y=0,X=0)+P(Y=1,X=1)P(X=0,NR)+P(X=0,HE)+P(X=1,HE)+P(X=1,AR)P(X=0,NR)+P(HE)+P(X=1,AR)P(HE)? 因此,类似的 HE轴上的点表示所有人都是HE,HU轴上的点则表示所有人都是HU,AR轴上的点表示所有人都是AR,最后原点,表示所有人都是NR,因为此时AR,HE,HU都是0,所以都剩下NR了,也就是NR可以通过1-AR-HE-HU得到。 接下来,我们来计算一下这些bound: 我们可以用Mathematica画出来看看:
于是,这堆平面里面,最里面的部分就是可行域 因为ACE只关心HE和HU,所以我们就只看这幅图的底部或者顶部投影,就是所有HU,HE的取值 这幅图告诉我们,HE的取值区间为[0,0.65],HU的取值区间为[0,0.35],这与我们的分析是一致的。虽然这个东西看起来没什么用,但这个分析方法可以帮助我们分析更多的问题,比如工具变量问题。 工具变量(Instrumental Variables)显然,当存在confounder的时候ACE是无法识别的, 这种时候往往采用工具变量的方法 我们假设存在一个z,不受confouder的影响。举个例子, Z表示医生建议吃的药,X表示病人是否真的吃药,Y表示是否变好。这个例子里,简化了下问题,当医生决定不开药的时候,病人是无法得到药的,所以不可能存在 Z = 0 , X = 1 \displaystyle Z=0,X=1 Z=0,X=1的情况。 那么在这种情况下,我们能不能找到X对Y的ACE呢? 首先,根据上一节我们知道,对于每一个关于X,Y的观察数据,我们都能够得到ACE的边界(尽管看起来没什么用),但在这里就不一样了,因为我们发现,不同的z有不同的关于X,Y的观察数据,唯一不同的是X的分布不太一样(因为受到了Z的影响),但我们知道,不管X的分布怎么变,因果效应ACE都是不变的, 所以,我们可以从两个不同Z的观察数据,估计其不同人群的比例,并取交集, 取交集之后,我们再看底部, 可以发现,我们得到了一个不再经过0点的范围,从这个范围我们可以给出ACE的bound是[0.39,0.78]。事实上,Z可以有更多的取值,我们只需要简单的将他们相交就能得到范围的估计。 当前很多关于ACE的bound本质上就是这个取交集的操作,如上图. 参考资料An Introduction to Potential Outcomes, DAGs and Single-World Intervention Graphs |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/27 14:37:08- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |