简单神经编码模型—特征选择
引入
回顾一下我们在简单编码神经模型中的目标:构建一个由特定神经元产生的单个spike的响应模型,即一个encoding模型
我们将考虑在特定时间t,刺激s下观察到的单个spike的概率r(t)。 回到模型实际应用方面,假设我们这里所建立的模型是基于视网膜对于视觉信号的处理,换句话说我们想要通过建模来仿真观看电影时某个特定神经元的响应过程。
由于我们的模型是基于条件概率,那么就意味着会出现很多种可能的刺激源,而把每种响应值都采样又是不太可能的;因为随着可能的刺激类别增多,尤其是面对影像数据时,庞大的数据带来巨大的计算负担,因此我们需要一种策略去简化这种响应模式,而这就涉及到了选取主要特征也就是降低维度。
高斯白噪声特征选取
明确策略之后,我们就开始思考如何把一种任意的刺激转换为一种可测量的尺度,在这里我们以s(t)作为例子: 我们选取每一个时间点的s,并将其投射到一个由t1、t2、t3…建立的高维空间中去。即s(t)离散化之后被转换为了可测量的高维数据。
继续引入中的问题,我们怎么才能够在不对所有刺激类别进行采样的前提下总结触发spike响应的刺激特征呢? 一种常用的方法是高斯白噪声。高斯白噪声是随机变化的输入,它是在每个时间步选择一个新的高斯随机数(任意时刻出现的噪声幅值都是随机的)。实际信号处理过程中,时间步长被设置为信号中的最高截止频率。 因此高斯白噪声包含的频率范围比较广,且几乎都拥有相同功率。
利用大批量的高斯白噪声,我们可以做到覆盖几乎所有的刺激类别,我们将生成的白噪声刺激分布称作先验分布,因为它与我们神经元的响应完全独立。 图右高斯先验分布是通过将图左一系列高斯白噪声投射到时间t所在的高维空间上得以实现的。简单来说,就是将刺激从频域转换到时域,由高维空间的一个点指代一个刺激。 现在让我们来看看触发spike的刺激,可以发现他们在高维空间上呈现某种分布,为了更好的提取这种特征,我们选取这一系列触发spike刺激的均值,也就是spike-triggered average作为触发响应的表征。
总的来说特征提取分为三步:
- 利用高斯白噪声生成一系列可能的刺激,并对产生的响应进行采样
- 根据采样结果选取能触发spike的白噪声
- 计算上一步中白噪声的均值,作为触发spike响应的刺激表征
上图为一个特征提取的实际例子,可以看出最后提取出来的spike-triggered average呈现出明显的特征变化。
线性滤波器
回顾一下在简单神经编码模型中我们所提到过的线性滤波器,在执行加权求和(卷积)的过程中需要一个线性滤波器
f
f
f,而这个
f
f
f也就是我们上一节得到的投射在高维空间里的刺激特征向量
s
1
s_1
s1?。
此时
P
(
s
p
i
k
e
∣
s
1
,
s
2
,
s
3
.
.
.
s
n
)
?
>
P
(
s
p
i
k
e
∣
s
1
)
P(spike|s_1,s_2,s_3...s_n)->P(spike|s_1)
P(spike∣s1?,s2?,s3?...sn?)?>P(spike∣s1?)
由于我们建立模型的目的为观察给定时间t,特定刺激s下产生响应的概率;这里的刺激s被线性滤波器
f
f
f替代,因此我们需要通过其他变换求得结果。
通过应用贝叶斯法则,我们得到了以上展开,
P
(
s
1
)
P(s_1)
P(s1?)为我们之前得到的先验刺激概率,
P
(
s
p
i
k
e
)
P(spike)
P(spike)也是已知的,而
P
(
s
1
∣
s
p
i
k
e
)
P(s_1|spike)
P(s1?∣spike)可以通过刺激s与响应spike求得。 spike分布概率
P
(
s
1
∣
s
p
i
k
e
)
P(s_1|spike)
P(s1?∣spike)与先验概率
p
(
s
1
)
p(s_1)
p(s1?)的关系可以直接用于评估我们的模型。
- 任意一个来自于spike分布
P
(
s
)
P(s)
P(s)和先验概率随机分布
P
(
s
1
∣
s
p
i
k
e
)
P(s_1|spike)
P(s1?∣spike)的直方图是相同的。这可能意味着其他的刺激值对神经的响应可能并没有作用,或是我们选择了错误的特征从而影响了之后的滤波等一系列过程
- 我们希望看到的是先验概率随机分布和spike分布的直方图有一个明显的区别。这里的输入输出曲线更具有结构性意义,也同时符合生物学意义:即firing rate较高时更倾向于产生spike。
PCA降维
我们做到了选取主要特征,但是维度的问题依旧没有解决,返回到白噪音试验中来考虑,我们可以找到一些平均点来完成修正spike-triggered average的过程,但是我们也可以考虑提取更主要的成分,即应用主成分分析法。
主成分分析法(PCA)即通过将高维数据映射到低维空间,并保留绝大部分信息的形式完成降维的目的。
PCA降维在神经科学实验中也有很多实际应用,例如它可以用来收集从多个电极中记录的spike的值。 PCA 可以挑选出两个主成分从而捕获数据中最大的方差。通常,这将保留spike的完整波形。 所有被扔掉的组件都只是噪音。 欢迎大家关注公众号奇趣多多一起交流!
|