全网最全的卷积运算过程:https://blog.csdn.net/Lucinda6/article/details/115575534?spm=1001.2101.3001.6661.1&utm_medium=distribute.pc_relevant_t0.none-task-blog-2%7Edefault%7ECTRLIST%7ERate-1-115575534-blog-120089990.pc_relevant_paycolumn_v3&depth_1-utm_source=distribute.pc_relevant_t0.none-task-blog-2%7Edefault%7ECTRLIST%7ERate-1-115575534-blog-120089990.pc_relevant_paycolumn_v3&utm_relevant_index=1
CNN卷积核与通道讲解:https://blog.csdn.net/yilulvxing/article/details/107452153?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522165192580116781435494528%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fall.%2522%257D&request_id=165192580116781435494528&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2allfirst_rank_ecpm_v1~rank_v31_ecpm-4-107452153-null-null.142v9pc_search_result_control_group,157v4control&utm_term=%E5%8D%95%E9%80%9A%E9%81%93%E5%8D%B7%E7%A7%AF%E6%A0%B8%E5%A4%9A%E9%80%9A%E9%81%93%E5%8D%B7%E7%A7%AF%E6%A0%B83D%E5%8D%B7%E7%A7%AF&spm=1018.2226.3001.4187
3d卷积和2d卷积:https://blog.csdn.net/qq_35415875/article/details/120415505?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522165192774516781432913892%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fall.%2522%257D&request_id=165192774516781432913892&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2allfirst_rank_ecpm_v1~rank_v31_ecpm-29-120415505-null-null.142v9pc_search_result_control_group,157v4control&utm_term=%E5%A6%82%E4%BD%95%E7%90%86%E8%A7%A33D%E5%8D%B7%E7%A7%AF&spm=1018.2226.3001.4187
3D
拿视频做卷积来说,并不是说有rgb三通道就是3d卷积了,而是,某一帧是二维,多张连续帧就是三维了,加了时间维,然后3d卷积是可以在帧与帧之间进行卷积的。如下图所示,蓝色代表一帧,绿色代表一帧,红色代表一帧,3d卷积很明显可以获得帧间的信息关系。
1D,向量维度就是类比图像的通道数了
图中的输入的数据维度为8,过滤器的维度为5。与二维卷积类似,卷积后输出的数据维度为8?5+1=4。 如果过滤器数量仍为1,输入数据的channel数量变为16,即输入数据维度为8×16。这里channel的概念相当于自然语言处理中的embedding,而该输入数据代表8个单词,其中每个单词的词向量维度大小为16。在这种情况下,过滤器的维度由55变为5×16,最终输出的数据维度仍为4。 如果过滤器数量为n,那么输出的数据维度就变为4×n。 一维卷积常用于序列模型,自然语言处理领域。
2D
上述过程中,每一个卷积核的通道数量,必须要求与输入通道数量一致,因为要对每一个通道的像素值要进行卷积运算,所以每一个卷积核的通道数量必须要与输入通道数量保持一致。
那么,如果要卷积后也输出多通道,增加卷积核(filers)的数量即可,示意图如下:
|