| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> stata实现经济生态的空间杜宾模型 -> 正文阅读 |
|
[人工智能]stata实现经济生态的空间杜宾模型 |
文章目录摘要本周一是简单实现了在stata上的空间杜宾模型的具体实现步骤,首先是获取shp 文件,再利用Arcgis或者Geoda生产空间权重矩阵,或者直接创建经济权重矩阵;下一步就是进行被解释变量的空间自相关分析,即莫兰指数的具体实操;以及对空间杜宾模型的在stata实现命令操作,最后便是对模型的解读。 一. Stata 实现空间杜宾模型过程1.空间权重矩阵的生成1.1 获取地图json数据文件首先是获取地区的shap文件,通过阿里云API去获取json数据:如下图所示
1.2 获取市级行政单元Shapefile借助python中强大的空间分析库geopandas即可将geojson文件转为shapefile文件。(直接pip会报错,它依赖于这四个库gdal、Shapely、Fiona、pyproj) python一键获取区域shp 文件。
最终生成文件如下图所示,dbf文件内容(可正常显示)如右图所示: 1.3 Arcgis创建空间权重矩阵参考博客:空间权重矩阵的创建 ArcToolBox—空间统计工具—空间关系建模—生成空间权重矩阵 空间统计工具——工具——将空间权重矩阵转化为表(为dbf 文件)
表示对R语言真的看不懂。。。。。
获取到广西市级地区的空间权重矩阵(01邻接),其表示如下图: 1.4 创建经济距离权重矩阵参考博文:经济距离矩阵的创建 1.准备数据:第一列为市级地区名,第二列为计算指标,这里为某段期间内人均GDP的平均值(本例子只是利用2020年的数据)
如上就得到了经济距离矩阵: 2.莫兰指数分析2.1 收集整理需要被解释分析的变量1.是通过整理历年(2010-2020)的广西市级区域的EI(生态环境综合指数),如图: 格式如下图所示: 2.2 莫兰指数的计算在stata的中创建do-file执行: 全局莫兰指数的计算
其结果显示如下: 局部莫兰指数的计算
莫兰指数图: 通过全局莫兰与局部莫兰指数分析,发现其大部分是具有空间效应的,可继续对其进行下一步分析。下面是三个检验(LM检验,LR检验,Hausman检验): 3. 空间杜宾模型简单实现可以参考概念:之前自己做的总结:空间自相关分析概念与大致思路 1.导入面板数据 首先是做LM检验,用来检验用不用空间计量模型,或者需要用哪个。 空间计量模型: 第一步:先执行LM检验,检测空间自回归效应
注:这是行标准化过的空间权重矩阵,Qmatrix为标准化的空间矩阵。
第二步:对模型的效应类型进行检验,即检验是否是固定效应,还是随机效应。
第三步:检验SDM模型是否会退化为SARI模型或者SEM模型
最终结果:我们可以发现应当选择带随机效应的空间杜宾模型去进行空间的相关性分析。
最后我们执行一个带有随机效应的空间杜宾模型的操作命令:
结果显示如下图: 4. 关于空间杜宾模型的具体解读结果解读不是特别准确,后面需要更具解释变量去再次改进该模型的最终效果分析。 模型结果分析: X为解释变量(rGDP,R1,R2),Y 为被解释变量(即EI生态综合指数)。 Main 显著则说明x对y的影响显著 W 显著则说明x对y有空间溢出效应。 Spatial 显著则说明y有对自身的空间溢出效应。 9.溢出效应分解 简单来说: 直接效应:本地区X——>本地区Y的影响 LR_Direct 直接效应:同区域x对y的影响程度 LR_Indirect 间接效应:其他区域x对y的影响程度 LR_Total 总效应:所有区域x对y的影响程度 总结目前面板数据的解释变量只有rGDP有较好的解释性,下一步需要从这里改进,加入人口总数,生态数据,这样也许会更好的结果分析。 二. 论文-DeepVisualInsight: Time-Travelling Visualization for Spatio-Temporal Causalit of Deep Classification Training深度视觉洞察——深度分类训练时空因果关系的时间旅行可视化 作者:杨向林、云林、刘若芳~等 1. 论文摘要了解深度学习模型的预测是如何在训练过程中形成的,对于提高模型性能和修复模型缺陷至关重要,尤其是当我们需要调查非平凡的训练策略(如主动学习)和跟踪意外训练结果(如性能退化)的根本原因时。在这项工作中,我们提出了一种时间旅行视觉解决方案 DeepVisualInsight (DVI),旨在在训练深度学习图像分类器的同时体现时空因果关系。时空因果关系展示了梯度下降算法和各种训练数据采样技术如何影响和重塑学习输入表示的布局和连续时期的分类边界。这种因果关系使我们能够在可见的低维空间中观察和分析整个学习过程。从技术上讲,我们提出了四个空间和时间属性,并设计了我们的可视化解决方案来满足它们。当在可见的低维和不可见的高维空间之间逆向投影输入样本时,这些属性保留了最重要的信息,以进行因果分析。我们广泛的实验表明,与基线方法相比,我们在空间/时间属性和可视化效率方面实现了最佳可视化性能。此外,我们的案例研究表明,我们的视觉解决方案可以很好地反映各种训练场景的特征,显示出 DVI 作为分析深度学习训练过程的调试工具的良好潜力。 文章idea是在训练深度学习图像分类器的同时体现时空因果关系。时空因果关系展示了梯度下降算法和各种训练数据采样技术如何影响和重塑学习输入表示的布局和连续时期的分类边界。 2. Introduction在训练和分析深度学习模型时,解释模型预测是一个重新设计好的挑战。已经提出了各种可解释的人工智能技术来理解模型预测,包括输入属性分析、训练数据分析、模型抽象等。通常,现有的解决方案侧重于:
尽管这些技术有助于解释经过训练的模型,但很少有人提出要解释在训练过程中模型预测是如何形成的。虽然渐进式训练信息可能有用,但很难抽象出底层模型演化语义。语义问题可以(但不限于):(1)训练过程如何逐渐提高模型的稳健性,并重塑分类边界?(2) 模型如何在牺牲其他样本的同时,逐渐做出权衡,以适合某些样本?(3) 模型如何努力适应和学习硬样本? 在本论文任务中,我们设计了一个时间旅行可视化解决方案DeepVisualInsight(DVI),重点展示了深度学习分类器训练过程的时空因果关系。DVI将学习到的输入表示及其分类景观投射到一个可见的低维空间中,从空间和时间的角度展示了模型预测是如何在训练阶段形成的。 在空间上,DVI可视化了(1)学习输入表示的布局和(2)描述每个类的“区域”的分类景观。 在时间上,DVI可视化了(1)分类环境和训练输入表示如何在训练时期演变,(2)新的采样训练输入如何重塑分类边界。时空信息允许我们观察训练异常(例如噪声数据集)并验证一些特定的训练策略(例如主动学习采样策略的有效性)。 我们设计DVI以支持开放式开发。也就是说,DVI忠实地反映了通过训练过程学习模型的深度,这不仅确认了已知的模型属性,还支持发现未知现象和模型缺陷。 我们的方法将输入作为在不同训练阶段训练的分类器及其训练/测试数据集,然后学习可视化模型(即通过自动编码器),以(1)将高维样本投影到可见的低维空间,(2)将低维点反向投影回高维空间(用于可视化分类景观),(3)确保可视化模型能够满足一组空间和时间约束。我们为任何时间旅行可视化解决方案提出了四个可视化属性,以保持(1)高维和低维流形之间的拓扑结构,(2)训练样本表示和潜在决策边界之间的距离,(3)低维/高维空间投影和逆投影后样本的语义,(4)在经过训练的分类器中,可视化景观按时间顺序的连续性。总之,我们做出以下贡献:
3. Motivating Example下图显示了我们在 CIFAR-10 数据集上的对抗性训练过程的可视化。每个点代表一个样本,每种颜色代表一个类别。点的颜色代表样本的标签,区域的颜色代表预测的类别。例如,位于棕色(狗类)区域的红色(猫类)点表示它被标记为猫但被分类为狗。此外,颜色阴影表示预测的置信度,不自信的区域(即分类边界)被可视化为白色区域。总体而言,分类区域和边界形成分类景观。 在这里,模型拟合过程通过以下过程可视化:(1)重新塑造分类边界和(2)将那些数据点拉向相应颜色的区域。 为了清楚起见,我们在图1中显示了一个测试点(带黄色边缘的大红点)和它的十个最近邻对抗点(棕色)。在对抗性训练期间,(1)对抗点逐渐被拉到其颜色对齐的区域,而(2)测试点也逐渐从其颜色对齐的区域“拉”到其敌对邻居的区域。(测试点会随着迭代次数被拉进其敌对类中)这种权衡是逐渐形成的。 在(DVI 2021)中,我们可以通过可视化整体数据点的动态来进一步显示这种权衡的存在。DVI工具可以进一步将过程可视化为动画。此外,它还支持样本和迭代查询,以便用户观察感兴趣的样本和迭代的动态,深入了解模型训练过程。 为任何时间旅行可视化技术提出四个属性: Notation Definition(符号定义) 我们使用表 1中的符号。我们有一个用于 C 类分类问题的主题模型 c(.)。 输入空间表示为 S,其中 S ? Rd。 S = [s1, s2, …sN ]T 是训练输入集。 f : Rd → Rh 是一个特征函数,使得 x = f(s) 是输入 s ∈ S 的具有 h 维的表示向量。我们将表示向量的流形空间表示为 X,其中 X ? Rh。 训练数据的学习表示表示为 X,其中 X =[x1, x2, …xN ]T。 令 g : Rh → RC 为预测函数,其中 g(x)i 表示第 i 个类的 logits。 分类器 c 由 f 和 g 组成,即 c = g ? f : Rd → RC。 投影函数 φ:Rh→Rl,将流形空间X投影到可见的低维空间Y,其中Y=Rl(l is 2 or 3)。 将 X 投影到 Y(即 Y=φ(X))会产生对应的 Y= [y1,y2, …yN]T。 逆投影函数 ψ:Rl→Rh,其中将可见的低维空间 Y 反向投影回 这下面四个属性需要重新细读理解: 1. 邻域保持性 2. 边界距离保持性 3.逆投影保持性 4.时间保持性 4. 文章研究方法概述: 如图所示,DVI将一个按时间顺序训练的分类器序列C = {c1, c2, …, cT }作为主题模型,并生成相应的可视化模型序列(即自动编码器)V = {V 1, V 2, …, VT } 导出可视化分类景观。 我们使用上标来表示所有符号的时间顺序。 对于每个可视化模型V t = (hφt, ψt)i,编码器作为投影函数φt,解码器作为反投影函数ψt。 针对 ct 的每个可视化模型 V t 都针对四个空间和时间属性进行了训练。 我们 这里对DVI的 具体的研究方法 没有读懂! 评估数据集和主题模型:我们选择三个数据集,即,MNIST(60K/10K 训练/测试集),Fashion-MNIST(60K/10K 训练/测试集)和 CIFAR-10(50K/10K 训练/测试集)。 我们使用 ResNet18 作为主题分类器,全局平均池化层作为特征向量(即 512 维)。 基准线: 我们选择 PCA、t-SNE、UMAP 和 DeepView 作为 文章核心结论该论文主要是在论述DVI在理解深度学习模型中的预测是如何形成的,可以发挥重要的作用,其旨在训练深度学习图像分类器的同时,去体现时空因果关系——展示了梯度下降算法和各种训练数据采样技术如何影响和重塑学习输入表示的布局和连续时期的分类边界。以及多个案列展现DeepVisualInsight (DVI) 工具,了解如何使用它以及它如何有助于调试深度神经网络。 小结上面这篇DVI论文的研究方法部分没有完全理解,对其原有的那些可解释性方法,可视化的过程需要了解一些,再对该篇论文与原有的可解释性有什么不同的地方。下一步论文方面,多阅读关于时间序列预测模型,达到SOTA预测效果的较新的文献。 |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 13:27:13- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |