Prose_用GeoDa做空间分析

下午看了会Geoda软件的操作,比较像SPSS在社会统计里,因都是可视化点击,做空间回归很好上手。但因处理过程无代码,无法复制。

一、历史

空间计量1979年由Paelinck提出,后为Anselin发展,B站有Anselin的课程。空间计量的目的是解决传统计量的假设问题,传统假设江苏省gdp与上海市gdp无关;但空间计量假设,相邻区域存在地理空间效应,观测值存在非独立性。
另按空间计量经济学走过了怎样的30年,对空间计量的历史更详细些。

二、概念

1. 空间依赖性,又称空间自相关性,主要指在地理空间区域上的某种属性值与其相邻近的空间区域上的同一属性值之间的相关程度,通常利用空间自相关系数作为基本的度量指标,用其来检验单位区域内某一属性值在地理空间上是否具有高高相邻、低低相邻或高低相邻,即地理空间上是否存在聚集性。
a) 具体以全局Moran指数,如中国各个省份gdp是否存在集聚性。
b) 具体以局部Moran指数,如上海市gdp与周围省市gdp存在相关。
Moran>0,值越大,空间相关性越大;Moran<0,值越小,空间差异性越大;Moran=0,不存在空间相关。
2. 空间异质性,即空间结构的非均衡性,表现为主体行为之间存在明显的空间结构性差异。如上海市gdp与西藏gdp有不同发展模式。
3. 空间计量模型
ols模型、因变量-空间滞后模型(Spatial lag model, SAR/SLM)、误差项-空间误差模型(Spatial errors model, SEM)、自变量-空间滞后模型(SLX)、因变量与自变量-空间杜宾模型(SDM)、自变量与误差项-空间杜宾误差模型(Dubin Spatial model, DSM)等。

三、Columbus 案例

1. 导入地图(如 gadm.org,一般以shp格式为主)
Columbus Data是俄亥俄州哥伦布市的社区犯罪率、社区家庭收入与社区房价等数据的案例。观测值49100个,变量20个,时间为1980年。
2. 导入新数据 表格-合并-数据源(如csv格式)
3. 创建空间权重矩阵
Gis中存在点、线、面三种数据。其中,点数据一般以基于距离空间权重中的k邻近、自适应核为主;面数据一般以邻接空间权重、基于距离空间权重中的距离带为主。
a)邻接空间权重(附件有关联):queen为两区域拥有共同边;rock为两区域拥有共同点。
b)距离空间权重(全局均有关联):距离带;k邻近,即每个区域设置固定邻居数;自适应核,即对应核函数与指定带宽。
4. 空间分析,单变量Moran指数-单变量局部Moran指数;双变量Moran指数;随机化999次置换z得分检验;
5. 空间回归,因Columbus Data为截面数据,使用误差项空间误差模型(SEM)
geoda example

四、参考

内容整理自(1)零基础20分钟掌握用GeoDa进行空间自相关分析,Geoda入门介绍十分清晰;(2)GeoDa软件操作,空间权重、ArcMap后续图例制图部分作为一的补充;(3)15分钟学会使用Geoda做空间计量,Moran检验与基本回归操作作为一、二的补充,但Geoda版本较老;(4)Geoda截面空间计量模型实战,空间计量模型介绍可作上述补充,但后续内容收费。
另,按空间计量及Geoda、Stata、R操作,R中可用sp、spData、sf、spdep、splm、mgcv等包代替Geoda做空间自相关回归,该文作者有视频讲解