4 点状数据分析


以Assault数据集为例。该数据集记录了某城市某一时间段内的犯罪时空信息。本文档将演示使用不同方式分析昼夜之间的犯罪行为的空间差异。

4.1 数据处理

为了方便分析,我们首先需要将数据分为昼间数据和夜间数据。我们以7:00和19:00作为昼夜划分的标准。分组可以细划为两个步骤:数据的筛选与数据的导出。

4.1.1 筛选日间数据

在选择数据之前,最好先使用清除选择功能:

打开数据表后,在表上方工具栏找到“按属性选择”,并点击。

由于我们关注昼夜差别,因此选择CTime字段作为筛选条件使用的变量。

在这里可以获取唯一值,概览数据。

上方的运算符,可以点击添加,也可以手动在框中输入。

使用“AND”连接条件。

按下确定,得到昼间犯罪578个。

4.1.2 导出日间数据

选择好数据后,我们将选择的数据导出为单独的昼间数据文件。右键图层上的数据源,选择数据-导出数据。

选择“所选要素”。

按下“Browse”浏览存储位置。

在文件浏览窗口中将导出数据改为Shapefile格式。

选择相应的目录,填写名字,点击“保存”。

点击“确定”,开始导出。

导出结束后,可以选择将导出的图层添加到我们的地图上。这里选择“是”。

4.1.3 筛选夜间数据

由于昼夜是二分变量,因此只需要做反向选择即可筛选夜间数据。在表视图的上方选择“切换选择”按钮。

4.1.4 导出夜间数据

以同样的方法导出并添加夜间数据。添加后,我们移除原始数据:在对应的数据源上右键,点击“移除”即可。

4.1.5 昼夜数据的符号显示

为了使昼夜数据对比更明显,我们可以更改符号显示。可以通过双击图层上的符号来更改。

也可以右键数据源,选择“属性”。

在“符号系统”一栏,选择符号的要素类型,这里以单一符号为例。

点击“符号”旁的按钮即可进入符号修改界面。

4.2 数据分析

4.2.1 打开工具箱

数据分析使用的工具大多数在工具箱中,因此我们需要先调出工具箱。在工具栏中点击“ArcToolBox”。

然后就可以看到工具箱了。

4.2.2 平均中心

4.2.2.1 计算平均中心

在工具箱中,选择空间统计-度量地理分布-平均中心,双击。

选择要素类和输出路径,点击“开始”。

完成后,会添加一个数据源到图层。我们发现这个中心点不够显眼,可以通过调整符号系统来让中心点显眼一些。

以同样方式计算夜间数据的平均中心,并更改符号。

取消昼间数据和夜间数据的显示,现在我们可以清楚地看到两个中心点。

4.2.2.2 调整显示单位

注意到,ArcMap中默认的单位是英尺。出于习惯,我们可以改为千米。点击菜单-视图-数据框属性。

切换到“常规”一栏。

在“显示”下拉框中选择单位。

点击确定即可。

4.2.2.3 昼夜平均中心的距离

我们想要测量两个平均中心的距离。

选择工具栏的“测量”工具。

连接两个点。我们发现显示的单位是英尺,设置为千米。

4.2.3 方向分布(标准差椭圆)

选择空间统计工具-度量地理分布-方向分布(标准差椭圆),打开。

选择输入的要素类和输出的路径。选择椭圆大小为1个标准差,这在理想情况下会包括大约68%的点。

点击“确定”。

生成后,我们更改标准差椭圆的填充色为无填充,仅保留轮廓,以保留点的显示。

打开属性表,可以查看椭圆的属性。

包括椭圆的几何中心、长短轴长度和旋转角度。

以同样的方式计算夜间数据的标准差椭圆。

4.2.4 标准距离

标准距离的操作方法与标准差椭圆类似,不再赘述。

4.2.5 空间自相关(Moran’s I)

4.2.5.1 计算空间自相关

选择空间统计工具-分析模式-空间自相关。

选择输入的要素类、输入的字段等配置,点击确定。

4.2.5.2 查看计算结果

在菜单的“地理处理”中打开结果窗口。

发现有一个报表文件。

双击后,浏览器会打开报表。

4.2.6 核密度

4.2.6.1 加载Spatial Analysis扩展

在核密度分析前,需要打开Spatial Analysis扩展。在菜单“自定义”栏点击“扩展模块”。

勾选“Spatial Analysis”。

4.2.6.2 分析核密度

选择Spatial Analysis工具-密度分析-核密度分析。

设置输入、输出、权重等,点击“确定”。

完成后会生成核密度栅格数据。

为了让结果更清楚,我们调整符号系统。

将最低水平的填充色设置为无颜色。

4.2.7 多距离空间聚类分析

选择空间统计工具-分析模式-多距离空间聚类分析(Ripleys K函数)。

完成后会跳出函数图。