3.30 改革性成就
空间计算最开始的目标是支持地图和其他地理数据的计算表示和分析,它的影响集中在一些高度专业化的学科(通过表 1 中列出的专业组织表示)中。从那时起,一些改革性的空间计算技术被大量且深入地应用于社会中,帮助回答了人们经常会问到的多种问题。这里,我们简单描述一些具有重大意义和价值的应用和研究结果。如果读者想要更加深入了解空间计算,可以参考一些教科书[3,5,6,47,50] 、专题论文[45,48] 、百科全书 [16,53]和学术期刊[4] 。
全球定位系统(Global Positioning System)。我在地球表面的哪个地方?在 18 世纪,“经度问题” [55] 是最有挑战性的科学问题之一。由于没有能力测量经度,大航海时代的水手们在陆地离开视线之后马上就会在大海中迷失方向。最终,在罗盘、地图、星点定位和航海经线仪(在航行的船上工作的时钟)的帮助下,即使在大海中央没有任何地标时,也可以进行一定精度的定位。随着 1978 年GPS 的出现,并且随后放开给普通民众使用,使得人们在地球表面任何地方都可以进行快速且精确的定位。GPS 是基于空间 GNSS [24,27] 的一个应用,基于空间的 GNSS 提供了地球上任意地点的位置和时间信息,只要这些地点可以从四个或更多的导航卫星上畅通无阻的观察到[39] 。基于 GNSS 的精确计时使日常活动变得容易(例如计算机网络中的时钟同步,包括互联网),也使得地理分布式传感器网格监控移动物体(例如导弹、飞机、车辆以及地壳板块)变得简单,同时也便利了电力分布式网格。它的定位能力促使了许多面向终端用户的、基于位置服务的产生(例如逐向道路导航系统、本地搜索以及地理编码)。现今,GNSS 和与之相关的基于位置的服务被广泛地部署在商业、科学、追踪和监视领域,并且起到了十分重要的作用。GPS 系统成本低廉,而且它的超大规模集成电路(VLSI)实现可以很容易地集成到手机和平板电脑中,所以 GPS系统得到了广泛的使用。
遥感(Remote Sensing) [3] 。地球表面被森林覆盖的百分比是多少?近几十年中,面对气候变化、城市化以及人口增长,森林覆盖面积是怎样变化的?在过去,这些问题都是通过人工土地调查回答的,而这种调查方式是劳动密集型的,所以经常只能调查一小部分地区。但是现代遥感卫星可以持续地在全球范围内监控土地覆盖面积的变化[31] ,而且专门的仪器可以感知地下资源(例如含水层,以及木星最大的卫星木卫三上的一个地下海洋)。由于数据量庞大,在存储、查询,以及分析遥感数据集方面的计算技术变得至关重要。这些数据集同样也激发了计算的创新,比如谷歌地球引擎(Google EarthEngines) [43] 。
地 理 信 息 系 统(Geographic informationsystem)。朝鲜的导弹能够到达哪些国家?图 1 是在平面地图上利用距离计算得出了圆形的错误距离信息的一个著名例子。在没有地理信息系统 (GIS)球面测量工具的帮助下,这种错误很容易出现。GIS 熟悉大量普通的地理数据生产者使用的地图投影,并且帮助融合从多种数据源处获得的地图数据。因为地球不是一个完美的球体,所以 GIS 同样也能对地球进行更为精确的表示,包括椭圆表示和非参数表示,其中非参数表示指使用以地面为基地的测地参照点进行定位。GIS 可以采集、存储、分析、管理空间数据,以及对其进行可视化[22,53] 。比如,地球的示意图可以用一个平面上的弯曲面来表示。尽管地图投影大部分都保持拓扑性质(除了地图的
图 1 地理信息系统。2003 年《经济学家》杂志上的一篇文章严重低估了朝鲜导弹会到达的距离,因为它的地图没有计算地球的球体形状。正确的版本如图所示[9]边界),度量性质(例如距离和面积等)的保持依赖于所使用的投影。GIS 有一些独一无二的能力(例如制图、大地基准以及图层等),它也同样可以在几何学的基础上进行连接操作来支持空间查询和统计分析,这在接下来的两个段落中会提到。并且,GIS 从计算技术的发展(例如平面扫描算法等)和数据结构(例如与地图转译和地图着色相关的非规则三角网络等)中获益颇多。
空 间 数 据 库 管 理 系 统(Spatial databasemanagement systems)。斯隆数字巡天中包括寻找在 30 弧秒之内彼此相邻的星系对。全球变暖导致的海平面上升,暴雨以及春雪融化可能造成洪水泛滥,而哪些房屋更有可能被洪水淹没?在空间数据库发展之前,这种空间查询需要大量的编程工作;而且由于二维空间数据和一维数据类型(例如数字)的不匹配,以及传统数据库系统中使用的索引(例如B+树),这种空间查询所需要的计算时间比较长。另外,基于简单空间数据类型的数据集对于多级查询来说是不充分的,因为一些查询的结果(例如一组不相交的多边形的集合)不能被自然地表示为点、线或多边形。空间数据库(例如 Oracle Spatial 和PostGIS)引入了空间数据类型(例如 OGIS 简单特征)、数据操作(例如内部判断和距离计算等)、空间数据结构(例如 R 树和沃罗诺伊图(Voronoidiagram)等)和算法(例如最短距离、最近邻居和范围查询等)来表示,以及有效地回答多级并发的空间查询。简洁的编码形式使编程工作量大大减少,对查询的响应速度也更快。
空 间 统 计 学(Spatial statistics)。 硅 晶 片 的哪个部分会包含惊人的高缺陷率?某地是否爆发过疾病?具体在哪个地方? 1854 年,约翰·斯诺医生在伦敦的街道地图上手工绘制了霍乱发生的地点,以便在直观上可以辨认出布罗德街(BroadStreet)水泵附近疫情的高发地点(见图 2(a))。当时仅仅对一个小地区进行单一疾病的分析都需要花费几天时间。今天,公共健康机构通过空间统计测试来监控大面积地理区域上传染性疾病的得分,这种测试手段是为了检测疾病事件的爆发(例如扫描统计方法)和高发地点,以及将这些疾病事件从自然变异中区分出来。空间统计技术也被应用于公共安全(例如犯罪报道的高发地点)、大规模集成电路设计(例如硅晶片上缺陷频发部分)、天气预报(例如数据同化)、交通运输(例如交通事故高发地点)、挖掘(例如克里格 Kriging)、公共健康(例如癌症群体侦测)和农业领域(例如精细农业的管理分区设计以及农业普查的样本设计)中。空间统计原理(例如点过程、空间自相关以及地质统计学等)应对的是将传统统计模型应用于地理数据(例如线性回归、皮尔森相关系数)所独有的挑战(例如违反独立同分布假设等)。尽管空间统计技术比传统的统计技术在计算量和数据规模方面高一个数量级,近年来成本低廉的高性能计算和数据库技术(例如传感器、空间数据库管理系统以及 GIS 等)的不断发展,引起了对空间统计方法的广泛兴趣和采用[12] 。