4.7 当前研究热点
目前,基于路网的空间关键词查询的热点包括但不限于以下三个方面。
(1) 基于路网的空间关键词查询的分布式处理在基于路网的空间关键词查询中,尽管路网数据本身的规模不会很大,但是城市空间文本数据的规模已经超出了大部分集中式处理模式的处理能力。为了提高基于路网的空间关键词查询处理的效率和扩展性,将查询处理分布化成为了一种很自然的选择[1,10] 。针对基于路网的空间关键词查询,图2展示了一种基于MapReduce的分布式处理架构。分布式处理不仅可以加快查询处理的速度,同时可以提高算法对大规模数据的可扩展性。
(2) 基于路网的组合空间关键词查询在某些情况下,用户希望能够查找同时满足多种需求的多个空间文本对象,并且要求这些空间对象之间的距离最小化。例如,用户希望查询同时包含超市、银行、电影院和理发店等多个对象,同时要求这些对象之间的距离较小。针对这种需求,出现了基于路网的组合空间关键词查询[1,8,19] 。由于组合结果的规模远远超出数据本身的规模,这类查询的复杂度非常高,需要长时间的计算才能得到准确的结果。为了满足实时查询的需要,现有的研究工作采用分布式计算或近似计算来加速查询,抑或通过大量的线下计算 (offline computation) 来降低查询时的计算量。
(3) 基于路网的倒转空间关键词查询在城市中,从商业的角度出发,在新增某项服务设施(如超市、4S 店和加油站)之前,需要考察周边的市场需求和可能存在的同业竞争。基于路网的倒转(Reverse)空间关键词查询[12,18]可以为这类考察分析提供很好的支持。基于路网的倒转空间关键词查询的目标是查找哪些对象的范围查询或者 top-k 查询中包含给定的查询对象。通过调整查询关键词,这种查询不仅可以查找潜在的用户需求,同时可以查询可能存在的竞争对手。