基于R树索引的点面关系判断以及效率优化统计

文章版权由作者李晓晖和博客园共有，若转载请于明显处标明出处：http://www.cnblogs.com/naaoveGIS/

1.背景

在之前的博客中，我分别介绍了基于网格的空间索引（http://www.cnblogs.com/naaoveGIS/p/5148185.html）以及四叉树和网格结合的联合索引（http://www.cnblogs.com/naaoveGIS/p/6641449.html），要解决的问题均是判断一个点落在了面图层中的哪个面要素中。单从算法层面上分析，以上两种索引均有一些弊端：

a.网格索引由于对整个空间进行网格划分，如果划分粒度太细容易出现索引冗余，如果划分粒度太大则索引效率又大幅度下降。

b.四叉树索引同样存在一个图元标识被多个区域所关联，相应地存储在多个叶子节点上，这样就存在索引的冗余，与网格索引存在同样的弊端。

为进一步优化索引，我们决定采用R树来进行优化。

2.R树介绍

R树主要运用空间分割的理念，即采用MBR(Minimal Bounding Rectangle，最小边界矩形)的方法，从叶子结点开始用矩形（rectangle）将空间框起来，结点越往上，框住的空间就越大，以此对空间进行分割：

所有的原始空间要素均是叶节点，这样便不会出现如四叉树索引和网格索引中出现的空间要素被多个索引段指引，进而出现大量冗余索引的问题。

3.基于JTS的具体实现

JTS中提供了构建索引的方法，其可以构建四叉树索引、R树索引、KD索引等。这里，我们直接使用JTS来构建R树索引。

JTS的介绍：https://en.wikipedia.org/wiki/JTS_Topology_Suite

JTS的源码下载：https://sourceforge.net/projects/jts-topo-suite/?source=navbar

3.1R树的构建

利用GT读取到本地的SHP，获取到所有的要素集，然后遍历要素将envelope和要素信息一一插入至StrTree中，构建R树：

3.2基于R树的查询

将查询的空间条件构造成一个Envelope在R树中查询，对查询出来的结果再次进行点面关系判断：

4.优化

在我们之前的两种索引方法中，我们均将索引文件保存到了本地，每次调用时去加载索引，如此IO是一个很大的瓶颈。现在我们创建一个容器，将StrTree保存至该容器中。查询时，直接从内存中获取到该树。

5.效率对比

5.1查询效率对比

在测试数据中选中一个特殊点（多个多边形的交接处）：

分别对使用的三种索引进行了性能对比：

a.本地网格索引：

b.本地混合索引（四叉树与网格索引整合）：

c.内存R树索引:

可见查询效率快了一倍左右。

5.2索引构建效率对比

样本数据有2000多个面要素，之前的两种索引均使用本地工具构建，时间大约是1S上下（没有具体统计）。现在使用JTS构建R树索引，效率为：

5.3占用的内存效率

此索引的优化中，我们将数据全部存入了内存。这里必须观察内存的占用量有多大。

一般监控内存有两种方式，通过工具查看或者代码段编写。代码段编写可以通过应用SizeOf.jar实现，工具查看可以通过jvisualvm实现：

原始的本地SHP数据大小为：3.8M。

网格索引大小为：4.4M。

混合索引文件的大小为：8.4M。

而读入内存中的R树索引的大小为：4.3M。

由于我们存储了要素所包含的所有信息，理论上，如果我们将存储信息进一步减少，内存占用会更小。目前来看，SHP数据本身的大小，会跟存入内存的信息大小有直接关系。

6.总结

目前索引方式任然有几点不足：

a.索引构建中的要素获取方式为本地SHP读取，需要扩展成对第三方服务数据的支持。

b.当R数查询命中只有一个要素时，因为最小矩形的范围是大于等于实际要素范围的，所以还要进行一次点面判断。如此，当图层要素个数本身不多时，建立索引不一定可以加速。

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　-----欢迎转载，但保留版权，请于明显处标明出处：http://www.cnblogs.com/naaoveGIS/

　　　　如果您觉得本文确实帮助了您，可以微信扫一扫，进行小额的打赏和鼓励，谢谢 ^_^

　　　　　　　　　　　　　　　　

时间： 2024-09-21 01:48:35

基于R树索引的点面关系判断以及效率优化统计的相关文章

源代码-关于C语言编程中R树索引的问题

问题描述关于C语言编程中R树索引的问题求教有没有大神知道R树索引如何建立.删除.插入等,急需一份源代码参考学习.谢谢啊,好人一生平安... 解决方案 http://www.cnblogs.com/javaspring/archive/2012/08/14/2656223.html

基于KD树和R树的多维云数据索引

基于KD树和R树的多维云数据索引何婧吴跃杨帆尹春雷周维针对云存储系统大多基于键值对key,value模型存储数据,多维查询需要对整个数据集进行完全扫描,查询效率较低的问题,提出了一种基于KD树和R树的多维索引结构(简称KD-R索引).KD-R索引采用双层索引模式,在全局服务器建立基于KD树的多维全局索引,在局部数据节点构建R树多维本地索引.基于性能损耗模型,选取索引代价较小的R树节点发布到全局KD树,从而优化多维查询性能.实验结果表明:与全局分布式R树索引相比,KD-R索引能够有效提

从B树、B+树、B*树谈到R树

转自:http://blog.csdn.net/v_JULY_v/article/details/6530142/ 作者:July.weedge.Frankie.编程艺术室出品. 说明:本文从B树开始谈起,然后论述B+树.B*树,最后谈到R 树.其中B树.B+树及B*树部分由weedge完成,R 树部分由Frankie完成,全文最终由July统稿修订完成. 出处:http://blog.csdn.net/v_JULY_v . 第一节.B树.B+树.B*树 1.前言: 动态查找树主要有:二叉查

MySQL的B+树索引

本文讨论MySQL支持的索引类型及其优缺点.要注意的是:在MySQL中,索引是在存储引擎层而不是服务器层实现,所以不同存储引擎的索引的工作方式并不一样,也不是所有的存储引擎都支持所有类型的索引. B+树是一种经典的数据结构,由平衡树和二叉查找树结合产生,它是为磁盘或其它直接存取辅助设备而设计的一种平衡查找树,在B+树中,所有的记录节点都是按键值大小顺序存放在同一层的叶节点中,叶节点间用指针相连,构成双向循环链表,非叶节点(根节点.枝节点)只存放键值,不存放实际数据.下面看一个2 层B+树的

FAQ系列 | B+树索引和哈希索引的区别

导读在MySQL里常用的索引数据结构有B+树索引和哈希索引两种,我们来看下这两种索引数据结构的区别及其不同的应用建议. 二者区别备注:先说下,在MySQL文档里,实际上是把B+树索引写成了BTREE,例如像下面这样的写法: CREATE TABLE t( aid int unsigned not null auto_increment, userid int unsigned not null default 0, username varchar(20) not null default

使用索引的误区之三：基于函数的索引

函数|索引使用索引的误区之三:基于函数的索引使用基于函数的索引(BFI, Based Function Index): 从Oracle 8i开始,可以使用基于函数的索引来提高查询性能, 使用基于函数的索引,需要几个条件: 1, 用户需要有create index或者create any index权限 2, 用户需要有query rewrite或者global query rewirte权限 3, 设置系统参数 query_rewrite_enabled=TRUE 和 query_r

oracle的B树索引详解

虽然一级或两级索引通常有助于加快查询,但在商用系统中常使用一种更通用的结构.这一通用的数据结构簇称为B树,而最常使用的变体称为B+树.实质上: B树能自动地保持与数据文件大小相适应的索引层次. 对所使用的存储块空间进行管理,使每个块的充满程度在半满与全满之间.这样的索引不再需要溢出块. 在接下来的内容中,我们将讨论"B树",但具体细节都针对B+树这一变体.其他类型的B树在习题中讨论. 1.B树的结构正如其名称所暗示的那样,B树把它的存储块组织成一棵树.这棵树是平衡的,即从树根到树叶的

数据库-Oracle中重复率很高的字段创建B树索引，为什么性能可以得到大幅提升

问题描述 Oracle中重复率很高的字段创建B树索引,为什么性能可以得到大幅提升请教一个让我不解的问题: 我有一张表TT,数据大概是240W,其中的一个字段COL1的值只有'0'和'1'两个.现在有如下查询:SELECT COL2,SUM(NVL(COL3,0) * nvl(COL4,0)) FROM TT WHERE COL1 = '0' GROUP BY COL2; 在查询耗时大概是 50s. 为了提高性能,在TT表的COL1字段上创建了位图索引,查询耗时变为 2s 但是由于我需要对TT表

《高并发Oracle数据库系统的架构与设计》一第2章高效B树索引

第2章高效B树索引本章要点: 索引扫描识别,介绍索引的基本概念及展开讨论各种索引的扫描方式. 索引与排序,介绍索引在排序过程中的作用和意义. 索引设计优化,深入解析索引设计的方法技巧,以及设计索引的影响因素. 索引分裂,深入剖析索引树分裂生长原理及因此带来的问题和解决方法. 索引维护,围绕索引重建探讨索引后期维护的方法. 众所周知,索引不论在数据库设计过程中,还是在应用程序开发过程中都是一个至关重要的方面.索引的使用正确与否直接影响到应用程序的性能,并且它是贯穿于设计.开发.运维的各个阶段的

猜你喜欢

unix-Solaris 10 写一个脚本，在atc用户下，调用该脚本，执行poweroff命令

问题描述 Solaris 10 写一个脚本,在atc用户下,调用该脚本,执行poweroff命令 Solaris 10 写一个脚本,在atc用户下,调用该脚本,执行poweroff命令解决方案实现 ...

如何优化Flash动画，使文件更小，播放更流畅？

flash动画|优化 Flash作为Macromedia公司出品的网页制作与动画创作的专业软件,操作简便,功能强大,现已成为交互式矢量图形和Web动画事实上的标准. 但是,如果制作的Flash电影文件 ...

一个16岁少年的seo之路

本人今天16岁了,从10年9月份接触seo已经四个多月了,可以说seo的技术非常的菜,写这篇文章说白了,就是想要获得更多的外链,从而让网站排名上升!呵呵,相信大部分在站长网上发布文章的人都和我有一样的 ...

Robots.txt编写似雷区稍有不慎“毒害甚深”（一）

每个人都有自己的隐私,网站也是这样,网站中也有不希望被蜘蛛看到的东西,比如会员密码等等,而想要遮挡住这部分隐私,一般情况下站长都会在第一时间想到Robots.txt.没错,Robots.txt文件的使 ...

胡佩彬：解析决定网站关键词排名的四大因素

相信很多朋友都遇到这种问题每天都在坚持做优化的工作,做了一段时间排名就是不上去,下面就由IDSEM成员胡佩彬来解析几点第一:网站的内容更新这个相信大家都知道网站要更新,但是很多人都认为不就是更新文 ...

python学习笔记第二章：安装python

记得上次写python的学习笔记是三个月以前了,期间看过,也放下过,这次要坚持下来,一鼓作气,吃下python. 本文内容主要是根据<Python 简明教程>和自己的一些理解去写的,有问题 ...

在Word 2010中启用或禁用Office加载项

Office加载项是Office程序为了完成某种功能而需要在启动程序时自动加载的模块,例如书法字帖功能.稿纸功能.制作信封功能等.用户可以根据工作需要启用或禁用Office加载项,以提高Office ...

UI入门实例做一个个性的播放器

今天在网上看到了一个播放器的实例教程,感觉很不错,很适合UI入门新手练习,发来给大家看看,一起学习啊,好了废话不说了,开始学习吧: 最终效果图 1.新建一个文件,图象大小设置为200X200象素,72 ...

让你的Visual Studio 2010 支持HTML5 和 CSS3

现在的热门话题之一是HTML5 和 CSS3.好的, 它们都很时髦,它们也必然会影响网络开发的未来. 让我们尝尝鲜,花点时间安装设置一下,尽快让Visual Studio2010支持HTML5 和 C ...

ace reactor-一个进程如何使用2个reactor实例？

问题描述一个进程如何使用2个reactor实例? if( -1 == acceptor_.open(addr_) ) //接受器 { ACE_ERROR((LM_ERROR,"Accept ...

iOS头部渐变的表格视图设计

iOS头部渐变的表格视图设计今天再来给大家带来一个开发中常用到的视图控制器,在很多应用中,可能都会遇到这样的一个需求:表视图控制器最上方有一个头图控件,当表格视图滑动在顶部时,导航栏 ...

通讯录-用Gson解析出来的json数据怎样在界面上显示出来

问题描述用Gson解析出来的json数据怎样在界面上显示出来想做一个类似于通信录的东西,现在能从服务器请求数据并解析出来,但是不清楚怎么把解析出来的数据显示在界面上,,每次请求返回来的联系人的数目 ...

[Docker系列·9] 复制Docker镜像

[Left side]docker save nano copyall.sh sudo /usr/local/bin/docker save -o sinopia.tar feuyeux/ubuntu ...

ireport table组件

问题描述我在ireportdetail组件中嵌套了table组件预览后无法正常显示,但是在summary中却可以正常显示,怎么回事?怎么设置一页显示的数据条数?有用过的请指导?同时,谁可以提供一些相 ...

全球最年轻亿万富翁称号被24岁美国人摘得：斯坦福大学高材生

导读:近日获悉,Snapchat创始人艾文斯皮格尔取代创办Facebook的马克扎克伯格成为全球最年轻亿万富翁,年仅24岁,净资产已达到15亿美元.长江后浪推前浪,在疯狂捞金的同时,高净值人士如何配 ...

台湾小米致歉称将修正开放购买机制

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅小米公司通过官方微博道歉. 新浪科 ...

[CLR via C#]1.4 执行程序集的代码

原文:[CLR via C#]1.4 执行程序集的代码 1. 托管程序集同时包含元数据和IL.IL是与CPU无关的机器语言.可将IL是为一种面向对象的机器语言. 2. IL也是能使用汇编语言来写的,M ...

掌握这五大技能，你也可以去应聘数据分析师

数据分析的目的是把隐没在一大批看来杂乱无章的数据中的信息集中.萃取和提炼出来,以找出所研究对象的内在规律.几年前, 数据分析还是一个比较鲜见的职业.而今天,无论各行各业,它无处不在的闪烁着耀人的光芒. ...

launcher-No Launcher activity found 解决方案好像没用

问题描述 No Launcher activity found 解决方案好像没用 <?xml version="1.0" encoding="UTF-8" ...

文化部在其官方网站——文化市场网发布公告宣称

文化部在其官方网站--文化市场网发布公告宣称,已经向零度聚阵文化有限公司.北京中录时空文化发展有限公司.北京瑞得在线信息技术有限公司和中电华通通信有限公司共4家公司下发了网吧新政颁布后的首批<全 ...

与 Linux 一起学习：学习地理

与 Linux 一起学习:学习地理 "与 Linux 一起学习"的所有文章: 与 Linux 一起学习:学习打字与 Linux 一起学习:学习物理与 Linux 一起学习:学习 ...

金融大数据公司量化派宣布完成5亿元C轮融资

金融大数据公司量化派(QuantGroup)今日正式宣布完成C轮5亿元融资.本轮由阳光保险领投,复星集团旗下PE基金复星创富以及国信弘盛(国信证券旗下)进行跟投,此外赛点资本也参与了量化派的本次C轮融 ...

2016 软件开发的七大趋势：容器技术将统治世界

岁月如割,2016距离我们只有几个"双xx"购物节之遥,对于"开发狗"来说,如死亡丛林飞跃般的练级之旅注定颠沛流离,命运多舛.是时候抬头看路了,下面我们为大家大 ...

《jQuery Mobile快速入门》—— 2.4　转换

2.4 转换 jQuery Mobile快速入门在页面之间进行转换时,jQuery Mobile有6个可供选择的基于CSS的转换效果.默认情况下,框架会为所有的转换应用"滑动"效 ...

Android开发技巧之我的菜单我做主(自定义菜单)_Android

Android SDK本身提供了一种默认创建菜单的机制.但通过这种机制创建的菜单虽然从功能上很完备,但在界面效果上实在是有点"土".对于一个拥有绚丽界面的程序配上一个有点 ...

Linux查看物理CPU个数、核数、逻辑CPU个数

(一)概念 ① 物理CPU 实际Server中插槽上的CPU个数物理cpu数量,可以数不重复的 physical id 有几个 ② 逻辑CPU /proc/cpuinfo 用来存储cpu硬件信息的 ...

求救跪求原因各位

问题描述我想利用Hibernate的级联关系在主表大类内删除数据的同时子表次类表和物品表(物品表的子表为品牌表)的整条数据也删除出关系映射的配置大类表:<setname="small ...

十分钟理解Java中的动态代理_java

若代理类在程序运行前就已经存在,那么这种代理方式被成为静态代理 ,这种情况下的代理类通常都是我们在Java代码中定义的. 通常情况下, 静态代理中的代理类和委托类会实现同一接口或是派生自相同的父类. ...

Loading，让烦躁少一些

前一阵子,接到一个app切图制作加载圆形进度条的任务,看到那个小进度条转啊转的,我若有所思-同时,一个做印象派制作间控件设计的同学最近做了改版,那个控件登陆需要一些时间,看到他对loading加载条进 ...

struct-如何解决C语言给结构体当中的数组分配堆空间的问题

问题描述如何解决C语言给结构体当中的数组分配堆空间的问题 #include #include struct A{ int num[3]; }; int main() { int i,j; struc ...

热搜

© 2024 iVAN | info#iamivan.net | 12 q. 0.030 s.