元数据初步探索

真实世界是复杂和动态的,科学研究的大部分工作是实现对现实问题的形式化描述和建立模型。模型是以某种形式对一个系统的本质属性的描述,以揭示系统的功能、行为及其变化规律。模型是我们了解和探索客观世界的方便而高效的方法,它在客观世界和科学理论间架起一座桥梁,可以分析研究系统的各个侧面[ 1 ] 。

资源与环境信息系统中的各种应用数学模型直接关系到整个系统综合分析与解决实际问题的能力,是决定系统.

功能、水平和效益好坏的关键。这也是应用系统最具特色的地方,如遥感估产中有玉米、小麦和水稻的长势模型和空间分布模型,自然灾害中有洪水、林火和旱情等监测与评估模型,而国土资源与地区经济信息系统中则包括区位与空间结构、预测优化和决策与评价模型。

数学模型作为系统抽象和简化的模拟,存在着对真实系统的逼近误差,在实际工作中,又受到数据量的限制。建模方法和数据采集过程中的误差,都会使模型解算误差积累放大。常用的模型检验方法有: ①数学检验方法,也就是通过一些检验指标的计算来判断模型质量,例如统计检验指标:或者从数学上加以证明,例如模型计算的稳定性问题。通过这些检验可以证明模型计算的可靠程度和建模方法选用的适用性程度。②定性研究方法,在定性研究中,已积累了许多专业方面的知识和众多专家多年实际工作中的经验,这些知识和经验具有相当强的判断能力。因而对定量计算的结果有必要做出定性方面的判断,便于和专家进行对话,以吸取专家的知识和经验[ 2 ] 。

网络通信技术的发展为知识获取创建了更便利的技术条件。随着分布式空间决策支持系统的迅速发展,人们很自然地希望在更高的决策层次和更复杂的决策环境得到计算机的支持,这种支持面向的对象已不仅仅限于单个的决策人,而是若干具有一定独立性又存在某种联系的决策组织。决策过程必需的信息资源、决策支持模型或某些重要的决策因素分散在较大的活动范围。分布决策不仅要求共享数据,还要求模型方法的共享,以使决策者能够理解同行相关的决策过程。但分布式决策系统目前的研究较集中于研究各决策者之间的协调,而忽视了决策方法的共享。

不同的决策者对同一客观事物会有不同思路和方法的抽象,对模型解算误差的阈值设置也未必一致,因此应要求决策者提供模型的详尽说明。此外,作为对资源与环境客观现实世界抽象描述的应用模型都有其侧重面,通过模型方法元数据用户可充分了解模型的覆盖范围和局限胜、并恰当估价其对特定应用目的的适用性。

目前,资源与环境信息的标准化和元数据已有相当的研究[ 3~6 ] ,而随着资源与环境应用模型研究的深入,人们亦迫切需要对模型方法进行全面、详尽和标准化的描述[ 7 ,8 ] 。使不同背景不同目标的用户能够共享模型方法。

综合上述,方法元数据的作用可以归纳为:  ①积累专业模型知识。人类对客观世界的认识总是递进的,详细的方法元数据可以记录人们认识客观世界的知识,免去相关研究者四处搜寻之苦。 ②帮助用户了解模型的能力和限度。没有模型方法元数据,他人实际上是无法有效使用这些模型的。 ③为知识共享提供信息。一个机构或一个人往往只擅长一个方面的工作,通过方法元数据可以为知识共享开辟途径。

2  应用模型方法元数据标准框架

模型方法的元数据是关于模型的描述信息。它说明方法要解决的问题、适用范围、方法的思路与实现以及方法对输入/ 输出数据的要求和格式。对于象小麦单产模型、洪水模型等专业应用模型,如果没有对模型的说明,其他用户不易确认模型的输出,虽然也可以把模型当作黑箱,但是把模型原理说清楚有利于知识共享。这个问题历来所受重视不够,也未制定过相应的标准,这是我们讨论方法元数据标准应当包含的内容。

211  方法元数据组成

同数据元数据一样,方法元数据也服务于不同层次的用户。根据资源与环境模型的使用,将方法元数据分成二个层次(如图1 所示) ,其一是基本集,服务于非本研究方向的数据处理用户和模型库管理人员,它着重从功能和运用角度描述模型;其二是扩展集,服务于本研究方向的研究者,它着重从原理和实现的角度描述模型;显然扩展集涵盖基本集。方法元数据不同于数据元数据,从计算的角度上说,方法元数据是对数据处理过程的描述,这必然涉及较多的专业术语,同时非结构化的程度更强,应当在描述的简洁性和易理解性间达到平衡。

方法元数据

基本集

标识信息适应领域模型参数运行条件管理信息

扩展集

性能原理模型实现

方法元数据标准体系框架包含资源与环境模型方法元数据标准应当从以下8 个方面描述模型: ①标识信息, ②适用领域, ③模型参数, ④运行条件, ⑤性能, ⑥原理, ⑦模型实现, ⑧管理信息。其①②③④⑧构成基本集。⑤⑥⑦是扩充信息。

时间: 2025-01-25 00:44:37

元数据初步探索的相关文章

SNS领域的初步探索:非流失用户及流失用户的相关模型

文章描述:用户研究思路概述:以淘宝网SNS"分享"为例. 事发突然: 今年8月份,发神经般的在微博上点开了一个广告链接,发现某美妆品牌的东西性价比很高,于是成功购买.这是我在SNS的网站上达成的第一笔交易,拿到钟爱的护肤品,突然发现:我居然没有在"我的淘宝"的"好友动态"里点击过别人分享的东西,更别提购买了.于是,有了这次的研究. 一.立项: 基于以上想法,本打算研究SNS用户习惯及动机(没有限定在淘宝网),希望能通过照片日志(Photo Dai

NHibernate之旅(7):初步探索NHibernate中的并发控制

本节内容 什么是并发控制? 悲观并发控制(Pessimistic Concurrency) 乐观并发控制(Optimistic Concurrency) NHibernate支持乐观并发控制 实例分析 结语 什么是并发控制? 当许多人试图同时修改数据库中的数据时,必须实现一个控制系统,使一个人所做的修改不会对他人所做的修改产生负面影响.这称为并发控制. 简单的理解就是2个或多个用者同时编辑相同的数据.这里的用者可能是:实际用户.不同服务.不同的代码段(使用多线程),及其在断开式和连接式情况下可能

网页编程中编程乱码问题初步探索

乱码的问题分为很多种,很多人一见到有乱码就开始骂mysql,其实很多情况下并不是mysql造成的. 从乱码产生的原因来分析,乱码的产生一般有以下几种情况. 1.网页编码与程序编码不一致的问题 所谓的网页编码问题就是指你的html代码中定义的"charset",例如以下这段代码: <head> <title>Chat Tutorial Application</title> <meta http-equiv="Content-Type&

中国城市低碳发展尚处探索阶段

申里 气候组织日前在气候领袖峰会中国日上发布<中国清洁革命报告:城市>,从中国城市低碳发展的动力.发展基础.路径.重点发展领域及挑战方面,观察分析了中国省市低碳发展的不同路径尝试及其进程.报告也借鉴了国际低碳城市发展的经验,对中国城市下一步低碳发展提出了建议. 报告显示,受城市气候安全.减排责任.经济转型等内因驱动,以及国际社会应对气候变化的谈判和行动.国内政府对低碳经济理念的认同.企业低碳解决方案的推广及学术机构"低碳城市项目"的研究实践等外部因素影响,从2008年初一些

数加平台——阿里大数据OS实践

在云栖计算之旅第5期--大数据与人工智能大会上,阿里云大数据事业部数加平台技术负责人陈廷梁从数加定义.起源.愿景.价值.架构.规划六个方面分享了<数加平台--阿里大数据OS实践>.其中,他主要介绍了数加平台的演进过程和阿里大数据OS的架构.   以下内容根据视频整理而成.   视频回顾:点此进入 pdf下载:点此进入   数加是什么 在阿里云的官网打开大数据部分(整个大数据部分统称为数加),其中包括:大数据基础服务部分,MaxCompute.ADS.流计算.大数据开发套件:人工智能部分,机器学

千万级的 H5 情感营销如何做?

  随着互联网 + 时代的到来,碎片化的信息传递方式使得一些品牌很难能在用户的脑海中留下强有力的记忆点,品牌传播也很难与用户产生共鸣,更无法吸引他们参与到品牌的二次传播中来.而最近由赞意互动为腾讯 QQ 物联.全国一线企业联合发起的「全民开蓝牙」,守护宝贝计划公益行动,用情感营销的方式,使得该次传播覆盖超过 4 千 5 百万人,并成功获得 469 万多名志愿者的支持,成为营销案例中的又一经典之作. 「儿童走失」在我国长期以来都是一个严重的问题,据不完全统计,每年都有将近 20 万的儿童走失,然而

用XML实现弹出式菜单

xml|菜单   XML已经成为了新一代网络计算的世界语,这一点已经在各大软件公司的产品中逐步体现出来.XML本身并不是一种计算语言,而更多表现为一种数据描述的格式.相对于HTML,它更多具有数据定义的特性,而相对于数据库,它又更加灵活和适于在网络上传输.围绕XML的相关技术也层出不穷,如XSL, XSLT等,它们的配合让我们能够真正在XML上开始完成一些有趣的任务. <?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:of

NHibernate之旅(20):再探SchemaExport工具使用

本节内容 引入 实例分析 1.表及其约束 2.存储过程.视图 结语 引入 上篇我们初步探索了SchemaExport工具使用,知道如何使用SchemaExport工具和SchemaUpdate工具利用NHibernate持久化类和映射文件删除.创建.更新数据库架构,这篇具体分析如何为表字段增加一些约束?如何生成存储过程?如何生成视图?使用SchemaExport工具帮你搞定. 实例分析1.表及其约束 众所周知,SchemaExport工具根据映射文件来生成数据库架构,在映射文件中通过Class映

NHibernate之旅(12):初探延迟加载机制

节内容 引入 延迟加载 实例分析 1.一对多关系实例 2.多对多关系实例 结语 引入 通过前面文章的分析,我们知道了如何使用NHibernate,比如CRUD操作.事务.一对多.多对多映射等问题,这篇我们初步探索NHibernate中的加载机制. 在讨论之前,我们看看我们使用的数据模型,回顾一下第二篇建立的数据模型. Customer与Orders是一对多关系,Order与Product是多对多关系.这一篇还是使用这个模型,有关具体配置和映射参考本系列的文章. 延迟加载(Lazy Loading