真实世界是复杂和动态的,科学研究的大部分工作是实现对现实问题的形式化描述和建立模型。模型是以某种形式对一个系统的本质属性的描述,以揭示系统的功能、行为及其变化规律。模型是我们了解和探索客观世界的方便而高效的方法,它在客观世界和科学理论间架起一座桥梁,可以分析研究系统的各个侧面[ 1 ] 。
资源与环境信息系统中的各种应用数学模型直接关系到整个系统综合分析与解决实际问题的能力,是决定系统.
功能、水平和效益好坏的关键。这也是应用系统最具特色的地方,如遥感估产中有玉米、小麦和水稻的长势模型和空间分布模型,自然灾害中有洪水、林火和旱情等监测与评估模型,而国土资源与地区经济信息系统中则包括区位与空间结构、预测优化和决策与评价模型。
数学模型作为系统抽象和简化的模拟,存在着对真实系统的逼近误差,在实际工作中,又受到数据量的限制。建模方法和数据采集过程中的误差,都会使模型解算误差积累放大。常用的模型检验方法有: ①数学检验方法,也就是通过一些检验指标的计算来判断模型质量,例如统计检验指标:或者从数学上加以证明,例如模型计算的稳定性问题。通过这些检验可以证明模型计算的可靠程度和建模方法选用的适用性程度。②定性研究方法,在定性研究中,已积累了许多专业方面的知识和众多专家多年实际工作中的经验,这些知识和经验具有相当强的判断能力。因而对定量计算的结果有必要做出定性方面的判断,便于和专家进行对话,以吸取专家的知识和经验[ 2 ] 。
网络通信技术的发展为知识获取创建了更便利的技术条件。随着分布式空间决策支持系统的迅速发展,人们很自然地希望在更高的决策层次和更复杂的决策环境得到计算机的支持,这种支持面向的对象已不仅仅限于单个的决策人,而是若干具有一定独立性又存在某种联系的决策组织。决策过程必需的信息资源、决策支持模型或某些重要的决策因素分散在较大的活动范围。分布决策不仅要求共享数据,还要求模型方法的共享,以使决策者能够理解同行相关的决策过程。但分布式决策系统目前的研究较集中于研究各决策者之间的协调,而忽视了决策方法的共享。
不同的决策者对同一客观事物会有不同思路和方法的抽象,对模型解算误差的阈值设置也未必一致,因此应要求决策者提供模型的详尽说明。此外,作为对资源与环境客观现实世界抽象描述的应用模型都有其侧重面,通过模型方法元数据用户可充分了解模型的覆盖范围和局限胜、并恰当估价其对特定应用目的的适用性。
目前,资源与环境信息的标准化和元数据已有相当的研究[ 3~6 ] ,而随着资源与环境应用模型研究的深入,人们亦迫切需要对模型方法进行全面、详尽和标准化的描述[ 7 ,8 ] 。使不同背景不同目标的用户能够共享模型方法。
综合上述,方法元数据的作用可以归纳为: ①积累专业模型知识。人类对客观世界的认识总是递进的,详细的方法元数据可以记录人们认识客观世界的知识,免去相关研究者四处搜寻之苦。 ②帮助用户了解模型的能力和限度。没有模型方法元数据,他人实际上是无法有效使用这些模型的。 ③为知识共享提供信息。一个机构或一个人往往只擅长一个方面的工作,通过方法元数据可以为知识共享开辟途径。
2 应用模型方法元数据标准框架
模型方法的元数据是关于模型的描述信息。它说明方法要解决的问题、适用范围、方法的思路与实现以及方法对输入/ 输出数据的要求和格式。对于象小麦单产模型、洪水模型等专业应用模型,如果没有对模型的说明,其他用户不易确认模型的输出,虽然也可以把模型当作黑箱,但是把模型原理说清楚有利于知识共享。这个问题历来所受重视不够,也未制定过相应的标准,这是我们讨论方法元数据标准应当包含的内容。
211 方法元数据组成
同数据元数据一样,方法元数据也服务于不同层次的用户。根据资源与环境模型的使用,将方法元数据分成二个层次(如图1 所示) ,其一是基本集,服务于非本研究方向的数据处理用户和模型库管理人员,它着重从功能和运用角度描述模型;其二是扩展集,服务于本研究方向的研究者,它着重从原理和实现的角度描述模型;显然扩展集涵盖基本集。方法元数据不同于数据元数据,从计算的角度上说,方法元数据是对数据处理过程的描述,这必然涉及较多的专业术语,同时非结构化的程度更强,应当在描述的简洁性和易理解性间达到平衡。
方法元数据
基本集
标识信息适应领域模型参数运行条件管理信息
扩展集
性能原理模型实现
方法元数据标准体系框架包含资源与环境模型方法元数据标准应当从以下8 个方面描述模型: ①标识信息, ②适用领域, ③模型参数, ④运行条件, ⑤性能, ⑥原理, ⑦模型实现, ⑧管理信息。其①②③④⑧构成基本集。⑤⑥⑦是扩充信息。