什么是元数据(Meta Date)

      在读《Web信息架构》的时候第九章讲到叙词表、受控词表和元数据。当时书中的定义很模糊,所讲的篇幅也少,就没有在意,一直也没有能完全理解。今天在读《锦绣蓝图》的时候第四章中再次提到元数据这个概念。遂多查了些资料认真的理解了一下。

什么是元数据?

       元数据(Meta Date),关于数据的数据或者叫做用来描述数据的数据或者叫做信息的信息。
       这些定义都很是抽象,我们可以把元数据简单的理解成,最小的数据单位。元数据可以为数据说明其元素或属性(名称、大小、数据类型、等),或其结构(长度、字段、数据列),或其相关数据(位于何处、如何联系、拥有者)。

       举几个简单的例子:
       使用过数码相机的同学都应该知道,每张数码照片都会存在一个EXIF信息。它就是一种用来描述数码图片的元数据。根据EXIF标准,这些元数据包括:Image Description(图像描述、来源. 指生成图像的工具 )、Artist(作者)、Make( 生产者)、Model (型号)、….、等等。
       生活中我们填写的《个人信息登记表》,包括姓名、性别、民族、政治面貌、一寸照片、学历、职称等等这些就是锁定kent.zhu这个人的元数据。

       通常情况下元数据可以分为以下三类:固有性元数据、管理性元数据、描述性元数据
        固有性元数据;与事物构成有关的元数据。
        管理性元数据;与事物处理方式有关的元数据。
        描述性元数据;与事物本质有关的元数据。
        当然,并不是说所数据总能清晰的划分在以上3类中。比如:一张由kent拍摄的大小为20K的JPG格式的印着一只小狗的圣诞卡照片。
      它的固有性元数据包括:20K、JPG;管理性元数据:kent拍摄、圣诞卡;描述性元数据:狗、小狗、圣诞、照片、圣诞节、…
      但是,圣诞卡则可以放在以上任何一个分类中。与事物构成有关(说明这个东东是什么)、与事物处理方式有关(说明这个东东的用途是什么)、与事物本质有关(可以直接用来描述这个东东)。

元数据之于信息架构的意义

      元数据是一种很有效的方法,用以确保网站上各种形式的内容确实都能被查找到。比如我们常常为搜索很久之前看到的一张美女图片犯愁,而如果一个图片网站如果信息架构足够好,我们就能凭借我们回忆到的元数据(关于武藤兰的?2000年拍摄的?)清晰的找到。
      元数据之于信息架构就像是房子的砖瓦,它可以根据需要摆放成不同的信息检索系统。元数据是所有组织系统的基础,从搜索到电子商务网站上的导航系统都强烈的依赖于元数据。
       前面提到,元数据实际上是为产品的可查找性(Findability)服务的。而用户在查找信息的时候不会按照机器思维去找(不会输入该照片的ID),而是直接输入关于信息的描述性信息如:“小狗 圣诞卡”。也就意味着在创建关于描述性元数据的时候要尽量的提取出任官关于这个对象所讲述的故事,这些才是人们能记住的和习惯搜索的细节。

        我们会发现,机械生成的元数据常常是不靠谱的,如在UCH系统下发布日志的时候系统会自动根据标题进行机械分析生成的一些元数据。
        而充分利用手工元数据(handcrafted metadate)是提高可查找性的一个好方法。最常见的例子就是我们见到的Tag。Tag就是一种用户自创的元数据,其特点是无层次结构、自定义。比如这张Flickr照片下的手工元数据就为在Flickr上查找提供了更多的方便。

时间: 2025-01-31 01:50:29

什么是元数据(Meta Date)的相关文章

jmf怎么获取音频文件的元数据meta呢?

问题描述 我获取一个player对象后,怎么没有相关获取元数据的一些api呢?请问获取这些信息是哪个对象才有这些方法?如果jmf不能获取请问换用ffmpeg如何获取呢,我搜了n久,-author等参数只能设置,-i只能返回一些码率之类的.但我想获取音频文件里的title.author等信息. 解决方案

网站数据仓库的基本架构分析探讨

中介交易 SEO诊断 淘宝客 云主机 技术大厅 数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support).其实数据仓库本身并不"生产"任何数据,同时自身也不需要"消费"任何的数据,数据来源于外部,并且开放给外部应用,这也是为什么叫"仓库",而不叫"工厂"的原因.因此数据仓库的基本架构主要包含的是数据流入流出的过程,可以分为三层--源数据.数据仓库.数据应用: 从图中可以看出数据仓库的

艾伟:WCF从理论到实践(5):Binding细解

本系列文章导航 WCF从理论到实践(1):揭开神秘面纱 WCF从理论到实践(2):决战紫禁之巅 WCF从理论到实践(3):八号当铺之黑色契约 WCF从理论到实践(4):路在何方 WCF从理论到实践(5):Binding细解 WCF从理论到实践(6):WCF架构 WCF从理论到实践(7):消息交换模式 WCF从理论到实践(8):事件广播 WCF从理论到实践(9):实例模式和对象生命周期 WCF从理论到实践(10):异常处理 WCF从理论到实践(11)-异步 WCF从理论到实践(12):事务 WCF

JDK5.0的11个主要新特征

1  泛型(Generic) 1.1 说明 增强了java的类型安全,可以在编译期间对容器内的对象进行类型检查,在运行期不必进行类型的转换.而在j2se5之前必须在运行期动态进行容器内对象的检查及转换 减少含糊的容器,可以定义什么类型的数据放入容器 ArrayList<Integer> listOfIntegers; // <TYPE_NAME> is new to the syntaxInteger integerObject;listOfIntegers = new Array

HTML 5设计原理

Jeremy Keith在 Fronteers 2010 上的主题演讲 下载PPT(PDF) http://adactio.com/extras/slides/designofhtml5.pdf 观看视频 http://fronteers.nl/congres/2010/sessions/the-design-of-html5-jeremy-keith 51CTO推荐专题:HTML 5 下一代Web开发标准详解 今天我想跟大家谈一谈HTML 5的设计.主要分两个方面:一方面,当然了,就是HTML

数据仓库的基本架构

数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision-Support).其实数据仓库本身并不"生产"任何数据,同时自身也不需要"消费"任何的数据,数据来源于外部,并且开放给外部应用,这也是为什么叫"仓库",而不叫"工厂"的原因.因此数据仓库的基本架构主要包含的是数据流入流出的过程,可以分为三层--源数据.数据仓库.数据应用: 从图中可以看出数据仓库的数据来源于不同的源数据,并提供多样的数据应用,数

主数据管理详解

什么是主数据管理(Master Data Management ,MDM) 主数据是指在整个企业范围内各个系统( 操作/事务型应用系统以及分析型系统)间要共享的数据,比如,可以是与客户(customers), 供应商 (suppliers), 帐户(accounts)以及组织单位(organizational units)相关的数据.主数据通常需要在整 个企业范围内保持一致性(consistent).完整性(complete).可控性(controlled),为了达成这一目标 ,就需要进行主数据

mysqldump:Couldn&#039;t execute &#039;show create table `tablename`&#039;: Table tablename&#039; doesn&#039;t exist (1146)

遇到了一个错误mysqldump: Couldn't execute 'show create table `CONCURRENCY_ERRORS`': Table INVOICE_OLD.CONCURRENCY_ERRORS' doesn't exist (1146) ###### WARNING ###### Errors reported during AutoMySQLBackup execution.. Backup failed Error log below.. Error: Co

100个常用大数据词汇中英文对照表

文章讲的是100个常用大数据词汇中英文对照表,常用大数据词汇中英文对照表 A 聚合(Aggregation) – 搜索.合并.显示数据的过程 算法(Algorithms) – 可以完成某种数据分析的数学公式 分析法(Analytics) – 用于发现数据的内在涵义 异常检测(Anomaly detection) – 在数据集中搜索与预期模式或行为不匹配的数据项.除了"Anomalies",用来表示异常的词有以下几种:outliers, exceptions, surprises, co