Google联合雅虎微软改进结构化数据索引

据国外">媒体报道,Google与搜索领域的竞争对手雅虎和微软联合开展一项计划,改进Web遍历和结构化数据的索引。结构化数据通常来自数据库,转化成HTML格式时会失去原来的格式。

三家公司推出了一个名为Schema.org的网站,其中包含一套HTML标签,它们希望网站能使用这些标签标识网站上的结构化数据。Google发表博文称,“Schema.org旨在向网站提供相关资源,使它们能在网页上添加标签,帮助搜索引擎更好地理解网站。”

雅虎、微软和Google预计,通过推广这些标签的使用,它们的搜索引擎将能更好地识别、遍历和索引结构化数据。Schema.org在主页上 发布公告称,“许多应用,特别是搜索引擎,将得益于能直接访问结构化数据。网页标签使搜索引擎能更好地理解网页上的信息,为用户提供更好的搜索结果。”

Schema.org包含逾100个不同的结构化数据标签,例如会议、组织、人、地方、产品、评论、分级、电影和图书。市场研究公司IDC分析师哈德 利·雷诺兹(Hadley Reynolds)表示,雅虎的SearchMonkey开发者计划是第一个旨在促进网站改进结构化数据标识的计划。雅虎去年 停止了SearchMonkey计划,搜索产业蒙受了重大损失,三大主要搜索引擎在这一问题上展开合作是令人欣慰的。

雷诺兹说,“新计划符合SearchMonkey的精神,三家公司的合作将使整个产业受益。对于希望在搜索结果中获得较高排名的网站而言,添加Schema.org的标签将成为头等大事。”

(责任编辑:admin)

时间: 2024-09-20 18:32:15

Google联合雅虎微软改进结构化数据索引的相关文章

Bigtable:一个分布式的结构化数据存储系统

Bigtable:一个分布式的结构化数据存储系统 本文的英文原文为Google在2006年发布的Google Bigtable paper 本文的翻译版本由Alex完成,原文地址为: http://blademaster.ixiezi.com/ 这是我很长时间以来一直想要翻译的文章,不过由于其文太长,以及本人精力有限,未能如愿,今天偶遇此文,感觉译者此文的翻译已远远超越本人,因此将此翻译版本转载于此. Bigtable:一个分布式的结构化数据存储系统译者:alex 摘要 Bigtable是一个分

通过SQL 2008管理非结构化数据

通过SQL Server 2008管理非结构化数据 SQL Server 技术文档 作者:Graeme Malcolm (内容主管) 技术审核员:Shan Sinha 项目编辑:Joanne Hodgins 发布日期:2007年8月 适用产品:SQL Server 2008 概述:数字化信息的增长为企业应当存储和访问业务数据的方法提供了启发.数据库作为业务应用程序的核心,必须能够同非结构化的数据进行集成,其中包括文档.图像.视频.以及其它多媒体格式.为了能够对信息生命周期进行管理,满足策略需求,

《Effective Ruby:改善Ruby程序的48条建议》一第10条:推荐使用Struct而非Hash存储结构化数据

第10条:推荐使用Struct而非Hash存储结构化数据 哈希表是Ruby程序员经常使用的一种有用的.通用的数据结构.Hash类提供了使用哈希表的简单的接口,与数组一样,它是Ruby的重要部分之一,该类有自己专用的语法来创建新的实例.当需要使用键值对时,Hash类绝对是首选.事实上,Ruby程序员在任何时候都会使用哈希,甚至方法的参数关键字也是使用Hash类语法糖来实现的.哈希如此通用,因此能被用来对类型进行模拟,比如数组.集合,甚至基本对象.在OOP语言中,当用到结构化数据时,我们往往有比哈希

非结构化数据营销价值渐受重视 社交网络领域分析需求凸显

在此前举办的Teradata大中华区http://www.aliyun.com/zixun/aggregation/8302.html">数据仓库和企业分析峰会上,数据社会化.大数据分析成为各行业讨论焦点.在电信运营业数据也将走入PB级之时,运营业却深处"被管道化"而于数据价值利用上无力的境地.对此,本刊记者与Teradata中国区电信与邮政行业总经理李鸿进就目前运营商最为关心的智能管道.社交媒体等话题,由数据角度如何发挥价值进行探讨. "不智能因管道并非端到

非结构化数据——RAID模式已过时

一份来自Novell公司Ponemon研究所针对对美国94个大型企业的调查显示,平均每个公司每年花在非结构化数据处理上的成本为210万美元:而一些受到严格监管的行业,比如金融.制药.通讯和医疗行业的成本最高,每年将达到250万美元:另一个来自Unisphere Research的调查则显示,62%的受访者表示非结构化信息的产生是不可避免的,在未来十年内将超过传统数据.此外有35%的人表示,在未来的36个月里,非结构化的信息量将超过传统的关系数据. 据IDC的预测,现在全球数据量每18个月就要翻一

大数据可能「说谎」非结构化数据将呈现更丰富的世界

在2017年的下半年谈论大数据似乎已经没有什么新意,甚至有些令人生厌了,毕竟这个词在中国已经流行太久,形形色色的产品.平台和公司早已贴满了大数据标签,而真正有价值的创新永远都是少数. 行业对于大数据的认知开始变得更加理性和客观,这是一种成熟的表现.但如果因此就认为大数据时代已经进入风平浪静的"发展期",那么我们很可能会错过一场更加波澜壮阔的变革. 被忽视的非结构化数据 在过去几年,大数据产业更多关注的是如何处理海量.多源和异构的数据,并从中获得价值,而其中绝大多数都是结构化数据.不可否

在线语音创业大扎堆:非结构化数据存弱势

齐洁 编者按/ 2012年,手机KTV应用"唱吧"的火爆,让手机上的麦克风所衍生出的应用引起了众多创业者的关注,啪啪.声声.抬杠.啵啵等产品扎堆出现,资本也闻"声"而动.据了解,目前,声声已获得真格基金的天使投资,抬杠也已获得天使注资. 语音正在成为移动端一个新的创业基点,而语音社交.语音提醒.语音输入.语音记事.语音搜索等种种基于语音应用的出现,也说明音频正成为用户的使用习惯.究竟在这一领域的创业前景如何?<中国经营报>记者进行了调查与采访. 在移动互

大数据可能“说谎” 非结构化数据将呈现更丰富的世界

在2017年的下半年谈论大数据似乎已经没有什么新意,甚至有些令人生厌了,毕竟这个词在中国已经流行太久,形形色色的产品.平台和公司早已贴满了大数据标签,而真正有价值的创新永远都是少数. 行业对于大数据的认知开始变得更加理性和客观,这是一种成熟的表现.但如果因此就认为大数据时代已经进入风平浪静的"发展期",那么我们很可能会错过一场更加波澜壮阔的变革. 被忽视的非结构化数据 在过去几年,大数据产业更多关注的是如何处理海量.多源和异构的数据,并从中获得价值,而其中绝大多数都是结构化数据.不可否

刚拿到 1400 万元的“一面网络”专“啃”非结构化数据

今日,"一面网络"正式对外宣布已获得1400万元的Pre-A轮融资,投资方为真格基金和联想之星.此前,一面网络于2014年成立时获得了天使轮融资,投资方为个人. 由于互联网的高速发展,用户产生的行为数据越来越多.这些数据可以划分为两大类:一类信息能够用数据或统一的结构加以表示,我们称之为结构化数据,如数字.符号:而另一类信息无法用数字或统一的结构表示,如文本.图像.声音.网页等,我们称之为非结构化数据.结构化数据属于非结构化数据,是非结构化数据的特例.但企业往往没有能力处理这些数据,所