网页结构化目标是提取网页的5个基本属性

　　针对搜索引擎工作原理的学习，在了解了网页结构化的概念后，就应该进一步探究为什么进行网页结构化，网页结构化的目标是什么。

　　我不是学究派，我是从事seo网站优化的工作人员，在此分享自己的学习过程，我一直相信，探究事物的本源，会让具体的seo网站优化工作变得更加可控、应用更加自如。无论是在做北京网站优化,还是上海网站优化,抑或是广州网站优化等等，道理均是一样的。最后这句对已入门者是废话哈。下面进入正题。

　　一、为什么进行网页结构化?

　　1)网页结构化是搜索引擎识别网页检索价值的基础。

　　网页结构化可以理解为搜索引擎系统更深入工作的一个前期筛选，或者理解为流水线上的一个工序，出于效率、资源占用的考虑，把这道工序放到了前面。

　　2)网页结构化让搜索引擎节约了大量的存储。

　　网页结构化就是搜索引擎把抓取来的原始数据进行瘦身减负的过程。把页面中有价值的并且能够代表页面属性的部分留下，其他东东彻底卸掉。很自然地，就节约了大量的空间。

　　二、网页结构化目标是什么?

　　其实作为seo网站优化人员最想知道的是，网页结构化抽取页面的哪几个属性来代表网页。所以本文标题也就定为了“网页结构化目标是提取网页的5个基本属性”。即下面5个基本属性，这5个属性对于检索来说极其重要。

　　(1) 标题(title)：这里的标题特指HTML标识语言中中间的文字部分，这部分文字表达了网页的基本含义。和锚文本相同的是，都是用来描述网页的内容的属性;和锚文本不同的是，这个标题是由该网页制作者本人编写的。

　　(2)锚文本(anchor text)：也是描述网页内容的属性之一。比如北京大学主页可能被另外一些网页中存在的锚(anchor)所指向，其锚文本(如文字为“北京大学官网”)就是北京大学网站主页的描述。特别是对于某些没有标题的网页，锚文本是有益的补充。

　　(3)正文标题(content title)：在HTML网页中，网页的标题由标签标识。实际的情况是由于网页编写者的疏忽，或者其他原因，标签中的文字不能代表网页的主要内容，为此需要抽取正文中的适当文字作为正文标题。

　　(4)正文(content)：锚文本、标题和正文标题都是网页的简短描述，而正文是一个网页的主体内容，它完整地表述了网页的主体内容，一般出现在div、table和p等HTML标签中。

　　(5)正向链接(link)：正向链接是网页制作者编写的引导用户继续在网上冲浪的链接，这些链接的文字也是其他网页的锚文本。(来源：www.zhangxundf.cn)

时间： 2024-10-14 03:14:13

结构化HTML DIV CSS网页布局入门指南