2.5 使用高级搜索技术
SEO从业者基本的行业工具之一就是搜索引擎本身。它们提供了一系列丰富的命令,可以用于进行高级的搜索、诊断和竞争性分析。下面是一些基本的运算符。
-关键词
从搜索结果中排除关键词。例如,loansstudent显示有关所有类型贷款的结果,但不包含与“学生贷款”相关的结果。
+关键词
强制包含一个关键词。这对于查询中通常包含停止词(因为不增加价值而常被搜索引擎从查询中去除的关键词,例如,the)或者关键词通过自动填充被转换为多个关键词的情况尤其有用。例如,如果你需要搜索电视节目“The Office”,就肯定希望“The”成为查询的一部分。再举一例,如果你搜索 “Patrick Powers”,他来自爱尔兰,使用patrick powers + Ireland能够避免包含Patrick Powers的无关结果。
“关键短语”
显示匹配整个短语的搜索结果——例如,“seo company”。
关键词OR关键词2
显示至少有一个关键词(例如,google OR Yahoo!)的结果。
以上只是基本的命令,如果你需要了解更多的信息,可以参阅下一节中搜索引擎提供的更高级搜索运算符的概述。
2.5.1 Google高级搜索运算符
Google支持许多高级搜索运算符,可以用它们来帮助诊断SEO问题。
注意
当使用site:运算符时,有些索引的URL可能不显示(即使你使用了“包含已省略结果的重复搜索”链接也看不到完整的列表)。site:查询的不精确是众所周知的,你可以在Google site:命令结果集的URL后附加“&start=990&filter=0”,获得更精确的网站Google索引页面数。
上述参数告诉Google从结果990开始,这是Google显示的最后一个页面,因为它将显示结果限制为1000个。这个方法必须分两步进行,首先,输入一个基本的site:yourdomain.com命令获得结果。然后在地址栏上URL的后面加上“&start=990&filter=0”参数。这样,你就能看到返回的页面总数,得到更精确的结果。注意,这种方法只在关闭Google Instant的情况下有效。
还可以用如下搜索模式看到更多的结果:
site:yourdomain.com/subdirectory1 + site:yourdomain.com/subdirectory2等(挖掘得越深, 得到的结果就更多/更准确)。
site:yourdomain.com inurl:keyword1 + site:yourdomain.com inurl:keyword2等(用于搜索子目录相关关键词)。
site:yourdomain.com intitle:keyword1 + site:yourdomain.com intitle:keyword2等(用于页面标题中使用关键词的页面)。
关于Google高级搜索运算符的更多知识,可以参阅Stephan Spencer的《Google Power Search》一书(O扲eilly)。
组合的Google查询
为了从Google高级搜索中得到更多信息,学习如何有效组合搜索运算符很有帮助用于更快地访问Google高级搜索查询的Firefox插件
可以使用Firefox的一些插件,更轻松地访问这些高级查询。例如:
Advanced Dork 可用页面上高亮的词语快速访问intitle:、inurl:、site:和ext:运算符,如图2-25所示。
SearchStatus,可以快速访问site:运算符,探索当前活动域,如图2-26所示。
2.5.2 必应高级搜索运算符
必应也提供多个值得一看的独特搜索运算符,如表2-3所示。
2.5.3 更多高级搜索运算符技术
你还可以使用更高级的SEO技术,提取更多信息。
确定关键词难度
当构建网页时,知道你所追求的关键词的竞争程度很有用。这个信息可能很难获取。但是,你可以采取一些步骤获得关于关键词排名难度的某些情况。例如,intitle:运算符(例如,intitle:"dress boots")显示的结果与不用该运算符返回的页面相比,与搜索词相关度更高。
可以使用不同的比例来感觉关键词市场的竞争程度(结果的数字越大,意味着竞争越激烈)。例如:
dress boots(108 000 000个结果)“dress boots”(2 020 000)结果intitle:"dress
boots"(375 000个结果)
比例:108 000/375 = 290:1
精确匹配短语比例:2 020/37 = 5.4:1
另一个意义重大的参数是inanchor:运算符(例如,inanchor:"dress boots")。可以在上一个算式中使用这个运算符代替intitle:运算符。
使用数字范围
数字范围运算符有助于将结果集限定在一组型号、产品编号、价格等范围之内。例如:
site:stevespanglerscience.com "product/1700..1750"
遗憾的是,因为数字范围无法与inurl:组合使用,所以产品编号必须在页面上出现。数字范围运算符对版权年限搜索(例如,寻求收购被人放弃的网站)也很有用。将它与intext:运算符组合,可以改进信噪比;例如,intext:"copyright 1993..2005" -2008 blog。
高级文档类型搜索
filetype:运算符可以帮助你“大海捞针”。下面是两个例子:
confidential business plan -template filetype:doc
forrester research grapevine filetype:pdf
警告
如果使用Yahoo! India,应该用originurlextension:运算符代替。
确定列表年龄
你可以用日期标注结果,快速了解每个列表的年龄(由此可以了解信任度);例如,在Google SERP URL最后附加&as_qdr=m199参数,就可以将结果的发布日期限制在过去199个月内。
发现仅限于订阅者或者已删除的内容
你可以从SERP列表中的缓存链接或者使用cache:运算符查看仅限于订阅者或者已经删除的内容。你是不是不想留下足迹?在Google缓存的URL后面添加&strip=1,页面上的图片就不会加载。
如果没有可用的缓存链接,可以使用Google翻译将英文文档从西班牙文翻译成英文(即使没有可用的缓存链接,这样也会显示文档的内容):
http://translate.google.com/translate?prev=&hl=en&u=URL-GOES-HERE&sl=es&tl=en
识别邻居
related:运算符会查看链接到指定网站的网站(“链接网站”),然后查看这些链接网站通常链接到哪些其他的哪些网站。这些网站通常称作邻居(neighborhood),因为共享相似链接图的网站之间显然有很强的联系。
寻找CC许可内容
在URL中使用as_rights参数,可以寻找创意共享组织许可的内容。下面是在网上寻找CC(Creative Commons,创意共享)许可素材的一些例子:
允许商业使用
http://google.com/search?as_rights=(cc_publicdomain|cc_attribute|cc_sharealike|cc_nonderived). -(cc_noncommercial)&q=KEYWORDS
允许派生作品
http://google.com/search?as_rights=(cc_publicdomain|cc_attribute|cc_sharealike|cc_noncommercial).-(cc_nonderived)&q=KEYWORDS
允许商业和派生作品使用
http://google.com/search?as_rights=(cc_publicdomain|cc_attribute|cc_sharealike).-(cc_noncommercial|cc_nonderived)&q=KEYWORDS
一定要将上面的URL中的KEYWORDS替换成帮助你寻找与网站相关内容的关键词。这种方法对SEO有间接的价值。CC内容是网站很好的潜在内容来源。