高级谷歌检索运算符

谷歌支持很多高级检索运算符,你可以用它们来帮助你诊断SEO问题。
注意当你使用site:检索运算符时,一些检索的URL可能不会显示(即使你使用了“重复搜索包含省略的结果”链接到完整列表)。site:查询词不正确。你可以通过谷歌获取更准确的检索结果,通过在URL中添加&start=990&filter=0使用site:检索运算符搜索。
这告诉谷歌要从第990个结果开始,也就是说,谷歌会显示给你最后一个页面中的结果,因为它最多能显示1000个搜索结果,但这必须分两个步骤进行,首先,输入一个基础site:<yourdomain.com>进行搜索,然后获得搜索结果。之后,进入地址栏,在网址后面添加

&start=990&filter=0参数。这样做之后,你就可以查看返回的全部页面,从而获得一个更准确的计数。需要注意的是,这样做的前提是关闭Google Instant。
要查看更多的结果,你还可以使用下面这些搜索模式:
·site:<yourdomain.com>/<subdirectory1>+site:<yourdomain.com>/<subdirectory2>+…(你挖得越深,得到的结果越精确)
·site:<yourdomain.com>inurl:<keyword1>+site:<yourdomain.com>inurl:<keyword2>+…(针对的是次级目录下的关键词)
·site:<yourdomain.com>intitle:<keyword1>+site:<yourdomain.com>intitle:<keyword2>+…(针对的是使用页面标题中的关键词页面)
要了解更多与谷歌高级搜索运算符相关的信息,你可以阅读Stephan Spencer的Google Power Search(O’Reilly)一书。
混合谷歌搜索请求
要从谷歌高级搜索中获得更多的信息,则有必要学习如何有效地将搜索运算符组合起来。
快速获取谷歌高级搜索请求的Firefox插件
你可以使用Firefox内的

许多插件轻松访问这些高级搜索请求:
·Advanced Dork可以快速访问intitle:、inurl:、site:及ext:运算符,获取页面中突出显示的词汇

使用高级搜索技巧

SEO实操人员使用的基本工具之一是搜索引擎本身。他们可以提供丰富的检索算符,可以用来进行高级搜索、诊断以及竞争性分析。更多的基本检索运算符如下。
关键词
从搜索结果中排除关键词。例如,贷款—学生显示的是所有类型的贷款,除了学生贷款。
“关键短语”
显示了完全相同短语的搜索结果——例如,“SEO compang”。同样你也可以使用“”来强化某个特定字。这对包含禁用词表时特别有用(一般都是从关键词中删除的词语,因为它们本身没有价值,例如the),或者你的关键词被系统自动转化为多个关键词。例如,如果你想要搜索电视节目The Office,你会认为The非常重要需要保留。举另一个例子,如果你在寻找Patrick Powers,来自Ireland,你会搜索“Patrick Powers”Ireland来避免不相关的信息。
关键词1或关键词2
显示了至少一个关键词——例如,google或者Yahoo!。
这些都是基础,对想要更多信息的人来说,下面讲的就是搜索引擎的更加高级的检索运算符的相关描述。

其他排名因素

到目前为止,我们讨论的排名因素都仅仅是基础。搜索引擎会潜在地将很多其他信号作为排名因素。
收到链接的速度
如果,一段时间以来,你的网站平均每天收到5个链接,突然从某天开始,每天收到10个链接,可以将此视为优质的排名信号。从另一方面说,如果新链接下降到每天两个,那么就暗示你的网站的相关性降低。
然而,事实比这要复杂得多。如果你的网站突然每天获得300个新链接,要么就是因为你的网站变得更加具有相关性,要么你就收到了很多垃圾链接。魔鬼在于细节之中,最重要的细节是这些新链接产生的原因。
用户数据
个性化是搜索领域中讨论最多的尖端科技。个性化可以通过若干种方式来实践。例如,搜索引擎可以进行地理位置查询来判断用户大概的地理位置。基于这一点,搜索引擎可以为用户显示有针对性的本地内容。这一点很有帮助,例如,在用户搜索本地餐厅时就可以用到。
搜索引擎获取用户数据的另一种方式是如果他在搜索引擎中创建了个人介绍,并且提供了一些个人信息,最简单的像语言偏好(例如用户表明他更常用葡萄牙语),搜索引擎就能为这个偏好为用户提供个性化搜索结果。
搜索引擎也可以查阅某个用户的搜索历史。事实上,搜索引擎保留了用户进行登录之后进行的所有搜索的日志。根据这一点,它能看到用户最近查看了高级车并且可以利用这些信息在用户输入捷豹之后,调整他所看到的搜索结果。有时候称之为自适应搜索。
为了降低个性化等级,用户可以退出他们的谷歌账户。然而,这并不能消除所有的个性化功能,谷歌仍然能够将历史与用户的电脑绑定。用户可以通过使用谷歌的Chrome浏

览器的隐身模式来消除所有的个性化功能。这样,她就能看到没有基于搜索历史而产生的谷歌搜索结果。然而,搜索结果仍然会针对她所在的地理位置有针对性地显示。
用户可以通过搜索查询、在搜索结果页面URL结尾中附加&pws=0并且重新加载页面来消除个性化。注意,这仅仅在关闭谷歌的即时搜索(在用户输入查询条目后谷歌立刻显示结果的功能)之后才会起作用。或者,用户可以选择在搜索结果页面的齿轮图标下面的“网页历史”中选择“不启用基于网页历史的个性化内容”。

不良排名因素

同样,不良排名因素也会存在。例如,如果一个网站有大量的低质量导入链接,很明显是开发商想要提高排名而人为导入的,这个网站的排名就会下降。事实上,这就是谷歌的企鹅算法所做的事情。这个算法会在第9章中详细讨论。其他一些不良排名因素如下。
网站存在恶意软件
搜索引擎会快速封锁含有病毒或者木马的网站。
遮址
搜索引擎希望网站开发商向搜索引擎以及用户展示相同的内容。
网站中含有销售链接的网页
谷歌对付费搜索链接要求很严格,那些销售链接的网站可能会受到处罚。
网站中的广告支付链接内容
作为对上一个不良排名因素的扩展,对付费链接的销售行为进行宣传也可能被视为不良排名因素。
页面速度
回到2010年,谷歌的Matt Cutts曾经说过:谷歌将页面速度作为排名因素之一。总而言之,如果页面加载速度很慢,就认为是一个不良排名因素。

排名因素

Moz会周期性地对先进的搜索引擎优化技术进行调查,从而判断哪些排名因素更加重要。以下是前9名结果的总结,按照优先级排序(按照引入研究指示):
·域级链接权威性;
·页面等级链接指标;
·页面等级关键词和内容;
·除关键词之外的其他页面等级特征;
·域级品牌指标;
·页面流量/查询数据;
·页面等级社交指标;
·域级关键词用法;
·域级关键词待定功能。
以下是关于每个条目的简单介绍:
域级链接权威性
域级链接权威性是对链接到某个域的所有链接的累计链接分析。其中包含的因素,诸如:链接到网站的其他域名的数量、那些域名的信任度/权威性、新嵌入链接的添加速度、链接域的相关性,等等。
页面等级链接指标
指的是与特定网页相关的链接,诸如链接的数量、链接的相关性,以及页面中链接受到的信任度和其权威性。
页面等级关键词和内容
这部分描述了在页面中HTML编码部分使用的关键词术语/词组(<title>标签、<h1>、alt属性,等等)。
除关键词之外的其他页面等级特征
这里包含的因素是页面元素,例如页面的链接数量、内部链接的数量、追踪链接的数量、“不追踪”链接的数量,以及其他相似的因素。
域级品牌指标
这个因素包括网站品牌名称、提及的搜索量、是否在社交媒体出现过,以及其他和品牌相关的指标。
页面流量/查询数据
这个因素是指搜索结果中对某个页面的点击量、跳出率,以及其他相关的衡量指标。
页面等级社交指标
社交指标包括提及量、链接量、分享量、点赞量,以及其他和社交媒体网站相关的指标。这里要强调一点,很多

SEO实战专家都认为这应当列为一个排名因素,尽管调查显示并非如此,来自谷歌的代表清楚地表明社交信号不能作为他们算法的一部分。
域级关键词用法
这代表的是在根目录或者子域名中如何使用关键词,以及这对搜索引擎排名有什么影响。
域级关键词待定功能
这个因素的主要成分包括域名中的连字符的数量、域名中字母的数量以及域名的长度。

知识图谱

传统的搜索结果是由搜索引擎爬取并且分析网页来获取信息的,然后将信息呈现在搜索结果中。然而,谷歌的使命“是组织世界上的信息并且使其全球通用”。谷歌积极主动地创建信息数据库,远远超过了传统的基于网页的搜索模式。
注意,我们在本章前面部分谈到了垂直搜索。垂直搜索涉及进入不同类别的搜索之中,例如搜索图片、视频以及本地业务信息。而知识图谱更多地是在搜索结果中关于提供丰富的信息,通常不需要用户点击网站就能够直接回答用户的问题。
在2012年5月份,谷歌宣布了知识图谱技术。起初,这是一系列的结构化信息数据库,能够让谷歌不需要从网页中解析就可以直接去访问信息。你可以在图2-25中看到谷歌直接从其知识图谱中获取的数据。
最初谷歌从Freebase、维基百科以及CIA资料手册中获取数据创建知识图谱。这就允许谷歌能够解答很多问题,但是仅仅能够满足很小一部分的搜索条目。由于这个原因,谷歌不断地扩增知识图谱中的信息。
此外,谷歌对更加可信赖的信息来源进行投资,包括网站,在搜索中提供直接搜索答案。谷歌将这些称之为“有特色的片段”。

在这个搜索结果中,谷歌从CNN资金管理网提取了一系列的一步步指导说明。注意有两步是省略掉的,因此为了获取完整的步骤或者每个步骤中

详细的细节介绍,用户需要点击CNN资金管理网站。
在某些例子中,谷歌会在搜索结果中展示详细的步骤,但是大多数情况下不会。Stone Temple咨询公司调查了276个需要一步步指导的例子,发现其中217个(79%)不能显示完整的指导步骤。
一个相关的概念为语义搜索,这与知识图谱有所重合,但是也对很多因素进行了考虑,能够为用户提供个性化搜索结果。你可以在图2-27中看到其中某些因素的描述。

为什么这些算法有时不准

就像我们在本节中前面描述的一样,搜索引擎会完成很多令人感到不可思议的事情。然而,有时候这个过程产出的结果并不能如你所愿。其中一个原因是用户输入的搜索关键词太少,不能显示他们的搜索意图(例如,如果他们搜索车,他们是想买车、阅读评论、学习如何开车、如何制造车,还是有什么别的意图?);另外一个原因是有的词语有多重含义,例如我们在前面使用到的捷豹的例子。
如果你还想了解关于搜索算法不准的更多信息,请阅读Hamlet Batista在Moz中发表的文章“为什么搜索引擎不能100%正确地提供搜索结果的七个原因”。

易混淆词组、消除歧义以及差异性

与之相反,输入的词语对搜索引擎来说一直是一个巨大的挑战。其中一个巨大的挑战就是消除歧义。例如,当人们输入boxers时,人们指的是职业拳击手、狗的品种还是某种类型的内衣?另外一个例子是jaguar,曾经指代丛林猫、车、足球队、运行系统以及一种吉他。用户到底指的是什么?
搜索引擎经常会遇到这种模棱两可的情况。这里提供的两个案例本身有其固有问题,但事实上问题更大。例如,如果某个人在搜索框输入“cars”,他是想:
·想要阅读评论?
·想要去车展?
·想要买车?
·想要阅读关于车的新科技?
查询词“cars”是如此宽泛,仅仅基于查询词无法判定搜索用户的意图。搜索引擎处理这种情况的一个方法是查找此用户之前输入的搜索条目来判断他的意图。我们已在1.4.4节“自适应检索”中描述更多此方面的内容。
他们使用的另外一种方法是提供不同的结果。比如说,如图2-24显示的一次通用搜索,这次是搜索“GDP”的。

这就涉及一个非常重要的排名概念。很可能图2-24中的投资百科不是自己为其相关性和驱动链接重要性得分做出了严格的分析,从而位于搜索结果第一页,实际上是对多样性的需求提高了本页面的排名。

通过这种方式来改变搜索结果的概念被称为内容多样化(Query Deserves Diversity,QDD)。
一个严格的基于相关性和重要性的排名系统可能会显示一系列额外讨论GDP的政府相关页面。然而,已经显示的政府页面就能够满足大多数用户的搜索需求,但是对那些没有满足的搜索用户来说,提供同种类型的搜索页面不大可能会提高他们对搜索结果的满意度。
引入一些多样性能够使谷歌为那些寻求除政府页面之外的搜索结果的用户提供满意的答案。据谷歌测试表明,这种基于多样性的方法在其用户中引起了更高层次的满足。

慎重地将多样性引入到搜索结果算法中的做法是很有道理的,并且可以加强搜索用户对以下搜索条目的满意度:
·公司名字(搜索用户可能希望获取积极的或者消极的言论、以及公司的官方域名)。
·产品搜索(一般电子商务搜索结果可能会占据搜索结果页面,但是谷歌也试图提供一些评论或者非商业的、相关的内容)。
·新闻和政事搜索(可能会莽撞地显示某个问题的“各个方面”,而不是获得很多链接的左翼或者右翼博客)。
搜索引擎也会基于搜索用户的搜索历史以及他们的搜索行为来提供个性化搜索结果。例如,如果一个用户曾经搜索过纸牌游戏,然后搜索多米诺,搜索引擎可能就会选择将多米诺骨牌的相关搜索结果放置最靠前的位置,而不是强调电力公司。
新鲜感在哪里比较重要
在大多数时间里,搜索引擎从比较陈旧的经得住时间考验的资源中获取搜索结果是有道理的。然而,有的时候搜索结果应该从较为新的资源中获取信息。

时,比如一次地震,搜索引擎几秒钟后就会获得查询,第一批文章会在15分钟之内出现在网络上。
在这种情况下,就需要实时地发现信息并且对新的信息进行检索。谷歌将这种概念称之为内容新鲜度(QDF)。就纽约时报而言,内容新鲜度将若干因素考虑在内
内容新鲜度适用于最新的新闻报道,也适用于其他场景,例如热门的、新折扣的交易或者获取很多搜索量和媒体报道的新产品发布。有猜想说,谷歌会对具有较高页面排名的网站使用内容新鲜度原则。

评估社交媒体

如Facebook、Twitter以及Google+这样的网站创建了用户分享内容的新方式以及用户关注内容的新方式。这让很多人开始猜测搜索引擎可以用这些信号作为排名因素之一。
然而,尽管有联系也不代表谷歌就能用+1(赞)作为一个排名的信号,或者说它们可以获得更高排名。它仅仅能说明好的内容会获得很多的链接(一般是能引起较高排名的信号)也能获得更多的+1。
事实上,Stone Temple咨询公司进行了另一项研究调查,主要针对衡量Google+活动是否被谷歌用于衡量排名。这个调查研究显示没有证据能表明Google+分享或者+1对排名有实质性的影响。我们将会在第8章中详细讨论可以作为排名因素的社交信号。

链接分析

在链接分析中,搜索引擎衡量有谁链接到网站或者某个网页,以及他们对这个网站或者网页的评价。同样它们也能抓住其中的关联(通过历史链接数据、网站的登记记录以及其他资源),基于链接到的网站的权威程度,网站托管网页的上下文数据(谁链接到网站、他们对网站的意见,等等)来判断哪些网站值得信赖。
链接分析比统计某个网页或网站中的链接数更加深入,链接不是平等的(某个链接可能是另一个链接价值的1000万倍)。一个非常权威的网站,非常权威的网页中的链接比其他没有这么权威的链接价值要小很多。搜索引擎可以通过链接分析以及语义分析来判定一个网站或者网页是否权威。
例如,可能你对宠物狗美容的网站感兴趣。搜索引擎可以用语义分析来判定哪些网页是关于宠物狗美容的。然后搜索引擎可以确定哪些页面含有关于宠物狗美容网站的最多链接。这些页面的权威程度比其他网站更高。
事实上,分析要复杂得多。例如,假设有五个关于宠物狗美容的网页含有很多链接,如下所示:
·页面A有213条相关话题链接;
·页面B有192条相关话题链接;
·页面C有203条相关话题链接;
·页面D有113条相关话题链接;
·页面E有122条相关话题链接。
甚至可能是页面A、B、D和E互相链接,但是没有一个页面链接到页面C。事实上,页面C可能含有很多相关的链接,而那些链接到它的网站本身含有的链接数量较少。在这种情况下,页面C可能会由于没有被正确的网站链接而不会被认为具有相关性。
群组网站的概念基于哪些
网站链接到它们,以及它们链接到哪些网站,这就是link neighborhood对群组网站的概述。你所在的neighborhood讲了关于你的网站的事情,你的网站获得的链接的数量和质量就表明了你的网站的重要程度。
搜索引擎对link neighborhoods的权重并不明确,非相关页面的链接也能够对目标页面的排名起到作用。然而,从相关的页面或者网站中获得的链接比从不相关的页面和网站获取的链接更为有价值。
另一个确定链接价值的因素是链接嵌入的方式以及在哪里嵌入。例如,链接本身的文本信息(例如,用户点击会跳转到你页面的文本信息)对搜索引擎仍然也是一个关键的信号。
这被称为锚文本,如果文本信息富含关键词(关键词与你的目标搜索术语相关),比起不含有关键词的锚文本,它能够帮助你提高搜索引擎排名。例如,一个“宠物狗美容沙龙”的锚文本能够比一个关于宠物狗美容沙龙的网页中的“点击这里”更有价值。然而,要多留意。如果你使用“宠物狗美容沙龙”的锚文本获得了1万个链接并且有一些其他链接到你的网站,这看起来很不正常,可能会有灾难性后果。
对链接的价值的语义分析比锚文本要深入得多。例如,如果你网页上有一个“宠物狗美容沙龙”的锚文本,实际上并不是关于宠物狗美容的信息,链接的价值比页面中含有宠物狗美容信息要低得多。搜索引擎同样也会查看在链接周边的内容信息,以及全文内容和提供链接的网站的权威性的信息。
所有的这些因素都是链接分析的成分,我们会在第7章中更进行详细的描述。