数据驱动GOOGLESEO锚文本全讲解(研究了384,614个网页)

大家都知道链接是一个至关重要的排名因素。但是链接锚文本呢?

谷歌的约翰穆勒是这样说的:

大多数链接确实通过它们的锚文本提供了一些额外的上下文。至少应该是吧?

— ?约翰?(@ John Mu)2017年11月23日

他似乎在暗示,谷歌使用锚文本来帮助理解链接的上下文,所以这可能是一个“排名因素”。——谷歌的原始专利声明他们使用锚文本来影响排名,这并不奇怪。(后面再说!)

这是约翰的另一条推文,他重申了锚文本的重要性:

是的,但是锚文本(和图片替代文本)对我们理解上下文帮助很大,所以如果你能避免,我不会忽略它。— ?约翰?(@ John Mu)2017年5月15日

问题:你应该使用什么样的锚文本?如果想在搜索引擎中排名,是否应该限制使用某些类型的锚文本?你甚至应该操纵锚文本吗?在本指南中,我们将通过研究384,614个网页反向链接的锚文本来揭示我们的发现。但是首先,让我们确定我们知道基本知识。

什么是锚文本?

锚文本是指用于将一个网页链接到另一个网页的可点击的单词。

例:在这个句子中,蓝色的字是锚文本。

锚文本的类型

假设有人决定链接到我们的反向链接检查。我们页面的主要目标关键词是“反向链接检查器”。根据Ahrefs的关键字浏览器,全球每月搜索量为80K。

数据驱动GOOGLESEO锚文本全讲解(研究了384,614个网页)

通过Ahrefs的关键字浏览器

但不是每个人都会以同样的方式链接到这个页面。以下是他们可能使用的锚文本的一些变体:

完全匹配:锚文本正是我们想要排名的关键词或短语。

Ahrefs的反向链接检查器是我最喜欢的搜索引擎优化工具之一。

短语匹配:锚文本包含我们想要排名的关键词。

Ahrefs的反向链接检查是我最喜欢的SEO工具之一。

部分匹配:锚文本包含查询中的所有单词,但它不是一个精确的短语。

Ahrefs的反向链接是我最喜欢的搜索引擎优化工具之一。

Branded:锚文本是我们品牌的名称:

Ahrefs的反向链接检查器是我最喜欢的搜索引擎优化工具之一。

裸 URL:锚文本是原始的“裸”网址(即它会出现在浏览器中):

Ahrefs的反向链接检查器(https://ahrefs.com/backlink-checker/)是我最喜欢的搜索引擎优化工具之一。

随机:锚文本是一个不具体的一般短语,不包含我们的目标关键字(例如,点击这里,这个网站,这篇文章等)。).

Ahrefs的反向链接检查器是我最喜欢的搜索引擎优化工具之一。点击这里自己试试吧!

图片链接:锚文本是图片的替代文本(根据谷歌

)。

<a href=”https://ahrefs.com/backlink-checker”><img src=”/backlink-checker.png” alt=”Backlink Checker”/></a>

现在让我们看看锚文本如何影响我们的排名。

锚文本如何影响搜索引擎排名

谷歌使用外部锚文本来帮助理解你的页面是关于什么的,以及它应该对哪些关键词进行排名。我们怎么知道呢?以下是 Google 算法所基于的原始论文的摘录:

Google 采用了多种技术来提高搜索质量,包括页面排名、锚文本和邻近信息。

因此,如果我链接到这篇文章中以“dog biscuits”作为锚文本的页面,这将向 Google 表明链接的页面可能与 dog biscuits 有关。

如果其他人做同样的事情,那么这将增加谷歌的信心,即相关页面应该可能为“狗饼干”排名。毕竟,如果页面与狗饼干没有任何关系,那么两个或多个不相关的网站链接到具有相同锚文本的同一网页的可能性有多大?很少!希望您开始明白为什么锚文本作为排名因素是有意义的。但是,当然,搜索引擎优化中的任何事情都不是那么简单。

早期谷歌(过度)依赖锚文本

在 Google 的原始算法中,锚文本的权重很大。谷歌创始人谢尔盖·布林和拉里·佩奇在 1998 年的论文中解释说:

链接文本在我们的搜索引擎中以特殊方式处理。大多数搜索引擎将链接的文本与链接所在的页面相关联。此外,我们将其与链接指向的页面相关联。这有几个优点。首先,锚点通常比页面本身提供更准确的网页描述。

使用锚文本还允许 Google 确定无法使用典型页面信号的媒体格式主题。

其次,锚点可能存在于无法被基于文本的搜索引擎索引的文档中,例如图像、程序和数据库。这使得返回实际上未被抓取的网页成为可能。

逻辑是合理的,结果令人印象深刻,尤其是与当时的竞争对手相比——创始人自己并没有忽视这一事实。

虽然完整的用户评估超出了本文的范围,但我们自己使用 Google 的经验表明,对于大多数搜索而言,它比主要的商业搜索引擎产生更好的结果。

但谷歌很快发现锚文本很容易被操纵。 要对查询的网页进行排名,人们只需将多个链接指向它,并将目标关键字作为锚点。

比您的竞争对手更多的关键字丰富的锚文本链接 = WIN。

这导致了一些有趣的“谷歌轰炸”例子——搜索引擎优化通过将锚文本链接指向不相关的页面并对其进行排名。

数据驱动GOOGLESEO锚文本全讲解(研究了384,614个网页)

显然,事情必须改变。

谷歌反击操纵锚文本

2012 年 4 月,谷歌推出了他们现在臭名昭著的企鹅算法的第一次迭代。锚文本是 Penguin 的主要目标之一。一些使用完全匹配的锚文本链接过于激进的网站在一夜之间看到他们的排名下降。然而,据谷歌称,它只影响了 3.1% 的搜索查询。但事情并没有就此停止……

谷歌通过后续企鹅更新继续与操纵性锚文本垃圾邮件作斗争。大多数 SEO 现在似乎建议谨慎使用完全匹配的锚文本——通常在 1% 到 5% 之间。

数据驱动GOOGLESEO锚文本全讲解(研究了384,614个网页)

来自另一个 SEO 博客的推荐完全匹配锚文本 % 示例。

那么真相是什么?您是否应该将精确匹配的锚点保持在最低限度?你应该完全避免完全匹配的锚文本吗?短语匹配和其他类型的锚锚文本怎么样——你应该如何使用它们?为了找出答案,我们进行了两项研究。

研究 1:锚文本对 19,840 个关键词的影响

为了研究锚文本类型和排名之间的相关性,我们查看了 19,840 个关键字的前 20 个搜索结果。这意味着我们总共分析了 384,614 个 网页!

边注:

你们中的一些人可能已经注意到 19,840 * 20 != 384,614,而是 396,800。这是因为一些 URL 的排名不止一个我们研究的关键词。 

所有这些关键字:

每月有 2K-5K 次搜索(随机选择!);

由2-4个英文单词组成;

不包含特殊字符(例如,!#@);

非数字(即,电话号码等关键字被过滤掉)

此外,我们只选择了前 10 个搜索结果具有相似URL 评级 (UR) 值的关键字。这样做的目的是“隔离”锚文本变量。让我用一个粗略的例子来解释。

假设“最佳蛋白粉”的前 10 个搜索结果如下所示:

精确锚匹配%:100%。你的分数:60

精确锚匹配%:90%。你的分数:55

精确锚匹配%:80%。你的分数:50

精确锚匹配%:70%。你的分数:45

精确锚匹配%:60%。你的分数:40

精确锚匹配%:50%。你的分数:35

精确锚匹配%:40%。你的分数:30

精确锚匹配%:30%。你的分数:25

精确锚匹配%:20%。你的分数:20

精确锚匹配%:10%。你的分数:15

您可以看到完全匹配锚文本的百分比与排名相关。由此,我们可以推断出完全匹配率会影响排名。但是,这是具有误导性的,因为 UR 也存在相关性。因此,反向链接(或内部链接)的数量和质量很可能也是这种相关性的部分原因。

另一方面,如果结果看起来像这样……

精确锚匹配%:100%。你的分数:30

精确锚匹配%:90%。你的分数:25

精确锚匹配%:80%。你的分数:32

精确锚匹配%:70%。你的分数:33

精确锚匹配%:60%。你的分数:28

精确锚匹配%:50%。你的分数:31

精确锚匹配%:40%。你的分数:31

精确锚匹配%:30%。你的分数:27

精确锚匹配%:20%。你的分数:36

精确锚匹配%:10%。你的分数:29

……那么由反向链接(或内部链接)引起的任何潜在相关性的可能性要低得多。让我们来看看结果。

精确匹配锚文本的影响

首先,我们查看了每个排名位置的精确匹配锚文本反向链接的平均百分比和中值百分比——根据指向 URL 的反向链接总数计算。

数据驱动GOOGLESEO锚文本全讲解(研究了384,614个网页)

所以看起来这里有一个非常明显的相关性,对吧?不一定。

显示相关性的蓝线是平均值。这是属于每个位置的点的“有偏差”表示,因为极值很容易使平均值偏斜。

假设我们有以下位置 #1 的页面示例:

第 1 页:  0% 完全匹配的锚;

第 2 页:  0% 完全匹配的锚;

第 3 页:  0% 完全匹配的锚;

第 4 页:  0% 完全匹配的锚;

第 5 页:  100% 完全匹配的锚点;

此样本的平均精确匹配锚文本 = 20%。

您可以看到,这并不能很好地代表整个样本——一个值使平均值发生了相当大的偏差。这就是为什么我们还将中值添加到图表(橙色线)中。您可以看到每个排名位置的中位数为零。

以下是我们的数据科学家Loveme Felicilda对此的评价:

我会说平均值不是 表示相关性的好方法。这就是为什么我也显示中位数。所有位置的中位数为零的事实意味着有很多页面没有完全匹配的反向链接。如果我们的中值与我们的平均值显示相同的“模式”,那么我们就会有很强的相关性。因此,如果我们想要呈现相关性,那么我们应该在图表上绘制所有点并添加一条最佳拟合线。 

洛夫梅·费利希尔达, Data Scientist Ahrefs

就是这样:

数据驱动GOOGLESEO锚文本全讲解(研究了384,614个网页)

现在您可以看到真正的相关性非常弱。为了补充这一点,下面是相关性的直方图。x 轴显示分桶相关值,y 轴显示属于每个桶的 SERP/关键字的数量。

数据驱动GOOGLESEO锚文本全讲解(研究了384,614个网页)

一般来说,图形越钟形和对称,相关性越接近中间值(在这种情况下,即为零)。如果它向右倾斜,则更正相关。如果它向左倾斜,那么它是负相关的。您可以看到,在这种情况下,它略微向右倾斜——这表明正相关性较弱。弱到什么程度?以下是Spearman 相关性的结果:

斯皮尔曼相关性(平均):  0.1436斯皮尔曼相关性(中位数):  0.1869

结果:完全匹配锚文本链接的百分比和排名之间的相关性相对较弱。均值和中位数都表明了这一点。

边注:

我们包括了 Spearman 相关性的中值,因为某些利基(例如,发薪日贷款)的锚文本非常重,并且可能扭曲了平均值。 

但这是为什么呢?如果谷歌使用锚文本作为排名因素——或者至少是为了理解页面的上下文,正如约翰·穆勒所说——那么不应该有更大的相关性吗?不是的。John 从未说过他们在算法中赋予锚文本多少权重。

此外,我们的数据中存在一个潜在的、有些 不可避免的缺陷,一会儿聊这个问题。首先,让我们看一下其他锚文本类型的数字……

短语匹配锚文本的影响

回顾一下,短语匹配锚文本是那些包含目标查询的锚文本。例如,如果关键字是“SEO 工具”,那么“最佳 SEO 工具”或“我最喜欢的 SEO 工具”都将是短语匹配锚文本。让我们看看这些是如何统计的。

数据驱动GOOGLESEO锚文本全讲解(研究了384,614个网页)

这里有两点突出:

平均值的“相关性”类似于精确匹配。

短语匹配锚文本的平均百分比略高于精确匹配。

但同样,为了看到“真实”的相关性,我们需要查看一些不同的图表:

数据驱动GOOGLESEO锚文本全讲解(研究了384,614个网页)

数据驱动GOOGLESEO锚文本全讲解(研究了384,614个网页)

所以这一次,相关性甚至低于精确匹配的锚文本。

斯皮尔曼相关性(平均):  0.1057斯皮尔曼相关性(中位数):  0.1393

结果:短语匹配锚文本的百分比与排名之间的相关性非常弱。

部分匹配锚的影响

部分匹配锚文本是那些包含查询中所有单词但不是精确短语的锚文本。例如,如果关键字是“SEO 工具”,那么“SEO 的最佳工具”或“我最喜欢的 SEO 技巧是使用 Ahrefs 的这个工具”都将是词组匹配锚。让我们看看这些是如何统计的。

数据驱动GOOGLESEO锚文本全讲解(研究了384,614个网页)

就平均值而言,似乎再次存在类似的相关性,并且中值仍然趋于零。此外,与完全匹配和词组匹配百分比相比,部分匹配关键字的平均百分比相当高。这是有道理的,因为部分匹配包含完全匹配和词组匹配关键字。

以下是显示相关性更好表示的两个图表:

数据驱动GOOGLESEO锚文本全讲解(研究了384,614个网页)

数据驱动GOOGLESEO锚文本全讲解(研究了384,614个网页)

这里的相关性几乎与短语匹配相关性相同:

斯皮尔曼相关性(平均):  0.1076斯皮尔曼相关性(中位数):  0.1393

结果:相关性非常弱。

随机锚文本的影响

随机锚文本是那些包含非特定或通用短语的锚文本。它们不包含目标关键字(或它的任何元素)。如果关键字是“SEO 工具”,那么“点击这里”或“这篇文章”都将是随机锚点。让我们看看这些是如何统计的。

数据驱动GOOGLESEO锚文本全讲解(研究了384,614个网页)

您会注意到的第一件事是,与我们研究的其他类型的锚文本相比,随机锚文本的平均百分比非常高。这是有道理的,因为除了一些非常特定的锚之外,随机锚文本几乎包含了所有其他锚文本。您还会注意到,平均值似乎表明排名和随机锚文本百分比之间存在某种相关性(尽管很弱)。

我认为这是为什么看平均值是一个坏主意的最好例子。让我们看一些更可靠的图表来判断真实的相关性。

数据驱动GOOGLESEO锚文本全讲解(研究了384,614个网页)

数据驱动GOOGLESEO锚文本全讲解(研究了384,614个网页)

您可以看到直方图似乎既不向左也不向右倾斜。这意味着相关性趋向于中间值,即零。以下是 Spearman 相关性:

斯皮尔曼相关性(平均):  0.0161斯皮尔曼相关性(中位数):  0.0130

结果:实际上没有相关性。那一点也不奇怪。

研究 2:跨 16,000 个页面的周围链接文本影响

如果您熟悉Ahrefs Site Explorer中的反向链接 报告,那么您就会知道我们会显示链接的锚文本和周围的链接文本。

数据驱动GOOGLESEO锚文本全讲解(研究了384,614个网页)

为什么这是相关的?2004 年,谷歌提交了一项 名为“基于参考上下文的排名”的专利。这是该专利的有趣摘录:

[…] 链接周围的数据、链接左侧或链接右侧的数据或与链接关联的锚文本可用于确定与链接关联的上下文。

换句话说,如果实际的锚文本碰巧是随机的并且与链接页面无关,Google 可能会查看周围的链接文本以帮助了解该页面的内容。您可以通过上面屏幕截图中描述的示例看到它是如何工作的。锚文本是随机的/通用的,但周围的链接文本提供了一些上下文。考虑到这一点,我们认为研究排名与关键字在周围链接文本中的出现之间是否存在任何相关性会很有趣。

所以这就是我们所做的:

我们从研究#1 中采用了相同的关键字集,但只包括带有随机锚文本的页面——即没有任何精确/短语/部分/等的页面锚文本链接。这给我们留下了 27,156 个网页。

为了最大限度地减少偏差,我们进一步将样本减少到 16K 页——每个位置 (1-20) 为 800 页。这是为了确保任何相关性都基于每个排名位置的相同页数。让我们来看看我们发现了什么。

精确匹配关键字对周围链接文本的影响

假设我们的目标关键字是“SEO 工具”。以下是在周围链接文本中使用完全匹配关键字的链接示例:

Ahrefs 的反向链接检查器是我最喜欢的 SEO 工具。

现在让我们看看结果。

数据驱动GOOGLESEO锚文本全讲解(研究了384,614个网页)

数据驱动GOOGLESEO锚文本全讲解(研究了384,614个网页)

您可以看到这里几乎没有相关性。

斯皮尔曼相关性(平均):  0.0640

结果:在周围的链接文本中包含完全匹配的关键字似乎对排名没有显着影响。

部分匹配关键字对周围链接文本的影响

这次我们来看看目标关键字中所有术语的出现与排名之间的相关性——即部分匹配。例如,如果我们的关键字是“SEO工具”:

Ahrefs 的反向链接检查器是我最喜欢 的营销工具。

结果如下:

数据驱动GOOGLESEO锚文本全讲解(研究了384,614个网页)

数据驱动GOOGLESEO锚文本全讲解(研究了384,614个网页)

斯皮尔曼相关性(平均):  0.0205

结果:排名与来自查询的所有单词在周围链接文本中的出现之间几乎为零相关。

来自目标查询的 1+ 个词对周围链接文本的影响

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/180731.html

(0)

相关推荐