Google的算法是不透明的,不会向大众公开,即便是谷歌的CEO也不能完全知道谷歌的算法。所以,SEO从业者就只能通过谷歌公布出来的算法细枝末节去推敲排名的因素,来指导自己的SEO工作。了解Google更多算法细节避免踩坑。
谷歌的算法非常多,并且谷歌的算法每天都在持续更新中,很多都不对外公布,我这里只简单地列出对SEO具有重大意义的几个算法。
一. PageRank/核心算法
概要:用链接的数量和链接的质量通过计算来对网站页面进行排名,这是谷歌打败Yahoo一举成为搜索霸主的核心武器。也是谷歌最基础的,最重要的算法。
PageRank的基本原理就是高质量的网站肯定受到更多人的喜爱,所以别人都会愿意链接到高质量的网站,链接的数量和质量就成了考核网站排名权重的指标。到现在为止大部分SEO从业者仍然围绕着链接(包括内链和外链)的数量和质量在对网站进行排名。
图片来源:csdn.net博客
1)PageRank引发的商业大战
PageRank算法的诞生比谷歌公司都要早,PageRank是谷歌创始人拉里佩奇还是斯坦福大学学生的时候发表的论文。1997年还是学生的拉里佩奇本想把PageRank专利出售给当时的搜索引擎霸主Yahoo,佩奇开价是100万美元。但是Yahoo大部分的排名都是人工手动排名给指定的门户网站,当然这些门户网站是给Yahoo交月租的,PageRank的思路是把有高质量内容的网站免费进行自然排名,对于当时大把收取各大门户网站租金的Yahoo来说,免费给这些排名?疯了吧?算法本身优秀不优秀已经不重要了,Yahoo认为这个东西不赚钱,肯定是拒绝购买这个算法的。
当然,当初要出售PageRank的拉里佩奇他们也不知道怎么进行商业变现,所以才要出售给Yahoo,直到后来他们想到了在SERP(搜索结果页)的右侧边和底边出售关键词广告来进行商业变现,这就是我们现在所熟知的 Organic search traffic 和 Paid search traffic, 因为Google搜索能提供更多的搜索结果,不会像Yahoo那样只有一些巨头门户网站,所以Google搜索的用户暴增,另一方面个人的网站也能获得搜索排名,很多个人站长也诞生了,各行各业的站长涌入,互联网的内容出现爆发式增长。当然,昔日的搜索巨头Yahoo被用户抛弃了,Yahoo的客户也跑到了Google搜索投放付费关键词广告。
图片来源:Google 搜索截图
后来Yahoo和Google公司展开了各种精彩的商业大站,例如互相挖对方公司的高管和技术人员,也讨论过收购。2002年夏天,雅虎CEO特里·塞梅尔去谷歌,展开谈判要求收购谷歌。据《拯救雅虎:玛丽莎. 梅耶尔传》记载,此时谷歌向他要价10亿美元,没想到Yahoo同意了谷歌开价的10亿美金,但是,在签合同之前,拉里佩奇反悔要价30亿,Yahoo又同意了,拉里佩奇最后又要价60亿美金,Yahoo一气之下都答应给Google支付100亿美金进行收购,Google最终还是没同意。
从1997年的要价100万美金,到2002年的100亿美金:这就是PageRank的威力,让整个互联网生态发生了翻天覆地的变化。
2)PageRank至今仍然是Google排名的核心算法
Google Search Center 员工 John Mueller 表示:虽然从1997年到现在过去20多年了,PageRank仍然是谷歌排名的重要算法,当然当今PageRank已经更新迭代了很多次了,比起1997年的PageRank复杂很多了。
图片来源:Google搜索中心
3)误区:PageRank和PR值
当初PageRank诞生后,谷歌会直接给每个网站打分,也就是PR值,从0-10,满分10分。打开网站时浏览器的插件能直接显示每个网站的PR值,这导致很多网站站长成天只想着怎么去把这个PR值拉高,而不考虑网站内容质量,谷歌最后只能把PR值取消,目的是让站长们把心思花在提高内容质量上,不是这个冷冰冰的PR值。这像不像我们的学校教育,让学生不要看重试卷上的分数,但是最后高考又只看试卷上的分数。
谷歌取消PR值显示的分数,让很多没搞清楚缘由的人以为谷歌取消的是PageRank算法,他们认为现在PageRank没用了,这样的人不少,我在深圳的卖家公开课甚至听一些讲师都这么讲。所以我这里单独列出一个段落来澄清PR值和PageRank的关系。
图片来源:谷歌图片搜索
4)百度没有抄袭谷歌
很多国内的朋友都以为百度搜索引擎是抄袭的谷歌,大错特错啊,百度创始人李彦宏(Robin Li)早在1996年就已经取得了《李彦宏超链分析专利》,并在当年注册了美国专利。这项专利也是解决链接相关性决定排名的问题。而谷歌创始人拉里佩奇的PageRank论文是在1997年才写出来,从时间先后顺序来看百度绝对没有抄袭谷歌的可能。但是李彦宏太低调了,在自家的百度百科里李彦宏的个人简介都没提自己的超链分析专利,所以很多人误解百度抄袭谷歌。
图片来源:Wiki百科截图
二.TrustRank/域名信任度
概要:由于PageRank非常依赖连接,忽视了连接的质量。在这种情况下,无法依靠相关性来决定排名的方式,Spam的横行,直接导致了Google必须找到一种新的反作弊机制,以确保高质量的站点来获得搜索引擎的亲徕。
TrustRank这个算法是明确了是存在的,但是谷歌也没明确给出哪些因素,所以SEO站长们就很为难了,怎么提高网站的TrustRank存在很多种说法,意见很难统一,我这也不一一列举,大家可以自行查找资料拓展学习。
三.HillTop /山顶算法
概要:该算法的论文这样描述:我们的方法基于与PageRank连接算法相同的假设,即引用页面的来源的数量和质量是衡量页面质量的良好指标。主要区别在于,我们只考虑“专家”资源——为将人们引导至资源的特定目的而创建的页
基于“专家”文档的HillTop算法最大的难点是第一次“专家文档”的筛选,从观察来看:Google显然首先给了教育(.edu),政府(.gov)和非盈利组织(.org)站点很高的优先级。资源页面一般是edu gov 或者行业论坛之类的,一般不会是电子商务网站。这就是为什么大家在购买外链的时候经常提到edu,gov的原因,另一个就是和你行业相关的网站。
四.Caffeine Update/咖啡因更新
概要:更新了谷歌抓取和索引网站的方式,谷歌现在能够在几秒钟内发现新内容并对其进行排名。根据 Google 自己的说法,他们不仅能够增加索引,而且能够提供更新鲜的结果(根据他们的估计,更新了 50%)
Caffeine 更新旨在通过更改 Google 从网站查找和存储数据的方式来提供最新信息。
五.Panda /熊猫算法
概要:黑帽SEO使用内容农场在互联网创建了工业级的垃圾内容,Panda目的打击重复、抄袭或肤浅乏味的内容;处罚用户生成的垃圾内容和关键字填充
熊猫算法诞生就让很多SEO公司倒闭了,因为他彻底改变了英文SEO的内容创建策略,让每一个站长都对内容的写作产生了深刻认识:内容为用户服务,解决用户需求。Panda处罚了内容复制的作弊网站,让真正高质量的内容挺直了腰杆获得了排名。
2014 年,谷歌在其搜索质量指南中引入了 E-A-T 原则,重点关注专业知识、权威和可信度。更进一步让价值更大的内容获得更好的排名。这也是Google重视用户体验的证明。
六Penguin /企鹅算法
概要:上面的熊猫算法打击的是垃圾内容(侧重于你的网站站内),企鹅算法打击的垃圾链接(侧重于你的外链建设),目的打击不相关的垃圾链接;带有过度优化的锚文本(关键词填充)的链接。
Google 员工 John Mueller 称 Penguin 是一种站点范围的算法,这意味着大量指向您网站一个页面的低质量链接的存在可能会导致 Google 对您整个网站的信任度降低。然而,一些 SEO 实操中总结出,通过 Penguin 4.0 的迭代,可能已经软化了一点,因此它不再进整站处罚。
有经验的SEOer总结出:外链不要使用太多精准匹配的锚文本,内链可以多一点,但是都不要使用100%精准的锚文本。
具体锚文本怎么使用我做了一个归纳:这个比例不是绝对的,是我们经过多年的SEO经验,并结合国外一些SEO专家的研究来给大家整理出来的。这些百分比你们自己可以灵活改动,不要被我这个数字束缚了。
·品牌锚文本/ Branded Anchor Text: 40%
·URL作为锚文本/ Naked Links: 20%
·无固定形式锚文本/ Generic Anchors: 5%
·含有关键词或近义词锚文本/ LSI, Partial Match Anchors:10%
·与站内锚文本精准匹配的锚文本/ Exact Match Anchors Text: 少于10%
如网站不做品牌推广,那么你可以让Naked links 和Generic anchors多一些。
七.Hummingbird /蜂鸟算法
概要:像蜂鸟一样又快有准的切中用户搜索意图(尤其结合地理位置的搜索意图),这是借助依赖潜在语义索引、共现术语和同义词的自然语言处理来实现的。
蜂鸟是一种快,准,狠的排名算法,这得益于他对搜索意图的理解,例如在蜂鸟算法之前,我们一篇文章里没出现关键词【Second-hand iPhone 14】,只出现了关键词 【Used iPhone 14】,你用Second-hand iPhone 14这个词搜索,我们的文章是不会出现的,因为谷歌会认为这是两个不同的搜索意图,蜂鸟出现后,【Second-hand iPhone 14】和【Used iPhone 14】搜索意图进行了合并理解,即使你的文章里没有精准匹配的关键词,但是只要布局有同义词,近义词,SERP页面也会展示你的结果。
蜂鸟强调了搜索意图,并理解了口语化的词汇从而理解真实搜索意图,并且让搜索结果排序更为直接,如下图搜索的关键字展示:直接把饼干的制作步骤都展示到了SERP页面。
图片来源:Google 搜索截图
八.Mobile / 移动端易用性
概述:打击缺少移动版页面;移动可用性差的网站。针对移动搜索优化您的页面,并专注于速度和可用性。Google 的移动设备友好性和页面速度测试将帮助您了解页面的哪些方面需要改进。谷歌根据移动版本的速度和用户友好程度对所有网站进行排名
这条算法好理解,现在一般的建站都知道做移动端自适应,不做赘述,推荐以下两个链接来检测一下你的移动端体验
移动友好性检测:https://search.google.com/test/mobile-friendly?hl=zh-cn
谷歌页面测速:https://pagespeed.web.dev/?utm_source=psi&utm_medium=redirect
九.RankBrain /智能学习自动更新算法
概述:RankBrain 是 Google 蜂鸟算法基础之上开发的一个AI学习系统,可帮助 Google 理解查询背后的含义,并提供最匹配的搜索结果以响应这些查询。
这个算法以应对关键字中有 15% (每天就有 4.5 亿个关键词难倒谷歌)是以前从未见过的查询。在 RankBrain 之前,谷歌会扫描页面以查看它们是否包含某人搜索的确切关键字。但由于这些关键词是全新的,谷歌不知道搜索者真正想要什么。
原理:通过将从未见过的关键字与 Google 以前见过的关键字进行匹配。谷歌不仅仅是扫描页面现存的文本字符,并考虑了更大的上下文,如同义词、隐含的词和个人搜索历史.
例如,Google RankBrain 可能已经注意到很多人搜索【亚马逊联盟营销】。他们了解到,搜索【亚马逊联盟营销】的人希望看到一组联盟营销的结果。因此,当有人搜索【SEO联盟营销】时,RankBrain 会显示与它已经知道的关键字【亚马逊联盟营销】相似的结果。这就是搜索引擎AI自学的能力拓展。
十.Medic/医疗算法
概述:Google Medic 更新似乎对医疗网站以及与可能改变生活的决定金融、法律、教育,购物)即YMYL(Your Money Your Life)有关的网站受到谷歌搜索爬虫的更高级别的审查。尽管没有明确确认,但谷歌代表暗示该更新实施了质量评估指南文档中的一些 EAT(专业知识、权威、信任)信号。
以下网站会受到更为严苛的质量审查(Google的做法对比一下我们国内百度的做法,哎.......)
购物网站(我们大多数B2C网站都在此列,要让客户在你网站输入信用卡,银行卡,PayPal的都是这类,B2B没有购物车的不在此列)
金融交易页面
财务信息页面
医疗信息页面
法律信息页面
新闻文章或公共/官方信息页面对于拥有知情公民很重要
十一. Bert /博特算法
概述:它是“ Bidirectional Encoder Representations from Transformers ”的首字母缩写词。“BERT”是谷歌在其搜索引擎中引入的最新自然语言处理技术。BERT 最重要的特点是它能够理解句子的上下文。打击内容写得不好;主题分散不集中;缺乏上下文的网站
十二. Core Updates /核心更新
概述:核心更新并不是指一次算法更新,而是2017年以后的一种持续不断的更新,每次更新的主题也不同,关于这些更新是什么以及它们打算改进哪些搜索部分的透明度就更低了
十三.Query Encryption/查询加密(不影响排名)
概述:基于SSL加密保护用户查询的隐私。通过用户的自然搜索列表访问的网站仍会知道您来自 Google,但不会收到有关每个单独查询的信息。
这项算法是不影响我们SEO排名的,但是我认为很重要所以列举出来,SSL加密证书的确是保护了用户隐私,但是,对于数字营销人员,无论是SEO,还是SEM,还是Facebook等信息流营销,用户怎么来到你的网站你无法追溯了,你的数字营销开展起来肯定越来越困难。
图片来源:Google GA截图
Google的GA在2011年这个算法实施之前是能把用户搜索什么关键词进入你网站全部显示出来,现在GA显示未设置,GSA效果栏目里只显示关键词个数是1000个。数字营销人员是不知道这些数据了,但是谷歌他知道,他用这些数据来让大家开展谷歌付费营销,例如Ads,Shopping广告等,谷歌不给我们数据,我们就只能到别处去购买,也催生了第三方数据软件的市场诞生,例如SEMrush,Ahrefs等。
SEO小平的算法总结: