2022年最完整的google seo教程,零基础的小白也可以看懂

一、确定搜索用户意图并传达相关、新鲜内容丨google seo教程

如今商业搜索引擎主要依靠信息检索(IR) 的技术。这项技术自从20世纪中期就已经存在了,当时检索系统运行于图书馆、调研中心以及政府实验基地。在搜索系统发展的前期,IR科学家认为搜索功能主要由两个重要的部分组成:相关性和重要性(我们在本文的前面部分已经定义,这篇文章讲google seo教程的基础内容)。为了衡量这些因素,搜索引擎进行了文档分析(包括对文档中概念的语义分析)以及链接(或者引证)分析。

二、文档分析和语义连通性丨google seo教程

在文档分析中,搜索引擎会查看搜索术语是否出现在文档的重要区域一标题、 元数据、标题标签以及文本正文中。它们也会基于对文档的分析试图自动衡量文档的价值,以及其他元素。

仅仅通过文档分析的评判对搜索引擎来说仍然不够,因此它同样还会关注语义连通性。语义连通性指的是字词之间的正常联系。例如你看到一个字aloha,你可能会联想到Hawaii,而肯定不会是Florida。搜索引擎积极地创建它自己的辞典和词典来帮助它确定哪些术语和哪些主题是相关联的。通过简单地扫描其网络内容庞大的数据库,可以使用模糊集理论以及某些特定的等式来链接术语并且开始更像人类一样地理解网页和网站。

专业的SEO实操人员不需要使用语义连通性衡量工具来优化网站,但是对那些想要获取所有优势的高级实操人员来说,使用语义连同衡量方法在以下几部分会有所裨益:

1.衡量定位哪些关键词短语;

2.衡量在关于某个话题的页面应该涵盖哪些关键词;

3.衡量其他具有较高排名的网站和页面的文本关系;

4.查找提供”相关”主体链接的页面。

尽管技术性很高,但SEO专家仅仅需要了解获取有价值信息的几条原则。要牢记尽管IR的世界有成百上千的技术术语,而且很难理解,但SEO初学者都能分解并进一步理解。

IR领域常见的搜索类型主要分为如下几种。

近似搜索

近似搜索利用搜索短语的顺序来查找相关的文档。例如,当你搜索“Sweet German mustard (德国甜芥末) 时,你仅仅指明了一个近似搜索。即使除了引用,搜索术语的相关性对搜索引擎来说仍然很关键,但是现在显示的文档不能完全按照搜索短语的顺序相匹配,例如Sweet Mustard German。

模糊逻辑

模糊逻辑指的是不区分对错的逻辑。举个常见的例子,评价某天是不是晴天(is 50%cloud cover a sunny day? )。在搜索中,模糊逻辑一般用于误拼。

布尔搜索法

这是使用布尔搜索术语AND、OR以及NOT进行的搜索。这种类型的逻辑用来扩展或者限制搜索中查找的文档信息。

术语权重

术语权重指的是针对某项查询,某个特定搜索术语的重要性。目的是为了给某些特定的术语更多的权重从而产生很好的搜索结果。例如,在查询词中出现the这个词在选择结果时的权重很小,因为它几乎出现在所有的英文文档中。它没有什么特殊的地方,并且在选择文档时没有什么帮助。

IR模型(搜索引擎)使用模糊集理论(由Lotfi Zadeh博士在1969年创建的模糊逻辑的一一个分支)发现两个词之间的语义连通性。相比用辞典和字典来确定两个词是否互相关联,一 个IR系统可以使用它庞大的内容数据库来解答其中的关系。

尽管这个过程听起来很复杂,基础理念却很简单。搜索引擎需要依靠机器逻辑(真/假、是/非,等等)。机器逻辑比人类有更多优势,但是它的思维方式和人类不一样,对人类来说一些本能的信息机器却很难理解。例如,橘子和香蕉都是水果,但是橘子和香蕉不都是圆形的。对人类来说这是直觉性的知识。

要一个机器理解这个概念并且理解类似的其他概念,语义连通性就是关键。网络上大量的和人相关的学问都能被系统的索引收录并且分析,从而人工地创建人类建立的各种联系信息。这样,通过扫描成千上万的香蕉和橘子出现在索引中的情况,知道圆形和香蕉并没有很大的相关性,但是橘子和圆形就有相关性,机器就能知道橘子圆形的并且香蕉不是圆的。

这就是使用模糊逻辑的地方,使用模糊集理论通过衡量术语一起出现的频率以及场景, 可帮助电脑确定术语之间的联系。

例如,搜索引擎会识别到公园旅游一般会包含观看野生动物,可能是旅游的一部分。

要想看到这个实例,可在谷歌中搜索”z00trips” (公园旅游) 。注意返回的搜索结果中的黑体字,在后面的段落中都是以斜体显示的。在索引中,谷歌设置”相关的”术语为黑体字并且识别哪些术语出现的频率比较高(一起出现、在同一页面或者是相近词)。

搜索公司投资研究这些技术好几年了。在2013年9月,谷歌默默地让世界知道它重新改写了它的引擎并且命名为”Hummingbird”(蜂鸟)。这项改写在很大程度上提高了识别事物之间联系的能力。

例如,如果你使用谷歌的语音搜索(点击搜索框右边的麦克风按钮)并且询问” Who is TomBrady?”它会用一个搜索结果来回答你的问题,而且会用音频告诉你他是一一个“国家橄榄球联赛的新英格兰爱国者队美国橄榄球四分卫”。

下面显示了谷歌对Tom Brady的各个方面搜索结果。例如,

1.他有一份职业:四分卫、踢美式足球(和除美国和加拿大之外的国家指的足球明显不同)

2.他所在的球队:新英格兰爱国者队。

3.新英格兰爱国者队属于:美国国家橄榄球联盟。

现在的搜索比2012年时复杂得多。你还可以更进一步。例如,如果你使用语音搜索功能询问”Who is his wife?”它也会对这个问题作出解答(如图2-22所示)

2022年最完整的google seo教程,零基础的小白也可以看懂

图2-22 Gisele Bindchen是Tom Brady的老婆

注意在第二条查询条目中我们没有说TomBrady的名字,谷歌记住了会话的情景,那个”his”指的就是Tom Brady。你可以继续提问诸如像”Does he have children”这样的问题。谷歌也会对此进行解答。

从SEO的角度来说,这个用途让我们见识了搜索引擎可以识别网络上的词语、话题之间的联系。随着语义联通性成为搜索引擎算法里面更大的一部分,你可以把重点放在网站和页面的主题以及链接上。将来搜索引擎应该能够根据主题和想法来识别某个网站中不合适的内容、链接以及页面。

三、内容质量和用户参与度丨google seo教程

搜索引擎会尝试判断某个网站的内容质量和独特程度。它们可能使用的一种方法是评估文档本身。比如,如果一个网页有拼写或者语法错误,这可能就代表在其中投入的编辑审校精力很少。

它们也会分析文档的可读性。实现这一点的一个常用公式是Flesch-Kincaid年级可读性公式,其中会考虑平均字词的长度以及每个句子的单词来确定理解这些句子需要具备的教育程度。想象一个场景页面上出售的商品是儿童玩具,搜索引擎计算其可读性为大学高年级水平。这就代表编辑水平有限。

搜索引擎可以使用另外一种方法来评估网页的质量,那就是衡量实际用户交互。例如,如果有很多用户在搜索后访问网站,没有停留一会儿就立刻返回了搜索引擎点击下一个搜索结果,这就表明页面质量很差。

谷歌在201 1年2月23日更新的Panda声明中指出,网站的参与程度开始成为一个排名因素。谷歌能够访问大量的数据,可以来衡量用户与网站的交互程度。仅仅因为谷歌能够访问这些数据,并不代表它一定会使用它作为排名因素。注意,其中的一些信息来源包括如下。

与网络搜索结果的互动

例如,如果一-个用户点击了搜索结果到了你的网站,然后点击了返回按钮,再然后点击了同一系列的其他搜索结果,可以把这个看作是一个负面的排名信号。或者如果在搜索结果中排名比你的网站排名靠下的网站获取了更多的点击量,这对你的网站来说是-个负面的排名信号,但是对它们来说是正面的排名信号。无论搜索引擎使用这个信号与否,以及它们对其的权重多大,我们都无从获知。

Google Analytics (谷歌分析)

很难找到一个公司来统计有百分之多少的网站使用谷歌分析。Immeria.net在2008年对网络进行的调查显示份额占到59%,Metric Mail博客检查了Alexa排名前100万的网站,发现大约50%都会进行谷歌分析。也就是说,谷歌是可以收集到全世界大部分网站的数据的。这为谷歌提供了关于网站的丰富的数据,这些数据如下。

跳出率

只访问你的网站中一-一个页面的访客占比。

网站停留时间

用户在网站的停留时间。注意谷歌分析只有在每个页面加载之后才会获取信息,因此如果你仅仅访问一个页面,它不能判定你在那个页面的停留时间。这个指标能够告诉你加载第一个页面到加载最后一个页面之间的平均时长, 但是不包含在最后一页加载时访客花费的时间。

页面浏览量/访客

平均每个访客访问的页面数量。

Google Toolbar (谷歌工具栏)

很难获知有多少用户使用谷歌工具栏,但是我们相信数量应该在百万级别。对这些用户来说,谷歌可以追踪他们全部的网络冲浪行为。不像谷歌分析,谷歌工具栏可以衡量用户到达网站一直到她加载其他网站页面的时长。它同样可以衡量跳出率以及页面浏览量/访客。

Google+ 1按钮

这使用户可以为页面投票。目前没有证据表明谷歌将它作为排名因素,但是理论上是可以的。你可以在第8章中了解到更多的信息。

Chrome过滤清单扩展程序

谷歌为Chrome提供了一个名字为Chrome的过滤清单扩展的插件。这样,用户可以在Chrome浏览器中标记他们不喜欢的搜索结果。最初它被用在谷歌的熊猫算法中,这个算法用来衡量每条内容的质量。你可以在后面的文章中阅读更多相关的信息。

Goo.gI

谷歌有自己的缩略版URL。这个工具能够使谷歌看到哪些内容被分享了,哪些内容被点击了,甚至在封闭的环境中,谷歌网络爬虫不能爬行的地方。

你的网站和你的竞争对手相比如何,这是很重要的。如果你的网站有更好的用户交互指标,这可能就代表着质量较高,相比于你的竞争对手你的排名可能会更高。搜索引擎如何使用这些类型的信号还无法得知,因此下面是我们对谷歌的猜测。我们会在第8章中详细讨论社交以及用户交互的排名因素。

四、链接分析丨google seo教程

在链接分析中,搜索引擎衡量有谁链接到网站或者某个网页,以及他们对这个网站或者网页的评价。同样它们也能抓住其中的关联(通过历史链接数据、网站的登记记录以及其他资源),基于链接到的网站的权威程度,网站托管网页的上下文数据(谁链接到网站、他们对网站的意见,等等)来判断哪些网站值得信赖。

链接分析比统计某个网页或网站中的链接数更加深入,链接不是平等的(某个链接可能是另一个链接价值的1000万倍)。一个非常权威的网站,非常权威的网页中的链接比其他没有这么权威的链接价值要小很多。搜索引擎可以通过链接分析以及语义分析来判定一个网站或者网页是否权威。

例如,可能你对宠物狗美容的网站感兴趣。搜索引擎可以用语义分析来判定哪些网页是关于宠物狗美容的。然后搜索引擎可以确定哪些页面含有关于宠物狗美容网站的最多链接。这些页面的权威程度比其他网站更高。

事实上,分析要复杂得多。例如,假设有五个关于宠物狗美容的网页含有很多链接,如下所示:

1.页面A有213条相关话题链接;

2.页面B有192条相关话题链接;

3.页面C有203条相关话题链接;

4.页面D有1 13条相关话题链接;

5.页面E有122条相关话题链接。

甚至可能是页面A、B、D和E互相链接,但是没有一个页面链接到页面C。事实上,页面C可能含有很多相关的链接,而那些链接到它的网站本身含有的链接数量较少。在这种情况下,页面C可能会由于没有被正确的网站链接而不会被认为具有相关性。

群组网站的概念基于哪些网站链接到它们,以及它们链接到哪些网站,这就是linkneighborhood对群组网站的概述。你所在的neighborhood讲了关于你的网站的事情,你的网站获得的链接的数量和质量就表明了你的网站的重要程度。

搜索引擎对link neighborhoods的权重并不明确,非相关页面的链接也能够对目标页面的排名起到作用。然而,从相关的页面或者网站中获得的链接比从不相关的页面和网站获取的链接更为有价值。

另一个确定链接价值的因素是链接嵌入的方式以及在哪里嵌入。例如,链接本身的文本信息(例如,用户点击会跳转到你页面的文本信息)对搜索引擎仍然也是一个关键的信号。

这被称为锚文本,如果文本信息富含关键词(关键词与你的目标搜索术语相关),比起不含有关键词的锚文本,它能够帮助你提高搜索引擎排名。例如,一个“宠物狗美容沙龙”的锚文本能够比一个关于 宠物狗美容沙龙的网页中的“点击这里”更有价值。然而,要多留意。如果你使用“宠物狗美容沙龙”的锚文本获得了1万个链接并且有-些其他链接到你的网站,这看起来很不正常,可能会有灾难性后果。

对链接的价值的语义分析比锚文本要深入得多。例如,如果你网页上有一个“宠物狗美容沙龙”的锚文本,实际上并不是关于宠物狗美容的信息,链接的价值比页面中含有宠物狗美容信息要低得多。搜索引擎同样也会查看在链接周边的内容信息,以及全文内容和提供链接的网站的权威性的信息。

所有的这些因素都是链接分析的成分,我们会在之后的文章中更进行详细的描述。

五、评估社交媒体信号

诸如像Facebook、Twitter以及 Google+这样的网站创建了用户分享内容的新方式以及用户关注内容的新方式。这让很多人开始猜测搜索引擎可以用这些信号作为排名因素之一。在2013年8月份,Moz发布了他们最近的相关研究,加速了这一猜想,它显示了+ 1和在谷歌中排名的密切联系。

图2-23显示的是分析数据中前10个结果,Google+ 1s对排名起着第二相关因素的作用。

2022年最完整的google seo教程,零基础的小白也可以看懂

图2-23 Moz 2013年相关研究的前10名

然而,尽管有联系也不代表谷歌就能用+1 (赞)作为一个排名的信号,或者说它们可以获得更高排名。它仅仅能说明好的内容会获得很多的链接(- 般是能引起较高排名的信号)也能获得更多的+1。

事实上,Stone Temple咨询公司进行了另一项研究调查,主要针对衡量Google+活动是否被谷歌用于衡量排名。这个调查研究显示没有证据能表明Google+分享或者+1对排名有实质性的影响。我们将会在第8章中详细讨论可以作为排名因素的社交信号。

六、易混淆词组、消除歧义以及差异性

与之相反,输入的词语对搜索引擎来说一-直是一个巨大的挑战。其中一个巨大的挑战就是消除歧义。例如,当人们输入boxers时,人们指的是职业拳手、狗的品种还是某种类型的内衣?另外-一个例子是jaguar,曾经指代丛林猫、车、足球队、运行系统以及- -种吉他。用户到底指的是什么?

搜索引擎经常会遇到这种模棱两可的情况。这里提供的两个案例本身有其固有问题,但事实上问题更大。例如,如果某个人在搜索框输入”cars” ,他是想:

1.想要阅读评论?

2.想要去车展?

3.想要买车?

4.想要阅读关于车的新科技?

查询词”cars” 是如此宽泛,仅仅基于查询词无法判定搜索用户的意图。搜索引擎处理这种情况的一个方法是查找此用户之前输入的搜索条目来判断他的意图。我们已在1.4.4节 “自适应检索”中描述更多此方面的内容。他们使用的另外- -种方法是提供不同的结果。比如说,如图2-24显示的一次通用搜索,这次是搜索“GDP”的。

2022年最完整的google seo教程,零基础的小白也可以看懂

图2-24不同搜索结果案例

这就涉及一个非常重要的排名概念。很可能图2-24中的投资百科不是自己为其相关性和驱动链接重要性得分做出了严格的分析,从而位于搜索结果第一-页,实际上是对多样性的需求提高了本页面的排名。通过这种方式来改变搜索结果的概念被称为内容多样化( Query Deserves Diversity, QDD)。

一个严格的基于相关性和重要性的排名系统可能会显示一系列额外讨论GDP的政府相关页面。然而,已经显示的政府页面就能够满足大多数用户的搜索需求,但是对那些没有满足的搜索用户来说,提供同种类型的搜索页面不大可能会提高他们对搜索结果的满意度。

引入一些多样性能够使谷歌为那些寻求除政府页面之外的搜索结果的用户提供满意的答案。据谷歌测试表明,这种基于多样性的方法在其用户中引起了更高层次的满足。

例如,非多样性搜索结果的测试数据指出,搜索结果页面的点击率下降,用户进行了更多的查询修改,甚至由此而引发相关搜索次数的提高。

慎重地将多样性引入到搜索结果算法中的做法是很有道理的,并且可以加强搜索用户对以下搜索条目的满意度:

1.公司名字(搜索用户可能希望获取积极的或者消极的言论、以及公司的官方域名)。

2.产品搜索(一 般电子商务搜索结果可能会占据搜索结果页面,但是谷歌也试图提供一些评论或者非商业的、相关的内容)。

3.新闻和政事搜索(可能会莽撞地显示某个问题的”各个方面”,而不是获得很多链接的左翼或者右翼博客)。

搜索引擎也会基于搜索用户的搜索历史以及他们的搜索行为来提供个性化搜索结果。例如,如果一个用户曾经搜索过纸牌游戏,然后搜索多米诺,搜索引擎可能就会选择将多米诺骨牌的相关搜索结果放置最靠前的位置,而不是强调电力公司。

新鲜感在哪里比较重要

在大多数时间里,搜索|擎从比较陈旧的经得住时间考验的资源中获取搜索结果是有道理的。然而,有的时候搜索结果应该从较为新的资源中获取信息。

例如,当有突破性新闻时,比如一次地震,搜索引擎几秒钟后就会获得查询,第一批文章会在15分钟之内出现在网络上。

在这种情况下,就需要实时地发现信息并且对新的信息进行检索。谷歌将这种概念称之为内容新鲜度(QDF) 。 就纽约时报而言,内容新鲜度将若干因素考虑在内,例如:

1.搜索量;

2.新闻报道;

3.博客报道。

内容新鲜度适用于最新的新闻报道,也适用于其他场景,例如热i门的、新折扣的交易或者获取很多搜索量和媒体报道的新产品发布。有猜想说,谷歌会对具有较高页面排名的网站使用内容新鲜度原则。

七、为什么这些算法有时不准

就像我们在本节中前面描述的一样,搜索引擎会完成很多令人感到不可思议的事情。然而,有时候这个过程产出的结果并不能如你所愿。其中一个原因是用户输入的搜索关键词太少,不能显示他们的搜索意图(例如,如果他们搜索车,他们是想买车、阅读评论、学习如何开车、如何制造车,还是有什么别的意图? ) ;另外一个原因是有的词语有多重含义,例如我们在前面使用到的捷豹的例子。

如果你还想了解关于搜索算法不准的更多信息,请阅读其他文章。


本站所有外贸独立站,免费帮助优化产品文章格式,做好最基础的网站优化,并提供基础的谷歌seo设置,目标做全网性价比最高的外贸独立站,7X24小时为您提供服务     

微信号:zz8023zyw
手机号:13213944560
公众号:外贸讯
邮箱:waimaoxun@163.com

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

最新文章

相关推荐

扫描二维码联系我们

微信搜索:lvmofangA

外贸独立站多少钱

马上联系我们

13213944560