21 SEO基础算法详解

从输入关键词,到百度给出搜索结果的过程,往往仅需几毫秒即可完成。百度是如何在浩如烟海的互联网资源中,以如此之快的速度将您的网站内容展现给用户?这背后蕴藏着什么样的工作流程和运算逻辑?事实上,百度搜索引擎的工作并非仅仅如同首页搜索框一样简单。

搜索引擎为用户展现的每一条搜索结果,都对应着互联网上的一个页面。每一条搜索结果从产生到被搜索引擎展现给用户,都需要经过四个过程:抓取、过滤、建立索引和输出结果。

抓取

Baiduspider,或称百度蜘蛛,会通过搜索引擎系统的计算,来决定对哪些网站施行抓取,以及抓取的内容和频率值。搜索引擎的计算过程会参考您的网站在历史中的表现,比如内容是否足够优质,是否存在对用户不友好的设置,是否存在过度的搜索引擎优化行为等等。

当您的网站产生新内容时,Baiduspider会通过互联网中某个指向该页面的链接进行访问和抓取,如果您没有设置任何外部链接指向网站中的新增内容,则Baiduspider是无法对其进行抓取的。对于已被抓取过的内容,搜索引擎会对抓取的页面进行记录,并依据这些页面对用户的重要程度安排不同频次的抓取更新工作。网站地图

需您要注意的是,有一些抓取软件,为了各种目的,会伪装成Baiduspider对您的网站进行抓取,这可能是不受控制的抓取行为,严重时会影响到网站的正常运作。点此识别Baiduspider的真伪。

 

———————

在这过程中有几个词语比较关键,阿君给大家着重讲解一下:

频率值:

一,搜索引擎的硬件是有限的,不可能有太多资源对每一个网页频繁光顾,简单来理解就是不同的网站,搜索引擎光顾的频率是不一样。

二,有些网站一天来抓取几百上千次,但是有的一天只有一次,也可能几天才来一次。

三,影响频率值:虽然蜘蛛针对不用的网站的有不同的频率值,但是我们可以通过做一些事情影响它的频率值。

     提升频率度的方法就是 经常更新我们的网站 ,往往频率值会比较高,所以尽可能持续更新。

历史记录:

   一,我们网站所有的历史会被搜索引擎记录下来,搜索引擎的计算过程会参考您的网站在历史中的表现。

  二,这里提醒我们:网站前期不要犯错误,必须在进行网站建设的时候不要做错误的事情,一定要谨慎,比如原创 、网站结构等等。在后期评估页面质量的时候会参考你前期的工作。

 过度优化:

    一、网页中加入隐藏的文字、隐藏的链接;

    二、与网页内容不相关的关键词;

    三、具有欺骗性跳转或者有欺骗性的重定向;

    四、专门针对搜索引擎的桥页,即所谓的过度页;

    五、针对程序生成的内容:制造大量的内容,命中搜索引擎结果;

    六、大量重复无价值的内容;

    七、充斥着大量恶意广告、恶意代码的页面;

    八、群发链接等等

———————-

过滤

互联网中并非所有的网页都对用户有意义,比如一些明显的欺骗用户的网页,死链接,空白内容页面等。这些网页对用户、站长和百度来说,都没有足够的价值,因此百度会自动对这些内容进行过滤,以避免为用户和您的网站带来不必要的麻烦。

建立索引

百度对抓取回来的内容会逐一进行标记和识别,并将这些标记进行储存为结构化的数据,比如网页的tagtitle、metadescripiton、网页外链及描述、抓取记录。同时,也会将网页中的关键词信息进行识别和储存,以便与用户搜索的内容进行匹配。

输出结果

用户输入的关键词,百度会对其进行一系列复杂的分析,并根据分析的结论在索引库中寻找与之最为匹配的一系列网页,按照用户输入的关键词所体现的需求强弱和网页的优劣进行打分,并按照最终的分数进行排列,展现给用户。

综上,您若希望通过搜索引擎为用户带来更好的体验,需要您对网站进行严格的内容建设,使之更符合用户的浏览需求。需要您注意的是,网站的内容建设始终需要考虑的一个问题是,这对用户是否有价值。

按照道理到这里搜索引擎的工作应该就结束了,事实上搜索引擎的工作才刚刚开始,它要对搜素结果进行持续关注;比如同一个词的搜索结果,排名第一的网站,用户的跳出率极高,而排名第三的页面用户体验非常好的话,那么排名的顺序就要再次进行调整了。

 

 

SEO优化的三个阶段 :收录、排名、点击。如下表:

搜索引擎原理的详解

收录:就像有人问你:你最喜欢吃的水果是什么?你脑海里肯定会出现很多选择:苹果、梨、猕猴桃等等,但是一个你从来没见过且不知道什么味道的水果不可能出现在你的脑海里。

 

同样的道理,要想在搜索引擎的搜索结果当中有一个不错的排名,第一个要解决的问题就是让我们的网页进入到搜索引擎的“脑海里”(数据库),这就是收录。还有就是抓取不等于收录,就像你在集市上逛,你看见了(抓取了)很多人(网页),但是不一定都记住(收录),你记住的都是很特别的人(原创页面)。

排名:收录的问题解决之后,下面要解决的就是排名,如何让网页获得不错的排名呢?

条件1 自身优秀——相关且权威;

条件2 其它相关页面对该页面的信任投票——相关反向链接。就像一个进宫的妃子,想当皇后(排名首位),自身(网页内容)优秀是一方面,得到皇太后和大臣们的投票(相关反向链接)也很重要,甚至有时候起着决定性作用。

SEO之搜索引擎原理的详解

点击:排名好,流量不一定高。有了排名之后,另外一个要解决的问题就是点击率,因为再好的排名没有人点击也是没用的;就像我们在地铁口摆地摊儿,拿到一个离出口最近的位置(排名首页)固然是好事,但是并不意味着客户就多,很有可能他们直接绕过去看其他家摊上的东西了。同样道理,任何一个关键词搜索结果当中都会出现最少10个相关的网页,那么如何让客户选择点击我们的页面呢?这就需要在标题和页面内容上下点功夫了。

搜索引擎搜索结果调用出来的除了网页标题之外还有网页内容的摘要,这个网页内容摘要很多时候不是我们描述标签里的内容,有时候搜索出来的同一个页面,一个是调用的是描述标签里的内容,另一个是网页的其它相关内容。所以除了标题之外内容也很重要。

总的来讲,SEO要解决的三个问题:收录、排名、点击。

发表评论