解析网站结构

  1. 搜索引擎对重要的页面抓取

    由于互联网中信息量庞大,为了向用户展示更多有价值的信息,搜索引擎会优先对每个网站中相对重要的页面(即权重较高的页面)。然而,搜索引擎是怎么发现这些相对重要页面呢?根据重要页面的链接指向的页面也有可能是重要页面思路,搜索引擎首先会从权重相对较高的页面(即源页面)出发并跟踪其中的链接,从而抓取其他相对重要页面(即目标页面)。

    例如,一般情况下,搜索引擎会从网站的首页出发,并跟踪其中的链接,抓取链接中其它的重要页面。由此推出,提高页面被收录几率的最好办法就是减短页面与重要页面之间的链接路径。

  2. 逻辑结构

    链接深度指从源页面到达目标页面所经过的路径。如,某网站的首页中存在链接指向页面A。则从首页到页面A的链接深度就是1.

    链接深度越小,表示从源页面到达目标页面的路径就越短。与重要页面之间的链接深度越小,被搜索引擎抓取的几率就越大。搜索引擎抓取网站首页,并提取其中的链接后就发现页面A1;而对于而面C1,搜索引擎还必须抓取并提取页面A1,B1后才能发现。如图:

    SEO新手必看基础:[6]解析网站结构

  3. URL与链接深度的关系

    在网站中链接深度反映的是页面之间链接路径的长短,而URL反映的是页面在网站中的存储位置。因此,URL与页面的链接深度是不存在任何关系的。

  4. 逻辑结构类型

    在网站中,常见的逻辑结构包括平铺型及树型。其中,树型逻辑结构是实际中最常用的。

    (1)平铺型逻辑结构是指网站中任意两个页面之间都是相互链接的网站结构类型,即网站中任意一个页面都包含其他所有页面的链接入口。这个时候,网站中任意两个页面之间的链接尝试都等于1;从数据结构的角度,平铺型结构实际是深度等于1的树。

    SEO新手必看基础:[6]解析网站结构

  5. (2)树型结构:从页面链接关系的角度,树型逻辑结构是指通过分类(或频道)页面对本分类(或频道)下的页面的链接地址进行合理组织的网站结构。从数据结构的角度,树型结构实际就是深度>N,节点数>N+1的树。

    不管是平铺还是树型逻辑结构,任意两个页面之前都是连通的,即从网站上的任意一个页面出发经过若干路径后总会达到另一个页面。如图所示,首页与页面1就是连通的。

    SEO新手必看基础:[6]解析网站结构

  6. 物理结构

    (1) 目录深度

    目录深度是指页面存储的目录层次例如,index.html存放在网站的根目录

    下,则该页面的目录深度为1。

    目录深度会在一定程度上影响页面被收录的几率及权重。如果一个页面的目录深度过大,则会造成URL的长度过大,从而导致搜索引擎可能会拒绝收录这个页面。因此,我们在对网站进行规划的时候尽量减少页面的目录深度。此外,目录深度较小的页面不管对搜索引擎还是对普通用户都是友好的,因而能得到更高的权重。

  7. (2) URL与目录深度的关系

    正常情况下,URL可以正确反映页面的真实存储位置及目录深度,搜索引擎也是根据URL来判断目录深度,即页面的目录深度是由URL决定的。

    但是,如果URL经过特殊处理(如URL重写),URL就不能反映页面的真实存储位置,目录深度也就不能反映页面的真实存储层次。

  8. 网站结构的优化

    网站结构就是对网站页面的存储形式(即物理结构)及内部链接关系(即罗辑结构)进行合理的调整,以减少页面的目录深度及重要页面之间的链接深度。此外,还有一点非常重要的就是增加重要页面的链接入口,从而提高这些页面被搜索引擎收录的几率及权重。

    逻辑结构优化主要是减少页面之间的链接深度,包括减少普通页面与重要页面之间、重要页面与重要页面的链接深度,以及为网站中相对重要的页面增加更多的链接入口。

    (1)在相对重要的页面中存放更多的链接指向其它页面,这样不但可以减少页面之间的链接深度,还可以引导索引引擎抓取网站中更多相对重要的页面。例如对于网站的首页,可以在合理的范围内加上列多指向其他相对重要页面的链接。

    (2)在更多的页面中加上链接指向相对重要的页面,就可以有效增加网站中相对重要页面的链接入口,从而增加这些页面的链接权重。

    (3)为了让用户能够快速获取到所需要的信息,以及让搜索引擎能够通过一个页面就抓取到网站中最重要的页面,还可以为网站建立“网站地图页面”。

  9. 物理结构优化

    物理结构优化主要是减少页面的目录深度,站在URL的角度,实际上就是减少页面URL的目录层次。

    (1)对于全静态页面的网站,在规划网站时要精简目录结构。

    (2)对于动态网站,则可以通过URL重写的方式减少页面URL的目录层次。

    在实际操作中,我们会通过URL重写的方式使得网站中的每个页面的目录层次为1,即URL 形式为http://域名/文件名称。

  10. 理想结构

    理想结构是一种平铺型结构,即网站的物理结构及逻辑结构都是平铺型的。 

    在物理结构方面,所有的页面都存放到网站的根目录下(或URL的形式为“http://域名/网页名称”),即所有页面的目录深度都为1;而在逻辑结构方面,网站中任意两个页面之间是直接链接的,即任意两个页面间的链接深度为1,理想结构常出现在页面少于100的网站中。因为如果一个页面中的链接超过100,搜索引擎就可能拒绝索引该页面,或者忽略100以后的哪部分链接指向目标页面。理想结构构建:理想结构的构建常从网站的物理结构及逻辑结构入手,也就是对网站页面的根目录深度及链接深度进行规划。

    ,对于静态页面的网站,只需把所有页面放到网站根目录下即可,而对于动态网站,则需要把URL处理为“http://域名/文件”的形式。

    目录深度:在页面深度方面,链接深度:在逻辑结构方面,网站中任意一个页面都包含指向其它的链接入口,从而使网站中任意两个页面之间的链接深度都等于1,如图:

    SEO新手必看基础:[6]解析网站结构