2 搜索引擎的分类及其工作原理

前沿拓展:

2 搜索引擎的分类及其工作原


1、全文索引

当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法(通常根据网页中关键词的匹配程度、出现的位置/频次、链接质量等),计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。

2、目录索引

通过搜集和整理因特网的资源,根据搜索到网页的内容,将其网址分配到相关分类主题目录的不同层次的类目之下,形成像图书馆目录一样的分类树形结构索引。目录索引无需输入任何文字,只要根据网站提供的主题分类目录,层层点击进入,便可查到所需的网络信息资源。

3、元搜索

接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。


索引量的概念在百科中的解释是:搜索引擎抓取网站并且层层筛选后留下的有用的页面数量。简单点说索引量其实就是你网站中百度认为对用户有用的页面量。一般SEO初学者了解到这一点就算是对索引量的概念有所了解了。如果你跟我一样喜欢对搜索引擎工作原理进行深入的研究,下面我会结合搜索引擎工作原理来详细讲解索引量的本质概念。

搜索引擎工作原理之索引量的本质概念

搜索引擎工作原理的5大步骤分别为爬行、抓取、预处理、收录和排名,因此站点内容页面需要经过搜索引擎的抓取和层层筛选后,才能在搜索结果中展现给用户。

页面通过系统的层层筛选后,并被作为用户搜索候选结果的过程,即为建立索引。

什么是索引量?站点中有多少页面可以作为用户搜索的候选结果,就是一个网站的索引量。

了解了什么是索引量,接下来我们再讲讲如何高效地增加网站的索引量

搜索引擎工作原理之索引量的本质概念

一、网站内容质量

要想被搜索引擎判定为是有用的页面,从而建立索引,那么首先页面的内容一定是对搜索引擎、对用户都是有价值的。所以要想有效增加网站索引量,内容是基础也是关键。

二、内链布局合理

合理的内链布局能够帮助搜索引擎蜘蛛更顺利地爬取到网站的每个页面。打个比方,我们的网站就是一棵长满叶子的树,每一个页面都是树上的一片叶子,内链就是连接每片叶子的树干,爬虫通过“树干”爬到每一片叶子上,所以内链布局合理的网站,蜘蛛爬取也较为顺利,在有限是时间里能够爬取到的页面也就更多。

三、高质量的外部链接

有了好的内容,有了合理的内容,这些就够了吗?当然不够,闭门造车、守株待兔式的等待蜘蛛来抓取网站显得有些太过被动,如何将高质量的内容推送给搜索引擎这时候就显得尤为重要。

我们都知道,搜索引擎每天会放出很多“蜘蛛”爬虫在互联网上爬取,因此外链的意思其实就是在互联网上别人的网站上(尤其是高权重的网站上)放置指向我们网站的链接,吸引更多蜘蛛顺着这个线索爬向我们的网站。

搜索引擎工作原理之索引量的本质概念

拓展知识: