搜索引擎的种类(搜索引擎的种类及工作原理)

前沿拓展:

搜索引擎的种类

搜索引擎的分类:

1、全文索引

搜索引擎分类部分提到过全文搜索引擎从网站提取信息建立网页数据库的概念。搜索引擎的自动信息搜集功能分两种。一种是定期搜索,即每隔一段时间,搜索引擎主动派出“蜘蛛”程序,对一定IP地址范围内的互联网网站进行检索,一旦发现新的网站,它会自动提取网站的信息和网址加入自己的数据库。

2、目录索引

目录索引也称为:分类检索,是因特网上最早提供WWW资源查询的服务,主要通过搜集和整理因特网的资源,根据搜索到网页的内容,将其网址分配到相关分类主题目录的不同层次的类目之下,形成像图书馆目录一样的分类树形结构索引。

3、元搜索

元搜索引擎接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合。

搜索引擎的工作原理:

第一步:爬行

搜索引擎是通过一种特定规律的软件跟踪网页的链接,从一个链接爬到另外一个链接,像蜘蛛在蜘蛛网上爬行一样,所以被称为“蜘蛛”也被称为“机器人”。搜索引擎蜘蛛的爬行是被输入了一定的规则的,它需要遵从一些命令或文件的内容。

第二步:抓取存储

搜索引擎是通过蜘蛛跟踪链接爬行到网页,并将爬行的数据存入原始页面数据库。其中的页面数据与用户浏览器得到的HTML是完全一样的。搜索引擎蜘蛛在抓取页面时,也做一定的重复内容检测,一旦遇到权重很低的网站上有大量抄袭、采集或者复制的内容,很可能就不再爬行。

第三步:预处理

搜索引擎将蜘蛛抓取回来的页面,进行各种步骤的预处理。

第四步:排名

用户在搜索框输入关键词后,排名程序调用索引库数据,计算排名显示给用户,排名过程与用户直接互动的。但是,由于搜索引擎的数据量庞大,虽然能达到每日都有小的更新,但是一般情况搜索引擎的排名规则都是根据日、周、月阶段性不同幅度的更新。

扩展资料:

十大搜索引擎:

1、百度

百度是全球最大的中文搜索引擎、最大的中文网站。2000年1月由李彦宏创立于北京中关村,致力于向人们提供“简单,可依赖”的信息获取方式。“百度”二字源于中国宋朝词人辛弃疾的《青玉案·元夕》词句“众里寻他千百度”,象征着百度对中文信息检索技术的执著追求。

2、谷歌

Google(中文名:谷歌),是一家美国的跨国科技企业,致力于互联网搜索、云计算、广告技术等领域,开发并提供大量基于互联网的产品与服务,其主要利润来自于AdWords等广告服务。Google由当时在斯坦福大学攻读理工博士的拉里·佩奇和谢尔盖·布卢姆共同创建,因此两人也被称为“Google Guys”。

3、雅虎

雅虎是美国著名的互联网门户网站,也是20世纪末互联网奇迹的创造者之一。其服务包括搜索引擎、电邮、新闻等,业务遍及24个国家和地区,为全球超过5亿的独立用户提供多元化的网络服务。同时也是一家全球性的因特网通讯、商贸及媒体公司。

4、搜狗

搜狗是搜狐公司的旗下子公司,于2004年8月3日推出,目的是增强搜狐网的搜索技能,主要经营搜狐公司的搜索业务。在搜索业务的同时,也推出搜狗输入法、搜狗高速浏览器。

5、爱问

作为首个中文智慧型互动搜索引擎,“爱问”突破了由GOOGLE、百度为代表的算法致胜的搜索模式。 新浪“爱问”在保留了传统算法技术在常规网页搜索的强大功能外,以一个独有的互动问答平台弥补了传统算法技术在搜索界面上智慧性和互动性的先天不足。

6、搜搜

搜搜是腾讯旗下的搜索网站,是腾讯主要的业务单元之一。网站于2006年3月正式发布并开始运营。搜搜目前已成为中国网民首选的三大搜索引擎之一,主要为网民提供实用便捷的搜索服务,同时承担腾讯全部搜索业务,是腾讯整体在线生活战略中重要的组成部分之一。

7、有道

有道是网易旗下利用大数据技术提供移动互联网应用的子公司。网易有道公司已推出有道词典、有道云笔记、惠惠网、有道推广等一系列产品。

8、中搜

中搜是中国国内领先的第三代搜索引擎服务及技术应用提供商。依托第三代搜索引擎和个性化微件,实现了人类知识和搜索技术的融合,通过两大WEB站点、移动APP、云服务平台等载体为网民及企业提供全新的第三代搜索引擎体验。

9、360搜索

360综合搜索,属于元搜索引擎,是搜索引擎的一种,是通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的(甚至是同时利用若干个)搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。

10、天网

天网搜索的前身是北大天网。北大天网由北京大学网络实验室研究开发,是国家重点科技攻关项目“中文编码和分布式中英文信息发现”的研究成果。北大天网于1997年10月29日正式在 CERNET上向广大互联网用户提供Web信息搜索及导航服务,是国内第一个基于网页索引搜索的搜索引擎。

参考资料来源:百度百科——搜索引擎


俄罗斯的成人版“谷歌”,可能要撑不住了

互联网发展到了今天,网上冲浪的入口,基本上已经被瓜分得七七八八。

大厂们深谙“肥水不流外人田”之道,通过自家App,牢牢守住流量的出入口。

不过就算这样,“搜索引擎”还是很坚挺,在众多流量入口中它依然榜上有名。

说起搜索引擎,不知道小伙伴们心目中的TOP1,会是哪一个呀?

俄罗斯的成人版“谷歌”,可能要撑不住了

虽说搜索引擎数量一抓一大把,但有一说一嗷,大多数人用来用去就那么几个。

国外的谷歌,整了一全套互联网服务称霸多年,确立了搜索引擎老大哥的地位。

国内的某度,靠着本地化功能和庞大的用户基数,用户数量也跻身全球前几名。

那么问题来了,大伙知道在邻国俄罗斯,哪个搜索引擎更受俄罗斯人的欢迎吗?

不是谷歌必应,也不是百度雅虎,而是来自俄罗斯的本土搜索引擎——Yandex。

俄罗斯的成人版“谷歌”,可能要撑不住了

作为世界前五名的搜索引擎,Yandex在俄罗斯的受欢迎程度,远超其他搜索引擎。

咱们用数据来说话,小雷搜索了一波,根据知名调研机构Statcounter的统计:

2021年,在俄罗斯本土上,Yandex的市场份额达到了50.34%,甩开谷歌稳坐头把交椅。

俄罗斯的成人版“谷歌”,可能要撑不住了

不光俄罗斯人在用,小雷还发现,国内老司机也很爱在Yandex,挖掘各种资源。

然鹅,就是体量这么大的一家互联网公司,最近却传出了要凉凉的消息。

好家伙,老司机的快活日子要结束了?凉了之后俄罗斯民众又该怎么办嘞?

今天咱们不聊别的,小雷就陪大伙好好唠唠,如日中天的Yandex咋就不行了。

俄罗斯的成人版“谷歌”,可能要撑不住了

Yandex不止是搜索引擎

按照惯例,先给不了解情况的小伙伴,介绍一下Yandex的大概情况。

Yandex的前身,最早可以追溯到1990年的Arcadia公司,大伙没想到这么早吧?

1993年,公司创始人靠着累计的技术,开发出了一款全新的搜索引擎,并且命名为“Yandex”。

直到1997年9月23日,Yandex的域名上线,这款搜索引擎才算正式面向市场推出。

俄罗斯的成人版“谷歌”,可能要撑不住了

到了2000年,Yandex成立独立公司,自己当家做主后,发展势头更是超级猛。

靠着钞能力一路收购,Yandex的业务范围灰常广泛,基本上我们能想到的它都有一手。

当国内互联网大厂还在费劲扩展自己的领域时,Yandex早就以全能选手自居了。

像是百科、邮箱、网盘、资讯、博客、翻译、支付、地图、浏览器,甚至连外卖都有涉猎。

不夸张地说一句嗷,Yandex就像是哆啦A梦的百宝袋,你想要啥啥都有了属于是。

俄罗斯的成人版“谷歌”,可能要撑不住了

Yandex外卖服务

So,往严谨了说,搜索引擎只是Yandex业务的一部分,它应该叫互联网门户公司。

而Yandex之所以能在俄罗斯超过谷歌,依小雷看啊,这里头主要有两方面的原因。

第一个原因前面说了,大厂出品功能丰富还有保障,一站式服务普通民众当然喜欢。

俄罗斯的成人版“谷歌”,可能要撑不住了

这第二个原因,其实说起来也很简单,就是“本地化”

俄语文法的复杂多变,一个俄语单词就可能有几十种变化,搜索的难度大大增加。

举个例子,谷歌只能找到和关键词一样的结果,而Yandex却能把和关键词意思相近的内容,通通都给找出来。

直击俄罗斯用户感知最明显的痛点,用的人肯定只多不少嘛。

俄罗斯的成人版“谷歌”,可能要撑不住了

图源:搜狐财经

老司机的福利网站

而对于国内的老司机来说,Yandex则属于查找资源的神级搜索工具。

首先,和国内动辄广告页面满天飞相比,Yandex突出一个“简洁清爽无广告”

打个比方,小雷用中文搜索“哔哩哔哩”,前5条结果基本就是相关链接,非常明确。

俄罗斯的成人版“谷歌”,可能要撑不住了

而且嚯,小雷还发现Yandex的“以图搜图”功能,识别率也非常准确。

我就经常用它来找高清大图或者资源来源,像是影视剧、动漫截图,一找一个准。

俄罗斯的成人版“谷歌”,可能要撑不住了

当然了,这些还只是Yandex的基本操作,老司机的进阶操作则是搜索福利内容

只要搜索XX关键词,Yandex就能给你整出不一样的结果,甚至连需要版权的也不在话下。

好家伙,能得到老司机的偏爱,Yandex果然有两把刷子。

俄罗斯的成人版“谷歌”,可能要撑不住了

Yandex要凉了?

但是,小雷要说但是了嗷,Yandex最近的小日子却过得不太好。

大伙多少也都知道,这两个月俄乌冲突不断,全球科技巨头纷纷制裁俄罗斯。

制裁的花样很多,但要小雷说啊,还是软件和硬件上的双重断供最为致命。

尤其是芯片断供这块儿,对于俄罗斯的本土互联网企业来说,简直是雪上加霜。

俄罗斯的成人版“谷歌”,可能要撑不住了

芯片库存一旦耗光,这些互联网企业就很有可能,失去维护数据中心的必须基础。

而Yandex在硬件方面,目前就面临了一个大问题——关键的半导体库存要见底了

根据彭博社消息,因为进口受到限制,在未来12-18个月内,Yandex NV服务器所需要的半导体即将耗尽。

半导体一消耗完,服务器就没法正常运转,Yandex的搜索引擎以及很多服务都会严重影响。

俄罗斯的成人版“谷歌”,可能要撑不住了

而且嚯,除了半导体库存告急,在这几波制裁下,Yandex的市值也大跳水了一波。

从2021年11月创下纪录的310亿美元(约合1968.66亿人民币),狂跌到了现在的68亿美元(约合431.83亿人民币)。

再加上俄罗斯政府和西方媒体的双重不待见,Yandex真的可以说是内忧外患了。

目前,Yandex还能支撑一段时间。

但18个月后,它到底该何去何从还是个未知数,小伙伴们还是且用且珍惜吧。

拓展知识:

搜索引擎的种类

随着搜索技术的发展,搜索引擎商无不具有独门产品和技术,搜索引擎也进入细分化时期,种类越来越多。尽管数不胜数,但主要包括目录索引、关键词全文搜索引擎、元搜索引擎,以及由关键词全文搜索引擎扩展延伸的垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。
目录搜索的特点是考人工按照目录一层一层的查找,耗费时间。
关键(字)词搜索,以及以关键词组合为基础的全文搜索与目录搜索引擎相比,基于关键词搜索的优势是使用方便,搜索速度快,直接搜索内容,是目录搜索引擎无法比拟的。
其它不再一一列举,请在网上浏览新华云科论搜索引擎。

本回答被提问者和网友采纳

搜索引擎的种类

随着搜索技术的发展,搜索引擎商无不具有独门产品和技术,搜索引擎也进入细分化时期,种类越来越多。尽管数不胜数,但主要包括目录索引、关键词全文搜索引擎、元搜索引擎,以及由关键词全文搜索引擎扩展延伸的垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。
目录搜索的特点是考人工按照目录一层一层的查找,耗费时间。
关键(字)词搜索,以及以关键词组合为基础的全文搜索与目录搜索引擎相比,基于关键词搜索的优势是使用方便,搜索速度快,直接搜索内容,是目录搜索引擎无法比拟的。
其它不再一一列举,请在网上浏览新华云科论搜索引擎。

搜索引擎的种类

全文搜索引擎(从网页上匹配你要搜索的信息),目录搜索引擎(从目录分类网站查找),元搜索引擎(从其他的搜索引擎查找)。