搜索引擎发展历史简述(搜索引擎的工作原理及发展历程)

前沿拓展:

搜索引擎发展历史简述

致了搜索结果的差别性比较大反应出来的缺陷非常明显很多的结果不是用户所想要的内容。支持是一种风采 ,


60年前就有VR了?从科幻到科技,这些技术的演变都经历了什么?

文·姜昊骞

波兰科幻大师斯坦尼斯瓦夫·莱姆(Stanislaw Lem),2021年正好是其诞辰100周年,波兰众议院将该年定为“莱姆年”,并举办了多场纪念活动与研讨会。同时,国内从2021年开始陆续推出了莱姆的科幻作品中译本,包括刚刚上市的《技术大全》。

莱姆本人表示:“《技术大全》是我所有这些论述性作品中唯一满意的一本。这本书已经活了下来,而且依然很有生命力。”这不仅仅是因为他的诸多预言都已经应验,比如VR、互联网、搜索引擎等;也不仅仅是因为它为科幻作家提供了一部方便的硬核设定集。

与试图解答一切神学问题的《神学大全》不同,《技术大全》试图以控制论为基础窥测无限的未来,为打破科学发展的“信息壁垒”提出唯一可能的路径。

写于60年前的VR技术路线图

《技术大全》是莱姆撰写的一部未来学著作。作者在前言中说本书三易其稿,表明目的是:“建造一座理性之塔,使人获得无限视野的书,才不致经历和那位谈论《圣经》的前辈相同的命运。”

此处“谈论《圣经》的前辈”,指的是中世纪经院哲学家托马斯·阿奎那(Thomas Aquinas)的《神学大全》。显然,莱姆认为阿奎那的思想早已过时,在他出版《技术大全》的1964年不再具有现实意义。

60年前就有VR了?从科幻到科技,这些技术的演变都经历了什么?

尽管莱姆自称对个别技术的机制“不是特别感兴趣”,但检验一部未来学著作成色的基本标准就是,它给出的前瞻性预测是否在足够远的未来应验了。莱姆本人对这个标准并不排斥。

1991年,他充满自豪地指出,自己当年的诸多预测在30年后实现了,首先就是所谓的“幻影机器”,也就是现在的虚拟现实技术(Virtual Reality,简称VR)。

他对幻影机器的论述在全书的第六章,“幻影术”。下面是他在1964年写下的原文:“这个人的大脑将会与一台机器连接起来,这台机器将一股股嗅觉、视觉、触觉或其他刺激输入大脑。于是,他将会站在金字塔顶端,或者躺在2500年环球小姐的臂弯中,又或者挥舞利剑斩杀身披铠甲的敌人……环球小姐会回应他的话语,并亲吻他。他采摘的花朵茎秆会柔软地弯曲起来,敌人的胸口被他刺中后会喷出鲜血。”

这不正是VR游戏中的体验吗?不仅如此,莱姆还设想并描述了今天VR眼镜的基本原理,他称之为“反眼睛”。这种设备附加在人的肉眼上,向眼睛发送信号,同时允许眼球自由转动和调节,否则便与观看预设好焦点的3D电影无异。

事实上,在2021年的Facebook Connect大会上,Facebook母公司Meta的XR(包括虚拟现实、增强现实AR与混合现实MR)部门主管安德鲁·博斯沃思(Andrew Bosworth)表示,眼动追踪依然是VR技术发展的一大障碍。

莱姆并没有止步于此,甚至表示这并不属于真正的幻影术,而只是为了方便读者理解而给出的一个小小实验。在他看来,幻影术的意义是“创造出没有出口的情境,让人无法离开虚构世界,回到真实世界”。当然,这并不意味着一个文明集体进入幻影世界,再也无法醒来,因为那等同于自杀,或者像电影《黑客帝国》中那样沦为另一个文明的奴隶或饲料。

他的意思是,成熟的幻影机器不能让体验者时刻意识到自己是在假扮,随时可以退出,就像小朋友在迪士尼乐园随时可以摘掉米老鼠耳朵,或者小伙子在剧本杀体验馆中随时可以脱掉汉服一样。

换句话说,他要营造“浸没式体验”。除了设备本身以外,莱姆认为脚本设置与互动机制同样关键。程序就像笛卡尔《第一哲学沉思录》里那只全知全能、专门骗人的恶魔一样。它总能预判体验者的预判,在体验者即将掀开幻影的帷幕之际及时挂上新的帘子,或者在体验者自以为回到现实世界时,用飞碟轰炸城市的场景“提醒”体验者。

时至2022年,上述内容大体上已经实现了。尽管一些锦上添花的小功能尚无成熟产品,比如增添视觉以外的其他感官体验,乃至在合理范围内调整体验者呼吸到的二氧化碳浓度。但考虑到莱姆做出预言后60年间VR技术的出现与发展,似乎并没有理由认为他的预言必然会落空。

正确预测一种特定技术的原理、体验和应用已经并非易事。跨越区区几十年的成功,确实会让莱姆感到高兴,让他有底气鄙视那些“内心认为这(一旦发现自己的预言失败,就提出一大堆新预言)不过是谋生手段”的未来学家,但对他追求的“无限视野”还差得太远。事实上,在勾勒出大致的技术原理后,他屡屡急不可耐地踏入传统上属于哲学的领域。

例如,他提出了心智哲学中的一个重要命题:“一切知识来源于感觉经验(或者说,在幻影术中,来源于神经刺激),但神经刺激与情绪或者智力状态之间没有明确的决定关系。”这意味着,即使让一个人在幻影机器中体验鳄鱼,他也不会真的具有鳄鱼的意识状态。有时,他会被这样“旁逸斜出”的思考带得太远,以至于要因为偏题而向读者道歉。

看到预测应验是一种如释重负的体验:终于能直接看懂,看懂就能跟别人宣扬的东西了!对我来说,这种体验出现在第六章。但我内心里也知道,开头几章的内容非看不可。那些内容只读一遍留在头脑中的印象,就像用鹅卵石砸在坚硬水泥地上的坑一样深,但不仅为相对易懂的技术展望提供了背景,也是阅读《技术大全》唯一能够增长见识的途径。

用黑箱打破信息壁垒

莱姆并非凭空展望未来,而首先是试图依赖两个参照物:一个是生物演化,因为它是“唯一我们能接触到、提高复杂系统调控与内稳态的过程”;另一个是更先进的外星文明,正如一个年轻人通过观察他人来窥测自己的未来。

生物演化与技术演化有许多相似点。在他的时代,电视机的兴起不仅压缩了收音机的份额,也促使一批“特化”收音机型号诞生,比如小型化收音机和具备录音功能的收音机,由此开枝散叶,形成“侧面分支”,抢占新的“生态位”。

如果他看到收音机如今主要以智能手机的“收音机”功能存在的话,或许可以用“内共生”来形容。也就是线粒体和叶绿体本为独立的细菌,后来演化为真核细胞的细胞器。顺着这样的类比走下去,足够产出许多篇精彩的科幻小说。但对莱姆来说,这样的类比充其量是“科普”,也就是向大众阐释现有的科学知识,对展望未来是无用的。

同理,他也没有抓住生物演化的一些不可思议的特征,从而得出“技术发展的未来是生物学”,或者“人类不可能设计出超复杂机器”这样形同信仰的断言。相反,他认为这是一个虚假的非此即彼困境。因为人类目前只了解两种系统,一种是极为复杂的生命体,一种是比生命体简单得多的人造机器,于是我们往往会“忽略旨在达到平衡的系统中会逐渐出现的法则”,也就是复杂度逐渐提升的自组织系统。由此涉及到了他的一个核心主题:控制论。

但在深入这个话题之前,莱姆将目光投向了太空。他没有描述任何一种外星人可能的样子,更没有揣测外星文明与人类文明的接触。他的出发点相当令人失望:截止到他写作的年代,人类还没有发现任何能够证明外星人存在的直接证据。

遗憾的是,这一点至今依然如此。人类没有在宇宙中发现不可能自然形成的“奇迹”,比如戴森球一类的星际工程。莱姆承认,遐想外星文明无可厚非,甚至是一个“合格的20世纪下半叶的人”的必备素养。但为了提出真正具有建设性的设想,他将视线收回了地球。

人类科学知识发展的基础,是学者与学科的相互交叉,这就需要科学传播能力的指数级增长,其表现之一就是期刊数量、论文数量在20世纪的飞速增长。但科学传播能力不可能无限增长,于是科学就会陷于停滞,莱姆称之为“信息壁垒”。“科学会因为无法吸收涌向自己的信息而大崩溃。”他预计这种状况会在“距离我们今天(1964年)三十年到七十年的未来”发生,也就是1994年至2034年。

真正具有开创性意义的是他提出的解决方案:完全重构科学。不再是利用人类科学家或人工研究机器来获取和传播信息,而是从自然中直接“提取”信息,无需经过大脑,然后借此实现信息演化。实现这一点的关键是控制论装置“黑箱”。黑箱是纯粹的输入-输出机器,能够回答问题,但没有人能够理解其构造。黑箱可以存在于各个层面,从调节单个钢铁厂的生产参数,到调节整个社会的统治者黑箱。

值得注意的是,黑箱并不是全知全能的预言家,正如自然演化虽然有走向稳定的自组织趋势,却并不会赋予任何物种或个体完美的性状。莱姆的黑箱,与美国科幻作家阿西莫夫(Issac Asimov)的“心理史学”形成了极端的对比。心理史学是现代工程学思维发展到极致的成果,通过无比庞大的统计学方程式来推算未来的进程。莱姆的黑箱则激进得多,必须放弃对算法的执念才有希望形成真正复杂的系统。唯有在这个意义上,人类才“不是模仿(自然)的产物,而是要超越其看似无与伦比的完美性”。

波兰科幻大师最知名的著作是《索拉里斯星》,曾被苏联导演安德烈·塔可夫斯基(Andrei Tarkovsky)翻拍为电影《飞向太空》。自1964年出版以来,《技术大全》已被翻译为8门语言。

美国哲学家与诗人尤金·撒克(Eugene Thacker)评论道:“在《技术大全》中,莱姆向我们展示了科幻小说作为一种研究方法的可能性,这种方法使得未来和过去一样脆弱,其间时而摇摆不定的、‘魅影学’的现在却总是近在咫尺。”

中国科幻小说家刘慈欣曾称赞莱姆:“有着非常了不起的想象力,是真正独一无二的。他的作品对人和宇宙的关系有着更深刻的描述,与美国的科幻小说相比,在文学上也更为精致,有着更为深远的意境,也给人带来更多的回味和思考。”

拓展知识:

搜索引擎发展历史简述

搜索引擎经历了10年的发展历史,随着互联网的发展,搜索引擎被越来越多的人熟知和运用,实际上,搜索引擎的出现是个必然,随着网络信息的爆炸式增长,平均每天都会有将近30几万的新的页面出现,必然会给人带来一种茫茫大海的感觉,网络传播的速度大大超出了人们的想象,互联网行业的一夜暴富将不再是梦想…。
在互联网上,人们除了看新闻,听音乐之外,用途最广泛的就是搜索引擎的应用了,人们通过输入自己感兴趣的关键词来获取网络上的信息,就像传统意义上的图书馆标签一样,不同的是当信息的总量还不是很大的时候,我们还可以通过人工的方式进行编辑和排序,实际上最先开始的搜索引擎就是人为编辑整理的一个系统。读者明白,这肯定已经不能再适应现在的情况了,几乎所有的搜索引擎都是计算机程序提供的自动分类和整理。
在互联网上,人们获取信息的途径很多,我们可以在地址栏输入一个网址,也可以登录像搜狐,雅虎,新浪这样的门户网站来获取信息,但他们的局限性很大,不能在很大程度上整合互联网的信息,而搜索引擎的出现恰恰满足了大家当时的需求,用户只需要简单的输入几个词就可以查看到自己想要的结果了。
搜索引擎的发展经历了三个重要的历史时期:
1. 最开始出现的搜索引擎只是检索FTP上边的文件
2. 随后的搜索引擎开始收录网络地址
3. 搜索引擎开始收录标题
4. 目前的搜索引擎,已经开始抓取网页全文了。
在最先开始的搜索引擎中,是主要依靠标题和网络地址来判断这个网页的内容的,这么做可能会导致一个很严重的问题,就是被抓取的网页内容跟来源和标题不同,检索全文的目的就是为了保证搜索引擎检索到网页的标题与网页全文内容一致。
在很多文献资料当中,都有关于搜索引擎跟目录的介绍,为什么要重点介绍这两个呢??这是因为,在很多人的眼里,他们会把一个目录当做是一个搜索引擎,同样可以通过目录上列出的网站来找到自己想要的信息,这跟搜索引擎的效果是一样的,实际上,他们有很大的不同,一个类似于目录的网站(例如雅虎目录.hao123目录)仅仅是很小一部分网页的集合,并且是人工编辑的网站分类,在搜索的网站不是很多的情况下的确可以满足人们的需要,但如果要使用大规模的搜索技术的话,目录还是不能满足的,搜索引擎收录了在互联网上绝大多数的页面,但缺点是无法保证网页内容的质量,而通过目录收录的网站大多权重都比较好,个有个的好处,他们最大的区别在于一个是人工编辑的,一个是计算机程序自动获取的。
在搜索引擎的发展历史上,我们不得不提到的一个概念是——元搜索引擎。元搜索引擎的概念是整合第三方搜索引擎结果的搜索引擎,它提供了在不同搜索引擎的结果供用户去选择,实际上我们谈论的搜索引擎主要是下面的三种搜索引擎:
全文检索搜索引擎——百度,谷歌,雅虎
目录搜索引擎——雅虎目录,hao123
元搜索引擎——整合第三方搜索结果的搜索引擎
从这些搜索引擎的发展上,我们看到了搜索引擎已经越来越多的成为了人们查询信息的主要工具,也许搜索引擎会随着技术的进步慢慢的消失,但搜索,却会是人们恒久不变的一个需求。