纯技术搜索引擎(技术型搜索引擎)

前沿拓展:

纯技术搜索引擎

搜索引擎是一种利用网络自动搜索技术,对Internet中各种资源进行标引,并为检索者提供检索结果的工具。


90后技术宅与他的非主流另类搜索引擎Magi

最近,一个名叫 Magi 的搜索引擎成了重点关注对象,据称这个搜索引擎和我们常见的搜索引擎很不一样,有一种程序员们钟爱的 X 冷淡风格。于是我们打开 Magi 看了看。

确实,这个页面看着就很让人舒爽。

90后技术宅与他的非主流另类搜索引擎Magi90后技术宅与他的非主流另类搜索引擎Magi

重要的是搜索结果也很不一般,属性中的每一个结果有对应的链接,并带有标签和主要学习来源部分,搜索结果以结构化知识的形式呈现。这种模式和国内外主流的搜索引擎完全不一样,让人感觉新鲜。

当然,也让人由此发出疑问:Magi 到底是什么,是谁开发的,好不好用?

按照开发者 PeakJi 季逸超的讲述和 Magi 网站上的说明,Magi 其实并不是单纯的网页搜索引擎,而是自主阅读文本并持续纠错的 AI。

Magi 是由 Peak Labs 从无到有自研的基于机器学习的信息抽取和检索系统,它能将任何领域的自然语言文本中的知识提取成结构化的数据,通过终身学习持续聚合和纠错,进而为人类用户和其他人工智能提供可解析、可检索、可溯源的知识体系。11 月,Peak Labs 发布了公众版 Magi.com。

与搜索引擎不同,Magi 不仅收录互联网上的海量文本,还会去尝试理解并学习这些文本中蕴含的知识和数据。此外,Magi 从零研发了一套互联网搜索引擎,所以 Magi.com 同时提供全网规模的普通搜索结果,学习过程是在无人干预的情况下 7 x 24 小时不间断运行。

90后技术宅与他的非主流另类搜索引擎Magi

互联网数据浩如烟海,质量参差不齐,如何将这些数据处理成机器能够理解的数据结构时隔巨大的挑战。在「Magi 的使命」一项中,Peak Labs这样写道:作为公众版本的 magi.com 为人类用户提供了与互联网数据交互的新方式,而 Magi 系统背后的技术平台则承载着另一半重要的意义:让机器像人一样能理解并充分利用互联网中无穷无尽的知识。

对 Magi 的技术感兴趣的同学,可以访问 www.peak-labs.com 官网和季逸超的知乎,我们在这里就不多说了。

下面来关注一下 Magi 背后的团队——Peak Labs,以及创始人 PeakJi 。

创始人 PeakJi 真名季逸超,90 后男生,在北大附中读高中期间接触 iOS 并加入威锋网 WEIP 技术组,先后参与了 wefit 输入法的完善和各种越狱研究,高三设计并开发猛犸 1 网页浏览器,大一推出猛犸 4。据说,PeakJi 所有的产品都是由他独自完成设计、美工、算法、编码、测试和推广,可见啊这是一个非常有想法,动手能力也很强的「技术宅」了。

90后技术宅与他的非主流另类搜索引擎Magi

2012 年,在北大念书的季逸超创建 Peak Labs,并发明了 Rasgueado 输入法。据说 Peak Labs 的产品和技术还有很多,什么神经信息提取系统 Ireul,网页大规模搜索引擎 Ramiel,多语言分析 pipeline Arael 和分布式检索系统 Matarael 等等,利用这些技术构架,他们搭建了 Magi 服务,包括普惠版和企业版两种。

如果你要问 Magi 好不好用,我们暂时也无法给出明确回答,因为 Magi 目前完成度还有待提高。但是,比起当做搜索引擎来用,Magi 应该更适合做知识学习链库。

90后技术宅与他的非主流另类搜索引擎Magi

在使用的过程,我们会发现 Magi 也有很多不足之处,尤其是在搜索规模和答案准确度上。面对一些简单搜索,Magi 往往给不出让人满意的答案,而且速度也不够快。另外,它不是一款搜索引擎,像搜索网址这类任务也达不到很好的效果,也无法进行图片搜索。

对于 Magi 的缺点,团队和 PeakJi 都大方坦诚。

Peak Labs 指出,Magi 已经展示出的开放领域信息提取能力,可以应用到企业客户所在的细分领域内,变成一个更加强大的信息抽取系统,让每一个领域、每一家企业都可以轻松地打造属于自己的知识图谱,他们希望未来的 Magi 系统能够成为「知识领域的 ImageNet」。

90后技术宅与他的非主流另类搜索引擎Magi

Magi 现在还远算不上成熟,但其特性决定了它无穷的可能性和成长空间。未来,也许 Magi 会成为打破现有搜索引擎原理的新范式,开启全新的结构化知识搜索引擎时代,改变我们对信息检索和知识获取方式的刻板印象,毕竟在信息大革命和人工智能大发展的时代,千帆竞速,百舸争流,谁都有机会。

拓展知识:

纯技术搜索引擎

搜索引擎,是一个为用户需求和问题提供解决方案的平台。搜索引擎是用户主动表达需求的地方,用户来到搜索引擎的目的就是获得问题的解决方案。

搜索引擎已不再是一款单纯的互联网工具,早已发展成为一个为网名生活多方面服务的搜索平台。点开百度首页的“更多”,我们可以发现搜索平台提供的众多服务,有我们熟悉的社区服务,如、百度百科、百度经验、移动服务、百度网盘、百度云、百度地图,导航服务、游戏服务等。从流量占比来看,、百度百科等小频道的流量大于网页搜游的流量。

纯技术搜索引擎

大数据时代,如何帮助用户从海量信息中快速准确搜索到目标内容,就需要搜索引擎。大数据搜索引擎是一个提供分布式,高性能、高可用、可伸缩的搜索和分析系统。 目前常见的搜索引擎技术如下:Elasticsearch、Solr、OpenSearch。

纯技术搜索引擎

搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上采集信息,在对信息进行组织和处理后,为用户提供检索服务,将检索的相关信息展示给用户的系统。它是根据用户需求与一定算法,运用特定策略从互联网检索出制定信息反馈给用户的一门检索技术

纯技术搜索引擎

所谓的搜索引擎其实就是把所有的东西整合到一个平台上面,那你在这个平台上面去搜索的话,就会得到很多的结果和数据。这样的一个工具类的网站就叫做搜索引擎。