mamma搜索引擎(mamma mia下载)

前沿拓展:

mamma搜索引擎

元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。著名的国外元搜索引擎有InfoSpace、Dogpile、Vivisimo等(元搜索引擎列表),中文元搜索引擎中具代表性的有比比猫搜索引擎、搜星搜索引擎。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo。
国外对元搜索的开发应用很早,目前在美国使用元搜索引擎和使用Google一样普遍,当然Google仍然占据美国绝对市场,但元搜索引擎也一样生机勃勃,财源滚滚。相比国内,起步很晚,中国首家元搜索引擎是比比猫(bbmao),于2005年成立,在2006年获得Red Herring 亚洲100强奖,从而拉开国内对元搜索的真正关注和探索。比较优秀的元搜索引擎有搜魅网(someta),整合了百度、谷歌、雅虎等多家主流搜索引擎的结果,并且独创网站查询。
整体来讲,国外元搜索引擎已自成体系,而国内真正长期坚持致力于开发独特用户体验的元搜索网站并不多。
主要元搜索引擎列表
国内: ·搜魅网(someta)
集合了百度、google、搜狗、雅虎多家主流搜索引擎的结果,提供网页、资讯、网址导航等聚合查询。另外,搜魅网突破了元搜索引擎没有自己的蜘蛛的瓶颈,提供了网站查询的功能。
·比比猫(Bbmao)
独创国际领先的聚类和去重技术。搜索结果汇集各大搜索引擎结果,搜索结果智能分类整理,去掉重复搜索结果,并拥有直接搜寻文档和强大网络收藏夹等多元功能。对于记者、教授、高管等知性、高端且惜时如金的人群比较适用,支持中英文搜索。
·全博元搜索(QOOPOO)
聚合搜索的力量,已经运行多年,2006年格林斯潘曾接触这家公司,后劲比较强劲。
·Xooda元搜索引擎
支持本地搜索,一次输入,返回多个搜索引擎结果,并对结果进行重新的优化排序。
·佐意综合搜索(Chinazss)
集主流搜索引擎为一体,分类详细,强大的搜索功能。让搜索变得更方便!国外: Vivisimo:是美国Vivisimo公司最新开发的一个具有对搜索结果自动进行分类功能的搜索引擎!它能非常快速地将不同类型的网站进行分类整理并将结果呈现在你眼前! 它在搜索结果页面左侧增加了一个搜索结果目录栏。不足之处在于搜索结果精准度不是很高。
ProFusionProFusion:是并行式元搜索引擎,拥有智能化的搜索技术、对查询的实用提示和非常宝贵的个人化搜索服务,它是很优秀的元搜索引擎,可同时调用9个独立万维网搜索引擎—AltaVista、Excite、HotBot、InfoSeek、Lycos、Magellan、OpenText、Webcrawler和Yahoo。
MetaCrawlerMetaCrawler:是独立万维网搜索引擎WebCrawler的姐妹引擎,也是一个并行式元搜索引擎,它条理清晰,组织结构完美,可以同时调用AltaVista、Excite、Infoseek、Lycos、WebCrawler和Yahoo 6个独立引擎,是简单搜索或中度复杂搜索的最佳网点。
DogpileDogPile:是性能较好的并行式元搜索引擎之一,它可以同时调用Web搜索引擎、Usenet搜索引擎和FTP搜索引擎等25个搜索引擎,其中,Web搜索引擎14个。
DigisearchDigisearch:是能同时调用独立搜索引擎较多的并行式元搜索引擎,它可以同时调用AltaVista、 Excite、 Infoseek、 Lycos、 WebCrawler、 Yahoo、OpenText和 Magellen等 18个独立万维网搜索引擎,DejaNews等3个Usenet搜索引擎和Fourll等3个个人信息和商界信息搜索引擎。
Highway61Highway61:是并行式元搜索引擎,可以同时调用AltaVista、Excite、 Infoseek、 Lycos、WebCrawler和Yahoo等6个独立引擎,并将它们传回的结果进行排序,显示给用户。
MammaMamma:是并行式元搜索引擎,它自称是所有搜索引擎之母(Mother of all Search Engines),它可以同时调用AltaVista、Excite、Infoseek、Lycos、WebCrawler和Yahoo等独立引擎,并且可以查新闻组、商业黄负和发布新闻。


数量的数据需要搜索引擎去索引,索引后还是海量的数据,要能精准搜索到自己需要的信息,需要遵循一定的技巧和方法。

1 什么是搜索引擎

搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。百度和谷歌等是搜索引擎的代表。

2 Web信息资源的特性

海量规模;

分散无序;

动态更新,不稳定;

种类或形式多种多样;

非结构化或半结构化;

主义冗余、质量缺乏控制;

需求和使用方式个性化;

3 搜索引擎的发展

早期的搜索引擎:早期以AltaVista、Excite为代表,用于自动采集网页的“机器人”程序相对较弱,一般只对网页的标题、URL等信息进行自动索引,对返回的检索结果有时也不排序;

全文搜索引擎的普及:对网页的全文进行自动采集与索引,支持全文检索;

4 搜索引擎的分类

4.1 按内容或数据收录的范围分

4.1.1 综合类搜索引擎:如google、百度;

4.1.2 专业类搜索引擎

也叫垂直搜索引擎,是针对特定的行业、领域、主题的专门搜索引擎。由于只面对一个方面,垂直搜索提供的结果更加专业、深入、具体和有序。如mp3搜索,结果全是歌曲,有歌词,能方便地试听。除mp3搜索外,常用的有图片搜索、视频搜索、新闻搜索。如果想找图片、视频、了解新闻,那么直接用相应的垂直搜索无疑更高效。如,Business

4.2 按信息的组织方式或检索方式分:

4.2.1 索引式搜索引擎:如google、百度;

4.2.2 目录式搜索引擎:Yahoo Galaxy go.com goguides

4.2.3 元搜索引擎:万纬 MetaCrawler Mamma Search Dogpile ixquick; fefoo limmz

4.2.4 终端元搜索引擎软件:WebFerret 飓风

4.2.5 集合式搜索引擎:该搜索引擎类似元搜索引擎,区别在于它并非同时调用多个搜索引擎进行搜索,而是由用户从提供的若干搜索引擎中选择,如HotBot在2002年底推出的搜索引擎。

4.2.6 门户搜索引擎:AOLSearch、MSNSearch等虽然提供搜索服务,但自身既没有分类目录也没有网页数据库,其搜索结果完全来自其他搜索引擎。

5 计算机检索技术

5.1 布尔逻辑检索:严格意义上的布尔检索法是指利用布尔逻辑运算符连接各个检索词,然后由计算机进行相应逻辑运算,以找出所需信息的方法。它使用面最广、使用频率最高。布尔逻辑运算符的作用是把检索词连接起来,构成一个逻辑检索式。

5.2 截词检索(truncation searching):用截断的词的一个局部进行检索,并认为凡满足这个词局部中的所有字符的资料,都为命中的资料;截词是指用符号代替变化的部分。如“system?"、"comput?"、"wom?n"、"?ology";

5.3 字段限定检索(limit searching):限定在数据库记录中的一个或几个字段范围内查找检索词;

5.4 词位置检索:指限定检索词之间的位置关系;(proximate searching)

5.5 聚类检索:首先要把将全部资料按相似度进行聚类归档,检索时直接在类目内匹配;

5.6 相关反馈与提问式扩展技术:指系统对检索词进行适当的修正后再进行检索;

5.7 可视化检索技术:对检索词构造、检索过程、检索结果都可考虑可视化;

6 搜索相关名词

6.1 网页快照:是搜索引擎对该链接有效时在其服务器做的一个备份;

6.2 高级搜索:可以让我们不输入搜索引擎的语法就能使用搜索引擎支持的很多功能,以缩小搜索范围、提供更精确的搜索结果。成为搜索高手1|认识搜索引擎SearchEngine

6.3 搜索结果页:用户在输入关键词,单击搜索按钮后,搜索引擎进入的页面,显示出根据关键词做出的搜索结果列表。每一项内容一般包括统计行、网页标题、网页摘要、网址、网页快照等内容;

6.4 搜索语法:利用语法可以进行更复杂的条件搜索,可大大提高搜索的效率和精度;需要注意的是,所有搜索引擎可能有一些共同的语法规则,也有自己的规则,另外,随着某一搜索引擎的发展与完善,自身的语法规则可能也会有不断的更新和完善;

6.5搜索引擎默认搜索类别,“网页”:其实是搜索综合的内容,包括文本、图片、视频、音频等,网页是网络基本的单元,一切内容都可纳入其中;“网页”搜索内容全面、丰富、包罗万象,但往往也需要更多的时间去筛选需要的内容;与之相对应的是垂直搜索(也叫分类搜索,对应于搜索引擎上的其它选项卡),由于只面对一个方面,垂直搜索提供的结果更加专业、深入、具体和有序。

7 Google的服务器规模

谷歌的神秘面纱包括:一、软件 二、硬件 三、集群平等处理机制。

谷歌软件的3个核心要素:谷歌文件系统、谷歌的分布式存储系统和处理庞大数据的程序设计模式。

硬件却是一般的服务器、处理器、硬盘和内存等。

服务器的集群能在半秒之内回应700至1000台服务器的处理搜索请求。

Google作为全球排名第一的搜索引擎,面向全球提供多语种的搜索服务,由其服务器规模,可以想像全球的数据规模的大小。

7.1 谷歌每天需要存储惊人的数据量,需要上述的硬件增加和软件匹配;

7.2 谷歌在全球多个一线国家和地区都有数据中心,只是规模有所区别而已;

7.3 谷歌到底拥有多少台服务器?谷歌一直以来是秘而不宣,估计总共应该是千万台级别的服务器规模

7.4 需要足够的电力,其产生的热量也是惊人的,所以要需要先进的冷却技术。

成为搜索高手1|认识搜索引擎SearchEngine

成为搜索高手1|认识搜索引擎SearchEngine

成为搜索高手1|认识搜索引擎SearchEngine

成为搜索高手1|认识搜索引擎SearchEngine

成为搜索高手1|认识搜索引擎SearchEngine

成为搜索高手1|认识搜索引擎SearchEngine

-End-

拓展知识:

mamma搜索引擎

MetaCrawler:提供涵盖近2 0个主题的目录检索服务, 包括常规检索、高级检索、定制检索、国家或地区的资源检索等。其中, 高级检索模式可实现搜索引擎的选择调用, 基于域名、地区或国家的检索结果过滤, 最长检索时间设置, 每页可显示的和允许每个搜索引擎返回的检索结果数量的设定, 检索结果排序依据(包括相关度、域名、源搜索引擎)设定等 Dogpile:它首先并行地调用Google、Yahoo、MSN、Ask Jeeves等4个源搜索引擎, 如果没有得到1 0 个以上的结果, 再调用另外的搜索引擎。但Dogpile不提供可调用的源搜索引擎列表,不支持对各个源搜索引擎的自行指定和选择。
Mamma是并行式元搜索引擎,自称为“搜索引擎之母”。可同时调用7个最常用的独立搜索引擎, 并且可查询网上商店、新闻、股票指数、图像和声音文件等资源。其特点是检索界面友好, 检索选项丰富,主要包括可控制调用的独立搜索引擎、选择使用短语检索功能、设定检索时间、设定每页可显示记录数等。
Ixquick 最大优点是支持中文检索。支持各种基本的和高级的检索功能, 包括关键词检索、短语检索、截词检索、布尔逻辑检索、概念检索、自然语言检索、指定字段检索、包含(+ )或排除(一)检索等。
Clusty
Clusty将用户搜索的关键词到各大搜索引擎查询,然后比较返回的结果,根据比较排名生成一个列表。这样的“元搜索”方式可以帮助将最好的搜索结果提升到页面上部而将搜索引擎的垃圾搜索结果调整到底部去。Clusty不但能够根据搜索的关键字进行Tag匹配,按搜索引擎索引,按域名分类等等功能,同时还在搜索结果列表中可以选择页面内预览的功能。
ZapMeta
ZapMeta是一个元搜索引擎,这意味这着,用户可以在同一个搜索引擎上搜索来自多个地区的多种信息。ZapMeta得到的搜索结果通常是从AOL、谷歌、雅虎、Ask等网站筛选的。ZapMeta的页面简单而整洁,还可以直接在搜索栏下的选项设置个人偏好。
Kartoo
Kartoo一个可视化搜索引擎,利用FlashPlayer展示搜索结果间的关系,也实现了信息的可视化表达、具有传统搜索引擎无法比拟的优势。搜索时,输入相应关键词,它会找出与这些关键词相符和的网站,然后以flash的形式显示这些网站及站点间的关系,你可以用擦除键添加键来擦除或添加某些搜索的结果,也可以保存自己的搜索结果及email给自己的好友,分享你的搜索。
Mamma
Mamma是一个很好的,坚实的元搜索引擎,提供快速和优秀的搜索选项。目录检索结果Mamma从大约12个主要互联网搜索引擎和和有一些很好的额外的搜索功能,是值得一试。Mamma的主页非常简洁,选项较少,可以一目了然。
Ixquick
Ixquick具有同样元搜索的特点,连接着搜索引擎和网络用户的信息桥梁。Ixquick是一个不保留搜索历史的搜索引擎,这能确保用户信息的安全,Ixquick会在48小时内删除用户搜索的信息,甚至连政府也需要,也没有什么信息可以提供。
SurfWax
SurfWax有一个其它元搜索引擎没有的独特功能,即点击每条结果左边的“网址揿钮”图标,可浏览该结果包括的任何页面,并显示搜索语句在文件中的位置。可以把搜索结果和文件存储起来以备后用。
Yurnet
Yurnet在技术上被认为是一个元搜索引擎,因为它编译引擎的结果从几个不同的搜索中获得。在搜索关键词时,Yurnet会提供一个跳点到Web浏览。用户还可以使用大约35种的不同搜索去查询。Yurnet会提供给你一个很好的搜索体验。

mamma搜索引擎

searx算不算?不知道duckduckgo算不算