百度搜索引擎网页质量白皮书 解析

前沿拓展:

百度搜索引擎网页质量白皮书 解

  前段时间,百度站长资讯发表了一篇文章《世上本没有百度pagerank和权重》,文章中讲述了百度判断一个网站的价值是动态的,由上百种策略组成。不得不佩服百度的这种对网站价值的打分策略,也是相当严谨的。对于百度搜索引擎来说,它能判断了,对于我们站在来说呢?我们如何才能判断一个网站的价值呢?

   靠收录量来判断?

  我知道很多站长都会跟别人交换友情链接,在交换之前,都会先用第三方工具来查询一下网站的一些指标。比如网站收录量,如果我们不用第三方工具查询的,那我们只能用site命令来查询对方网站的一个整体收录情况,而这个site也只是仅供参考,我们无法看到对方的真实索引量,而我们只能借助第三方工具查询网站的索引量,比如站长工具。没有没有百度权重的话,我们仅靠收录量来判断一个网站的价值也是不靠谱的吧?要知道收录的页面多,不代表这些页面有价值的,所以,仅仅靠收录量来判断一个网站质量,是不可取的!

  靠外部链接?

  我们以前在交换友情链接或者分析竞争对手的时候,都会看一下对方的外部链接情况。在几年前,外链为皇的一直是SEO人员默认的一个“规则”。所以大家在分析竞争对手的时候,是比较侧重对方网站的外部链接的。现在百度的外链工具是可以分析竞争对手的外链情况的,但是有时候日期显示不全,也不一定能查询对方的全部外链情况。用domain命令也只是一个参考值。所以,我们在判断对方的网站情况的时候,外链也不足以说明对方网站质量的好坏。

   靠百度快照?

  以前有人在交换链接的时候,会特别注意对方网站的快照情况,很多人到现在还认为网站快照不更新,是对方的网站不好,不能获得搜索引擎的青睐,从而导致网站快照的无法更新。这个可以推荐大家去看一下百度官方发布的一篇文章叫做《关于百度快照问题的若干说明》,这里面讲了百度快照的一些情况。而最能说明百度快照不会影响网站排名的一个网站那就是卢松松的博客了。大家搜索一下卢松松的博客,可以看出他的网站快照日期,依然停留在2013年,但是呢?网站流量依然没有减少,关键词排名依然很不错!所以百度快照也不能说明一个网站质量的好坏。

   我们真的需要百度权重

  当然,我们从网站域龄、网站首页导出链接等单项指标的话,还是不能判断一个网站质量的好坏!那我们需要怎么样判断?其实我们还真实需要一个“百度权重”。因为按照谷歌的PR值来说的话,百度的权重才是衡量一个网站质量的综合指标,如果没有了百度权重,我们根本无法判断对方网站的好坏。

  我们拿不到对方的流量统计账号密码,我们无法了解对方的网站的真实流量,我们所用工具或者一些命令查询的一些指标,也都是一些估算。而我们也只能借助第三方工具来做一下参考!而百度搜索引擎网页质量白皮书提到的那些判断网页质量的方法,只适合优化人员去调整自己的网站,而我们还是相信有权重这一说法的!

  本文由冯东阳原创,转载请注明来自冯东阳博客http://***.com 个人微信号:370415548


原创并不能获得百度青睐

感谢卢松松分享:

百度重内容,阿里重电商,腾讯重社交。从你有自己的网站那一刻起,就注定了未来和百度打交道,正如本文第一句话所讲:百度重内容。而且一而再再而三的告诉各位站长:提供有价值的内容给用户,会获得搜索引擎青睐。这也导致一直以来在站长圈都有这样一个观点:原创就会获得搜索引擎青睐

可事实上并非如此。

在新一期百度站长平台发布的《网页搜索质量白皮书》中,”原创“两字仅出现了一次:

衡量网页质量的维度——内容质量:网页主题内容是网页的价值所在,百度要从以下角度评价网页内容质量:①内容制作成本高低②内容是否有效、完整丰富③是否原创④信息是否真实有效⑤是否权威或投入较多专业的知识和经验⑥是否存在作弊行为

看到了吧只有第三条、四个字,那么百度是如何判断原创的呢?无论是星火计划还是起源算法,都还是起步阶段,百度方面也承认:

识别原创解决原创问题确实面临着很大的挑战,计算数据规模庞大,面对的采集方式层出不穷,不同站点的建站方式和模版差异巨大,内容提取复杂等等问题。这些因素都会影响原创算法识别,甚至导致判断出错。这是摘自《百度给出了判断原创文章的方法,你们感受一下》一文,是官方的说法。

所以无论在白皮书中、还是在站长学院中,百度反复强调的是”高质量内容“而并非”原创“。虽然”原创“是衡量”高质量内容“最重要的一个指标,可无奈辨别能力有限,这也导致大站、历史悠久的站会被率先识别。

另外一个月前卢松松在微博上做过一次小调查:你是关心文章的质量、数量还是是否原创?其实调查的结果在意料之中,虽然倒出了实情,但还是比较桑感的。下面是我找的用户的例子,如果可以也希望大家能发表自己的看法:这里是微博调查地址(新浪)(腾讯),可以去原微博看看。

@木木SEO博客:一直关心内容能否给我带来情感(思维)上的价值或知识上的价值,如果2者都没有,绕道。哪怕最简单一个段子,能让我笑,我就认为好!

@Richard_See:个人注重文章质量和可读性

@张小柳要努力:我觉着用户关注质量、数量,搜索引擎关注原创,短期关注质量、数量,长期还是靠原创,所以都不能放弃吧,最后的最后,互联网的未来,还是原创当道吧

@Mr_吴--:在我看来,原创与否不重要,重要的是文章对我是否有启发或者帮助,所以质量应该是第一位。

@翅膀_Winglala:质量,但前提是我没在别的地方看过

@用生命做花卷:质量一定要过关,更新频率不要太慢,是否原创真心无所谓

@单曲循环丶可好:数量和质量 有时候不是原创,转发的只要是干货,也是很不错的,这样对大众来说,信息面就广了

@子凡张:质量,原创与否不是太重要,重要的是看了这篇文章能告诉我们一个什么理,能学会什么这才是重点

@Maduro:百度其实真挺SB的,有些行业原创纯属扯淡,比如健康类网站怎么原创? 非要逼大家瞎编?

@潘希光:原创只是百度忽悠站长不断构建优质内容的幌子,采集站一样活得精彩

@梦想家张宇豪:新鲜度和质量,原不原创我不是最在乎,关键要对我有用就成。原创是百度给站长洗的脑而已.

@张小柳: 用户关注质量、数量,搜索引擎关注原创,短期关注质量、数量,长期还是靠原创,两手抓,找平衡

@木米S: 质量和数量。能解决问题的就是好的,用户不关注你是否原创。

@行书: 文章字数要精简,不管是否原创。但很反感那些将 “我” 用品牌词代替的软文,不喜欢只讲成功不讲失败经历的事。

写在最后:

至于最终结论如何,我相信各位站长已经心中有数了。

拓展知识: