Zac:Google补充材料的再思考

编辑:Discuz论坛 发布于2019-06-16 20:10
齐宁:如何面对搜索引擎降权
最近这段时间因几个客户的网站连续出现问题,被BAIDU进行降权,甚至被封杀。对于这些出现的问题,我非常的不理解。这些客户并没有进行恶意作弊,优化也是很正常

自从Google取消补充材料标记后,关于补充材料的讨论沉积下来了。Google只是取消了在搜索结果中标注补充材料,补充材料以及补充索引还是存在的,只不过我们不能直接看出来了。

在经过一段时间的思考后,今天谈谈对补充材料的更进一步熟悉。

以前我曾经觉得补充材料和补充索引的引入,很有可能是因为想节省带宽。但Google最近表明,补充索引中的网页抓取和更新频率加快,补充索引中的网页出现在搜索结果中的机会也提高,说明不是为了节省带宽。

结合一些其他方面的观察,我现在觉得补充索引是为了提高搜索速度。在搜索某些要害词时,Google可能只搜索主索引,忽略补充索引里的结果,这样能大大提高速度。搜索所有要害词都在抓取的所有页面索引中寻找结果的话,那计算量必然使返回结果的速度减慢。

挑出一部分权重高的网页进入主索引,把其他权重低的归入补充索引,可以大大提高计算速度。有的时候主索引中结果不足,才去补充索引中寻找结果。至于在什么情况下才会触发去补充索引中寻找网页不得而知。

以前补充材料被关注的时候,就有朋友认为补充材料并不可怕,因为不少要害词搜索结果中,列在前面的也包含很多补充材料。我想这种观察是错误的。

举一个例子。现在无法准确判定哪些页面是在补充索引中,所以我拿以前谈补充材料时一个帖子的抓图来看点石论坛的一个页面。

点此在新窗口中查看原始图片

这个页面http://www.dunsh.org/forums/thread-6462-1-1.html,当时是在补充索引中的,我判定现在也还在补充索引中。首先这个网页肯定存在于Google的索引库中,我们可以从Google快照中证实这一点。

假如我们在点石域名内搜索网页标题 发帖人史安牛的名字,可以发现Google返回结果中包含这个网页,排在第二位。但是假如我们搜索帖子中的第一句话 史安牛,Google显示没有相匹配的文件。要注重,实际上在Google数据库中,确实存在相匹配的文件,从上面的快照和搜索中可以看出。

假如我们不限定在点石的网站内搜索帖子的第一句话 史安牛,也可以看到这个页面不被返回。但是假如我们搜索帖子中的第二段的一句话 史安牛,又会发现这个网页可以被返回。结论是Google确实有两个索引,主索引和补充索引。在补充索引中的网页有时候在某些要害词下,根本不参与排名。就算已经被收录,网页中有这个要害词,而且没有其他匹配文件的时候,这个网页因为是存在于补充索引中,所以根本不会被返回。