Google搜索在最近发生的故障

很多人没有注意到Google Search在九月二十五日到十月一日的时候曾经发生过把旧的Index数据拿出来用,而且不是一点点旧的数据,是很久之前的数据。DavidYin也是刚刚发现,这些旧的收录信息可以追溯到今年四月。

看看我是怎样发现的吧。
今天在看Google Sitemaps的Crawl errors之Web crawl部分,在 Not found部分有许多无法找到的网页信息。

通过选择日期范围,我把无法找到网页的这个现象所发生的时间,给确定在九月二十五日到十月一日。在这日期之前和之后都没有类似的现象。

因为那个网站在四月份的时候有过一次大的改版,很多网页都移动了位置,之后Google搜索已经把改动的网页都收录了,而且把旧有的索引都不再使用。

而这次发生找不到网页现象的那些网址都是在四月改版之前存在的,之后就没有的网页。

相信是在Google升级它的数据中心架构时,发生的故障,或者是Bug。
估计只有一两个数据中心牵涉其中,因为还有许多访问是正常的。

再回头看看那几天的统计数据,有较大的波动,包括用Google Analytics和Awstats的统计同样显示了这个现象。

根据我的判断,这个应该不是数据中心的数据进行更新所发生的问题,而是数据架构进行升级所造成的。

因为从四月以来的几次数据更新,都没有发现类似现象,只有这一次发生了这种问题。