垃圾站的简单定义

我曾经谈论过什么是垃圾站,当时是根据Webmasterworld上的文章,给出了25种会被认为是垃圾站的情况。现在我要更为深入的来谈谈这个问题。

首先垃圾信息在英文中的说法是,spam。

那么垃圾站同垃圾信息有什么关系呢?简单的说,充满垃圾信息的网站,就是垃圾站点。

所谓垃圾信息分很多种,让DavidYin来一一说明。

1)内容垃圾
×有很多的隐藏文字
×关键词堆砌
×meta标签的堆砌
×门页
×通过采集Google的搜索结果,或者他人网站的内容,专门做成一个网站,只是为了在上面投放Google AdSense广告,或者其他的广告,所谓Made for AdSense的页面。通常这种网站充满了广告,或者会把用户重定向到其他的网站。

2)链接垃圾
×链接农场,就是把一堆网页互联。
×隐藏链接
×用不同的域名创立一群网站,或者是在各大Blogger网站申请Blog,互相链接,来提高链接数。
×通过在wiki类网站上建立指向自己网站的链接,通常这些链接所在的页面的内容同所指向的网站无关。
×在他人的Blog上留下无关的链接,或者是留言,或者是trackback
×购买过期域名,利用惯性流量指向自己的网站。

当然还有其他的一些比较复杂的垃圾链接的手法,就不讨论了。

在我看来,垃圾站,就是违反Google的网站质量指南的网站,因为上面的几点同Google的质量指南中所指出的几点基本吻合。而最近的Zac对Google的Matt Cutts访谈时,Matt回答的也是同样的答案。
当站点违反我们的质量指南时,Google称为垃圾(spam)。
---垃圾站的定义,就是这么的简单。

趁着这个机会,我也要澄清一个观点。
采集站是否就是垃圾站?
我的看法是不是,这两者不能画上等号。
在周五同网鹰,国宝讨论时,我们的看法也比较一致,采集并不是判断网站是否垃圾的一个标准。当然有相当一部分的采集站,就是垃圾站。判断采集站是否是垃圾站的一个重要原则,就是看站长是否在采集的基础上提供了附加的价值。
比如Google,作为一个搜索引擎,他的内容都是蜘蛛四处抓取回来的,同样也是采集,为什么没有人认为它也是采集站呢?因为它在采集的基础上,分析整合数据,提供给用户的是精准的搜索结果。它提供的是一种服务,而不是内容。

让我来做一个简单总结:

垃圾站的简单定义:违反Google的网站质量指南的网站。
垃圾站的直接目的:欺骗搜索引擎,以获取不符合实际的好排名和大量来自搜索引擎的流量。

垃圾站的间接后果:破坏搜索引擎的排名,影响了搜索的结果,危害了遵守网站质量指南的站长的利益。


最后提供几个报告垃圾网站的地方:

* Google搜索结果 中发现垃圾网站
* Yahoo! 搜索结果 中发现垃圾网站
* MSN 搜索结果中发现垃圾网站

注:本文的部分内容参考了维基百科的相关内容。