Google用来判断复制内容的几种可能的办法

我曾经谈论过垃圾站的25个特点,也认为搜索引擎的确会对复制内容进行惩罚
而同样的文章内容,在不同的站点上,如何判断哪个是原创,那个是转载的呢?

我提到过用TrustRank来判断,就是不同的站点有不同的信用度,当同一篇文章在两个不同信用度的网站上出现时,信用度高的那个站点的文章排名高的几率大些,因为还要考虑其它的因素。

比如,文章里有说明是转载自某个出处的,并且给出了链接到原始页面,那么Google就能判断出那个页面是复制内容了。转载他人的文章时,找到原始出处,并且给与链接到原出处,是一个好的习惯,也是对原创者的尊重,就像写Blog时,提到别人的Blog,要做适当的trackback一样,是拓展联系,以及说明文章之间关系的好习惯。

还有,如果有两个页面的内容相同,也没有互相链接,那么有更多外链的那个页面,会被认为是原创的,排名也有较大机会靠前。
通常原创的内容获得更多外链的可能性更高,同TrustRank的道理一样,更多原创的站点会受到较多的关注。用户总是喜欢看一手资料,而不是二手,三手的,如果他们能够找到原作的话。

而上面我所提到的链接,都是指的有质量的相关的链接,不是无关的垃圾链接,垃圾链接再多,也是没有多大用处的。

在Google的搜索结果里,复制内容有很大的机会掉进补充内容的里面,还有一个机会就是从搜索结果里直接过滤掉。

采集站点很多时候都无法获得长期的好的排名,就算能够暂时得逞,终究还是会收到惩罚的。