复制内容时常会出现在不同的网站,或者同一个网站上。
虽然现在还有些人认为搜索引擎无法发现复制内容,所以就疯狂采集,不断的复制那些内容重复的网站。这里我就不解释搜索引擎是否能够发现,是如何发现复制内容的了。
首先要澄清一点:
搜索引擎对于复制内容的确是存在惩罚措施的,特别是那些内容完全一样的站点,或者是在一个网站内,内容完全一致的页面。
再要澄清的一点:
所谓惩罚,是指搜索引擎会认为这些网页是违反了搜索引擎的服务条款,或者是站长指南,采取了使这些网页更少的出现在搜索结果里的措施,有时甚至会把这些网页从搜索引擎的索引中去掉。所谓被搜索引擎踢出来,就是这样。
很多做内容采集的人,会把某个内容很好的网站,全站采集,做到自己的网站里,在最初的时候,看到Google,Baidu收录了几万,几十万的页面,之后在很短的时间里,很多收录都消失了,只剩下几个,十几个页面。这就是内容重复,复制内容的惩罚在起作用。
这不是因为你的内容不好,而是采集惹得祸。
也有一些站长在那里争辩说,那些搜索引擎是如何知道相同内容的页面里,哪个是原创内容,哪个是复制内容呢?
我告诉他们,对于站长来说很难的事情,其实对于搜索引擎来说一点也不难。
搜索引擎,特别是Google,对于每个站点都有一个信用评价,这不是PageRank,而是TrustRank。一个新站点的信用评价比较低,这些TrustRank需要慢慢积累的。那么当相同的内容出现在两个站点的时候,高TrustRank的站点排名可能会比较高,这里讲可能是因为排名还有其他因素影响,如果不考虑其他因素,那么就一定高过低TrustRank的站点。
在这里David Yin只是希望告诉那些还在专注于采集的站长,从迷思中走出来,回到创作内容的原点,唯有不断创新才是网站的出路。