Google 网站管理员指南(2)

  • Posted on | Updated on
  • by
  • in

现在我们来讲讲技术层面的东西。在这一部分,Google中文的内容简直是惨不忍睹,我还是链接英文原文,加上我的解释好了,至少看得懂。

Technical guidelines技术指南
大部分的搜索引擎蜘蛛拜访你的网站时候,如同一个文本浏览器,比如Lynx,你可以下载一个Lynx浏览器,看看你的网页在Google蜘蛛的眼中是什么样子。如果由于你使用了Javascript、Cookie、会话ID、框架等复杂的技术,造成在文本浏览器中看不到你希望的样子,那么,显然Google的蜘蛛也看不到。所以要避免这种状况出现。

在Google蜘蛛抓取你的网页的时候,要避免使用会话ID,session ID,这个东西会造成Google抓取网页不完全。

Update:10月25日,Google修改了这条,可以接受参数,尽量简短,不要超过两个,如果可以得话,还是用静态网址的好。

如果你的网站所在的WEB服务器支持if-Modified-Sice HTTP头,那么就打开它,可以告诉Google蜘蛛哪些网页是新的要抓取,那些是旧的不用抓取,这样可以节省你的带宽和服务器开销。

要设置好网站的robots.txt,这个文件是用来告诉搜索引擎的蜘蛛,那些目录可以抓取,那些不可以。要注意的是,确保该文件正确反映你的网站的现状,不要阻止蜘蛛抓取你想给它抓取得目录。你也可以在使用Google Sitemaps的工具来分析。

如果使用了内容管理系统CMS,那么也要确保其能正确导出内容,以便搜索引擎的蜘蛛可以抓取你的网站。

切勿使用"&id="作为网址的参数,因为Google不会在索引中包含这些网页。

从上面的六条内容来看,文本内容很重要,确保您的网站在文本浏览器的样子是你所期望的。
不要使用太多花哨的技术,这样不利于Google的收录。
而且会话ID是Google很不喜欢的。

质量指南
这个质量指南很重要,可是,Google简体中文的译本,再次让我失望,下面简短的两段话,有好几处误译,我都一一给与纠正了,同样,如果你需要看Google的所谓简体中文的内容,发现有不明白的地方,希望对照着他们的英文原文来看,或者对照繁体中文,繁体中文的译本还是比较准确的。

这些质量指南涵盖了最常见的作弊形式或操纵行为,对于未列出的其他误导行为(例如,通过注册知名网站的错拼形式来欺骗用户),Google 同样会予以拒绝。不要抱有侥幸心理,认为某种欺骗手段未在本页中列出,Google 就会认可该手段。作为网站管理员,与其花费大量时间寻找漏洞加以利用,不如尽其所能维护基本原则,以便为用户带来更好的体验,从而使网站获得更高的排名。如果您认为其他网站违反了Google 质量指南,请通过 http://www.google.com/contact/spamreport.html 举报该网站。Google 希望能开发出灵活的自动解决方案来解决上述问题,从而尽量避免来人工一一处理违禁行为。我们收到的举报,将用于创建灵活的算法以识别并阻止以后的其他类似欺诈企图。

质量指南 - 基本原则
1)面向用户来创建网页,而不是为了搜索引擎。如果同一个页面,显示给用户的和搜索引擎的内容不相同,这种欺诈手法称之为“伪装”。
2)要避免为了提高排名而采用一些诡计。一个简单的来判断是否诡计的方法是,您是否可以坦然地对竞争对手说出你的作为。或者您自问如果没有搜索引擎,您是否还会这样做。
当然我看来,这种问法有点问题,必要的针对搜索引擎的手段还是需要的,这种手段只是为了帮助搜索引擎能够更好的找到有用的内容,比如上面提到的Google Sitemaps。
3)很多时侯,需要外部的链接,如果这种链接,纯粹是为了提高排名或者PageRank,那么不会有好处,特别当你链接到一个受到Google处罚的网站时,后果会不好。
4) Google不鼓励大家使用自动提交的程序,当然手工做就没有问题。

质量指南 - 具体指南
这里Google明确列出了几项禁止的做法:
不要使用隐藏文本,隐藏链接,伪装,欺骗性的重定向。
不要向Google发送自动查询。
不要用不相干的词来载入网页。
不创建包含大量重复内容的多个网页,二级域名,或多个域名。
不要含有病毒,木马或者恶意程序。
不要采用针对搜索引擎的桥页。也不要采用哪些所谓联盟计划,因为其中没有多少原创内容,几乎都是复制内容。


作者: David Yin
原载: SEO 网站优化推广
版权所有。转载时必须以链接形式注明作者和及本声明。