Recently in Yahoo排名技术 Category
前些日子,我对于投放Alimama是否真的影响Baidu的收录,做了一些小小的比较,其中对于来源于Yahoo的流量增大,有些疑问,之后就有了九月的访问来源分析一文。
为了搞清这个问题,我冒昧请教了车东大侠,称他大侠,是因为他艺高,且乐于助人。
这两天,通过同车东的几封Email的来往,并且把九月的log文件交给他之后,他帮忙做了分析。
车东认为是Awstats6.6把将阿里妈妈的广告也当作搜索来源造成的。
当时我从Awstats的报告中看到的九月份来自yahoo的流量为10,669 pages。
而车东告诉我通过分析Log文件,从中获得如下的数据:
cat *.log|grep -v "#"|awk '{print $(NF -7)}'|grep -i yahoo\.c|awk -F "/" '{print $3}' |sort |uniq -c|sort -rn|more9965 p.mm.cn.yahoo.com
180 seo.g2soft.net
91 search.cn.yahoo.com
15 myweb.cn.yahoo.com
12 www.yahoo.cn
9 hk.search.yahoo.com
7 www.baidu.com
4 my.yahoo.com
4 e.my.yahoo.com
3 yahoo.cn
2 tw.search.yahoo.com
2 business.cn.yahoo.com
1 sitemap.cn.yahoo.com
1 search2.cn.yahoo.com
1 kr.search.yahoo.com
1 cn.f156.mail.yahoo.com
1 clk.mm.cn.yahoo.com
可以看到这个地址,p.mm.cn.yahoo.com最醒目,此地址就是阿里妈妈显示广告的地址,因此得到的结论就是Awstats6.6误把显示在本站的来自p.mm.cn.yahoo.com的广告当成了搜索引擎Yahoo过来的流量了。
这样在车东的帮助下,这个疑团揭开了。在此,再次感谢车东。
如果你有关心过Yahoo的搜索,那么这个Site Explorer,站长中心你一定用过。
最近Yahoo在这个站长中心中新添加了一个工具,还是Beta版,就叫做Dynamic URLs。
动态网址中总是有多个参数,其实很多有不同参数的网址指向的都是同样的内容,也就是所谓的同内容无关的参数。在没有这个功能前,搜索引擎可能会把指向相同内容的不同动态URL都进行索引,然后就产生了同一网站内的重复内容问题。为了解决这个问题,Yahoo就引进了这个功能。
目前通过这个工具,站长可以完成两种任务。
第一种任务:把类似下下面这样的网址都改写成统一的网址,其实质就是去除会话ID,因为每个注册用户访问这个网站都会产生一个session ID,而这个ID对于页面的索引是没有用处的。
http://example.com/store?prod=1&sid=23yadh56 ==> http://example.com/store?prod=1
http://example.com/store?prod=1&sid=2jrwe89k ==> http://example.com/store?prod=1
第二种任务:用默认的参数来代替表示访问来源的参数。
http://example.com/blog?src=rssfeed ==> http://example.com/blog?src=yhoo_srch
http://example.com/blog?src=footer ==> http://example.com/blog?src=yhoo_srch
如何使用这个功能呢?让DavidYin来简单介绍一下。
Yahoo的官方Blog发布的消息是Introducing Robots-Nocontent for Page Sections,这个消息对于做SEO相关工作的朋友是一个信号,就是可以添加一个Robots-Nocontent标签在网页代码中,以标识那些与网页主要内容无关的代码。
这些所谓与网页主要内容无关的部分,包括导航栏,菜单等部分。甚至可以把网站都可以表示出来。
标签的用法如下:
<div class="robots-nocontent"> This is the navigational menu of the site and is common on all pages. It contains many terms and keywords not related to this site</div>
<span class="robots-nocontent"> This is the site header that is present on all pages of the site and is not related to any particular page</span>
<p class="robots-nocontent"> This is a boilerplate legal disclaimer required on each page of the site</p>
<div class="robots-nocontent"> This is a section where ads are displayed on the page. Words that show up in ads may be entirely unrelated to the page contents</div>
这个标签影响只限于Yahoo对网站内容的分析和排名,对于链接的权重传递,没有影响。
对于链接有影响的标签是rel=nofollow标签。
今天在SEO 网站优化推广的主页,以及单页归档里都加上了,Yahoo Badge,这是一个小玩意儿,就是显示有多少个链接指向了该网页,或者该网页所在的网站。
从下面的截图可以看到,指向本站首页的链接有8200个。

这不是一个静态数字,随着Yahoo的蜘蛛在网络上爬行,抓取到更多的链接,会适时的反应在这个标志上。
接下来看看如何设置:
首先要用你的Yahoo ID登录到你的site explorer,当然你一定已经设置了自己的站点,在右上角有个Badge的链接,点击进入设置页面。
里面分三步,首先是选择是基于页面还是基于网站;然后是选择是大Badge还是小的,这个根据你的网页所留的位置而定;最后一步是复制代码,然后粘贴到网站的适当位置。
设置是相当的简单。
这样在你的网页上就可以显示当前的链接数了。
观察导入链接的数量变化,可以看出Yahoo收录的情况,也可以看出自己网站的exposure有多大。
Yahoo有自己的网站管理器(site explorer),就如同Google的站长工具一样,可以提供给站长一个可以提交自己的网站和分析自己网站收录和外部链接的地方。
现在的好消息就是,Yahoo同Google使用了相同的协议,sitemap可以使用一样的格式。这样站长不用为不同的搜索引擎编写不同的文件,而只是为了满足他们不同的格式壁垒。有时对于用户来说,标准是个好东西。
简单的拿本站为例子,说说如何看这个site explorer,关于如何提交网站和确认网站本文不赘述了。
本站目前共172篇文章,收录页面共183个,其中包含首页,和部分归档页面和工具页面。可以认为是全部收录了。

从截图中可以看到,流氓虹事件被yahoo认为很重要,排在了第一位和第二位,有趣的是Google也是这样认为的,该页面的PR是3,等同于本站的PR值。或许Google和Yahoo同我英雄所见略同吧。怪不得当年虹对于SEO是那样的反对。揣度这种卑劣之人,我是不吝惜的,看来当年她是做过某些作弊手法而最终被惩罚,所以对那些以合理方法作推广的人们是那样的痛恨。
从每个页面的详细信息里,你可以看出网页被Yahoo认为是那种语言,如英文还是简体中文,当编码不正确时,可能会出现语言错误,这是网页编写的小细节,可是却很重要。一般而言,我总是使用UTF-8作为编码,这样无论是中文,简体或是繁体,还是英文,都不会出现差错,而用户也能够很好的使用,同时也推广了标准化。
在页面信息里还可以看到,最近被抓取的时间。
对于分析链接这个重要优化任务来说,下面的inlinks非常之要紧。
点击Inlinks,之后在下面的下拉菜单中选取"Except from this domain",这样下面显示的将是所有的外部链接。请看下面的截图:

可以看到从其它网站的页面指向本站的链接,从哪里来的,质量如何,你都可以跟踪回去。
从这里的排名,可以看出下面几点有关:
网站之间内容的相关性;
网站的重要性;
链接保持的时间;
找到优质而又内容相关的网站,建立有效的联系(链接)是如此的重要,而分析现有的链接,去掉那些不好的链接,改善链接的离散度,都有利于网站排名。
来自Yahoo,Google和Microsoft的消息,三家联合推出了sitemaps的标准,基本上是基于Google Sitempas的。
现在三家搜索引擎公司,都支持一样的标准,给了站长们很大的便利,不必使用不同的标准,做不同的文件了,只要一个Sitemaps文件,就可以涵盖了。
如果你的网站还没有一个sitemaps文件,那么就可以赶快动手了,这里有自动生成sitemaps的方法。
而且还有一个新的网站sitemaps.org负责公共的sitemaps的事宜。
在Google Sitemaps提交的方法,DavidYin已经提到过。
而在Yahoo提交的方法,相对来说也是很简单的,只要你用过他们的Site Explorer,而且提交过feeds文件,相信你不会陌生,把sitemaps文件同feeds文件一样提交就可以了。
Baidu的口号是:
全球最大的中文搜索引擎。
这样的称呼似乎是比较贴切的。可是有个问题,是否属实,还要小心求证。
所谓最大,就是收录的数目最多,用户最多,我相信,用户最多是可以说的。
就是讲,Baidu是人们搜索中文内容时,使用人数最多的一种搜索引擎。
至于是否收录中文网站数目最多,则未必,因为中文还包括简体,繁体,你总不能说繁体不算中文吧?
下面我做了一点小测试,供参考:
测试平台,Baidu搜索 Vs Yahoo奇摩搜索(雅虎台湾)
测试搜索发出的IP位置,北美。
简体测试词
1)上海机票
百度一下,找到相关网页约1,580,000篇,用时0.067秒
上海机票搜尋結果約18,000,000個,以下為1 - 10個 ,共花0.61秒
第一行是百度的结果,第二行是Yahoo的,下面的搜索相同。
这个结果有点出乎意外,似乎台湾的朋友比大陆的人民更重视上海机票。
2)台北101
百度一下,找到相关网页约313,000篇,用时0.064秒
台北101搜尋結果約1,600,000個,以下為1 - 10個 ,共花0.04秒
这个结果不奇怪,毕竟这个地标是在台北。
3)涮羊肉
百度一下,找到相关网页约730,000篇,用时0.044秒
涮羊肉搜尋結果約421,000個,以下為1 - 10個 ,共花0.60秒
这个时及其本土的关键词,相信使用的人也是国内,大陆的人居多。
让我们再多作些测试,看看用Baidu热门的关键词来比试一下。
Yahoo昨天发布的消息,开始支持 NOOPD 标签了。
具体的使用方法,就是在文件头部添加下面的代码:
<META NAME="ROBOTS" CONTENT="NOODP">或者
<META NAME="Slurp" CONTENT="NOODP">
这样,Yahoo收录你的网页后,显示在搜索结果时,就不会采用ODP的标题和说明了。
Yahoo的消息看这里。
如果想用Yahoo查看一个网站的反向链接,你可以用这样的命令:
http://www.example.com -site:example.com
用你想要查询的网站的网址来替换上面的example.com
如果你只用http://www.example.com来查询,其结果会包含许多内部链接,无法看出实际的外部链接。
通过这个查询,可以用来查询自己所优化网站的反向链接,也可以用来查询你的竞争对手的反向链接。








