Results tagged “统计”

Google Analytics新代码对Baidu统计不准

之前有比较分析过Google Analytics和Yahoo统计对Baidu搜索引擎流量的统计。开始怀疑Google Analytics新代码对Baidu流量的统计失去准确度,有丢失数据的可能。

在1月21日,DavidYin把本站的Google Analytics统计代码用旧的代码替换了新的代码,随后,Baidu搜索在Google Analytics统计中的表现就发生了不同。

首先看看Yahoo统计的结果。
yahoo_tongji_jan_change.gif
来自百度的流量上下波动,很规律。

接下来看看Google Analytics统计的结果。
google_analytics_jan_change.gif

注意看那个点,我注明了是21日,就是把旧代码换上的时间点,那天统计到的Baidu的流量就开始上升,之后回到了之前的大致范围,在200多一点,然后又出现了一个小小的滑落,到昨天,又回到了200多。可是并没有跌落到之前新代码时期的50左右。

阅读全文

难道本站被百度降权了吗

这几天通过Google Analytics的统计,看到本站来自百度,Baidu的流量大减,当然原来就不多,不过是从比例上减少了很多。

首先用Site命令看看。
有2070个页面收录。其中有些页面是之前本站使用MovableType 4.01之前的按日归档页面,现在已经放弃了。
收录的情况还好,没有什么问题。

目前DavidYin使用两个统计工具,一个是Google的Analytics,一个是Yahoo的统计。
首先看看上个月(2007年12月)的数据。
Google Analytics
google_analytics_dec.jpg

Yahoo统计
yahoo_tongji_dec.jpg

两者的统计数据是相近的,趋势一致,没有什么问题。从百度来的流量稳定。

然后我们来看看今年一月一日至今的数据:
Google Analytics
google_analytics_jan.jpg

Yahoo统计
yahoo_tongji_jan.jpg

通过这两张图的比较,可以看到一些诡异的东西,Yahoo统计得到的数据表明,这个月的每天从百度过来的流量通上个月差不多,没有什么变化都在200至300之间。而Google Analytics得到的数据却显示从2007年12月31日开始,百度流量出现大的滑坡,从200多降到60左右。

这样不一致的统计结果的确让人质疑,哪个才是正确的。

Ok,我还有服务器日志可以看,我使用的是Awstats日志分析软件。
从一月一日到今天的日志分析来看,Baidu仍然是最多的。

阅读全文

Alexa不再提供重定向吗

这几天已经观察到一个现象,Alexa的重定向网址,似乎停止运作了。billyben也留言提醒了我。

之前在提高Alexa排名的九个方法中,DavidYin曾经提到过第五个方法。

5)使用Alexa重定向功能,当你留言的时候,可以留下这样的链接:
http://redirect.alexa.com/redirect?seo.g2soft.net
当用户点击这个链接的时候,就相当于给你的网站添加了一个PV,并且被Alexa统计到,哪怕他用的浏览器根本没有Alexa。

现在当使用这个方法来访问的时候,Alexa给出的是一个404错误。

在进行了一些调查后,看到网络上有很多不同的猜测。
有的说是Alexa为了减少服务器负荷,因为重定向浪费了很多带宽。(我不能苟同这种观点)
有的说是Alexa为了提高其统计的准确度。

我给大家的建议就是,尽快的把你的网站上有关的重定向,修改为你自己的直接链接。

一个网站出现过多的404错误,从搜索引擎的角度来看绝对是一个负面的印象。
什么时候Alexa再恢复提供这个服务,我会及时报告的。

阅读全文

SEO 网站优化推广的收录排名情况 - 2007年十月

七月的收录情况后,又是三个月过去了,今天接着看看本站收录排名的情况。

截至到今天为止,SEO 网站优化推广共有文章379篇。

首先是收录数量:
Google: 804页面
Baidu: 491页面
Yahoo.com: 870页面
Yahoo.cn: 802页面
Sogou.com: 720页面
msn.com: 2980页面
yodao.com: 2460页面

1)Google搜索,是Google.com中文结果
用“网站优化推广”,本站首页排在第一。
用“网站优化”,本站首页在第46。比七月的57好一点。
用“seo”,本站首页排在第26,排名下降。

2)Baidu搜索
用“网站优化推广”,本站首页排在第一。
用“网站优化”,本站首页在第4。
用"网站推广",本站首页在第10。
用"seo",本站首页在第16,排名下降。

总的看来,排名略有下降,变化不大,当然同我的期望有落差,原因有三,一是在八月,几乎没有更新,因为我放假一个月;二是自我感觉内容质量不高;三是算法有所调整,需要等待。

在以后的一段时间,会较少更新,或者更新不够规律,因为会放较多的时间,在新的网站上,当然有所心得体会还是会在这里报告给大家。

阅读全文

Feedsky的统计出现小差错

很长一段时间,本站的Feed订阅都在1700到1800,最高到1883个订阅者。

昨天晚上,却看到Feedsky的订阅数达到2660,这可是一个令人高兴的进步。可是突然增长,一定有他的原因在里面,太晚了,就没有再研究。

今天一早,看到统计后台,就明白了,原来Feedsky摆了乌龙,它在25日的统计中,出现了重复计数,在线订阅器中,Google和Google Reader的数字是相同的,都是834,这就是重复计数的部分,让我的订阅统计出现了834的泡沫,空欢喜一场。

而26日的统计中,就只有Google的数字,为836,没有Google Reader这一项。26日的总订阅数是1869。

其实以前Feedsky也出现过某些差错,比如某一天的统计丢失等。

再看到25日之前的统计,就只有Google Reader的统计项目,看来在25日这一天Feedsky把统计的项目从Google Reader转换为Google了。这也是在25日出现重复统计的缘由。

当然我知道Feedsky的工作人员会看到本篇文章,他们是很敬业的,那么这里就顺便提一点建议。

希望在整体数据统计中,可以看到更大时间范围的数据,比如上个月的,比如一年的。

接着提个问题,本站的Feed统计告诉我,订阅数在不断增长,而展示广告的数字却是在不断下降,很多时候都只有200不到的展示,不知道这是怎样的一种控制机制。

而对于话题营销广告部分,因为定价过低的关系,只有在话题营销刚开始的时候,写过两篇,之后的话题我都放弃了。还因为看到过多的同质化的广告,而我又不喜欢凑热闹,写那些被很多人写烂的话题,所以我还是放弃了很多邀请。

最近Feedsky一定很忙,有这么多的Blogger把Feed从Feedburner转到Feedsky,还真的要感谢GFW。

本篇可以算作闲扯,太乱了,都不想整理,就这样吧,对不起各位读者了。

阅读全文

简单介绍SEO 网站优化推广的流量近况

我还是喜欢用Advanced Web Statistics来分析统计,其依据是网站本身的LOG文件。
所用的版本为Advanced Web Statistics 6.6 (build 1.887)

七月的Unique visitors为14803
八月的Unique visitors为16066 (增长8.5%,还是在八月放假,没有多少更新的情况下做到的)

在八月的来访者中,63.6 %为直接访客,就是通过直接输入网址,或者用Bookmark来的访问者;31.9 %是通过各大搜索引擎过来的;而通过referring过来的访客只有4.4 %。
同七月相比,当时通过搜索引擎而来的访客是26.2 %。

不管怎样,就从搜索引擎过来的访客中,各大搜索引擎所占的比例如何呢?
依次为,BaiduGoogleYahoo,Digg,Sogou,和Windows Live搜索。百度占据相当大的优势,它带来的流量大概是Google的三倍。

那么我们再来看看这些搜索引擎的蜘蛛们忙活的情况怎样。
我把前十名罗列如下:
TencentTraveler 39492 259.70 MB 这个据说是腾讯TT浏览器
Yahoo Slurp 10938+218 533.38 MB Yahoo的蜘蛛
Unknown robot (identified by 'spider') 7900+322 417.75 MB 这个就不知道是什么了,难道是采集器?
BaiDuSpider 3686+33 113.05 MB Baidu的蜘蛛
Google AdSense 3668+30 148.09 MB Google AdSense的蜘蛛
Googlebot 2755+5 111.61 MB Google 搜索的蜘蛛
MSNBot 1871+630 96.51 MB MSN搜索的蜘蛛
Unknown robot (identified by 'crawl') 2112+316 95.16 MB 这个也不清楚?
Feedfetcher-Google 1490 3.78 MB 这个是Google Reader的蜘蛛吧。
Heritrix 1349+4 50.16 MB 这个据维基百科的说法,是Internet Archive的蜘蛛。

以上我只是把情况做一个介绍,分析就算了吧。

不过我倒是很乐意预见一下九月份的流量
就八月的Unique visitors为16066的基础,九月可以达到19000吗?

阅读全文

SEO 网站优化推广的收录情况 - 2007年七月

自上次统计了本站的收录情况至今,已经过了三个月了,现在再来看看收录和排名的情况。

首先是收录数量:
Google: 337页面
Baidu: 299页面
Yahoo.com: 253页面
Yahoo.cn: 573页面 雅虎中国的搜索引擎有改变。
Sogou.com: 328页面
msn.com: 294页面(显示503页面,实际294页面)
yodao.com: 307页面

实际情况是本站的文章到目前为止,不包括本篇,一共是299篇。所以搜索引擎收录的情况还是不错的。

1)Google搜索,是Google.com中文结果
用"SEO 网站优化推广",本站首页排在第一。
用“网站优化推广”,本站首页排在第一。
用“网站优化”,本站首页在第57。退步了
用“seo”,本站首页排在第14。

以下将不再使用本站站名称来作搜索关键词。
2)Baidu搜索
用“网站优化”,本站首页在第3。进步很大
用"网站推广",本站首页在第3。
用"seo",本站首页在第11。
排名比上次有进步,继续努力。

其他的搜索引擎排名情况就不做监测了。毕竟使用的人还太少。

现在看来从Google的排名看有下降的趋势,而从Baidu看,有进步。通过Google Analytics的分析, Top Traffic Sources的报告里,可以看到,同三个月前相比,Baidu过来的流量所占比例有大幅的提高,从29%提高到41%。而Google的则没有多少变化,还在19%左右。

所以排名对于流量的影响是很大的。

阅读全文

2007上半年SEO网站优化推广的流量统计

一直在使用的流量统计,就是Open Source的Awstats,同时还使用Google Analytics,两者各有侧重点,各有优势。
现在DavidYin,就贴图两张,分别是2007上半年的按月流量统计,和上半年的访客来源国家统计。

seo-halfyear-traffic.gif
从按月流量变化来看,是在逐月提高,趋势稳定。

seo-halfyear-country.gif
看访客来源国家的话,美国第一,这点我倒是觉得有些问题,这个数字也许把那些搜索引擎的蜘蛛来抓取内容都包括在内了。除此之外的数字,觉得还正常,从中国大陆来的访客应该是最多的。

其他同搜索引擎优化有关的数字,比如那些搜索引擎来的多,哪些关键词被搜索,等等的统计,待有空的时候再说吧。

阅读全文

99click - 第三方PPC广告效果监测

在最近的一段时间内,包括DoubleClick被Google收购,国内的"好耶"亦被分众收购。这些掌握大量用户数据的广告监测公司分别被广告中介公司所收购。看来这个网络广告监测也是一个会被越发红火的网络广告市场所重视,不但是广告主会依赖他们,广告中介商也会越来越重视他们的影响。

99click自称有望成为独立第三方网络监测平台的最好人选,这是一个可能发生的事情,当然也希望在业界有这样一个公司可以出来做好这一块的工作。

它所依赖的主要技术就是所谓的二跳率。这个东西根据该公司自己的解释就是

如果访问者通过某一广告连接进入到您的网站页面后,再次点击了其他页面连接,则为产生二跳;若访问者点击进入您的网站后径行离开,则没有产生二跳;所有访问者中产生了二跳的访客所占的比率即为"二跳率"。

这个定义,或者说技术略显粗糙。
更为精确的一种技术是Bounce Rate,据维基百科的解释:Bounce Rate 就是一个跳出率,当一个用户进入一个网页,接着在一个会话时间内没有看过该站其他的页面就离开了该网站,就被称作Bounce。请注意这里有两个参数,一个是是否点击浏览其他的页面,第二个就是哪个会话时间段。
这个Bounce Rate越低越好,说明用户访问了更多的页面。而且这个Bounce Rate已经是网站流量统计的一个通用标准,一般合格的流量统计都有。

在99click的描述中,这个所谓二跳率似乎成为了一个独有的标准,这点不能苟同。二跳率同Bounce Rate看似是互为补集的关系。而Bounce Rate的指标更为精确,这从Bounce Rate中有这个timeout的参数就可以看出来。

在国内的网络环境中,过度自夸的炒作已经称为了一种风气。希望这个公司不会在这方面称为佼佼者。

其实我觉得99click最大的卖点不过是独立第三方,它的技术至少目前看来没有什么新意。

附记:
Feedsky的广告话题经常会有邀请发到我的邮箱,可是通常我都是看看,就pass了,这个话题因为比较有兴趣,且同本站的主题有关,所以才会写上几笔。不过我的评论通常都是贬多于褒。关于流量统计分析这一块,我还是比较推荐使用Google Analytics。当然有不错的第三方统计也好,可以穿插进行统计,用来比较统计的差异。


阅读全文

Feedsky的两件事

今天看到Feedsky拿出了一个新东西,就是 http://blogs.feedsky.com/?p=125 Feedsky话题广告。

据说就是通过甄选,配对,把广告话题,交给Blogger,来写有关的文章,似乎同国外的ReviewMe相似。但是现在还在最最开始的阶段,细节还不明朗。

那么就拭目以待吧。

第二个事情,就是要讲讲它的坏话了。

我认为作为一个社会化工具,那么同用户的沟通是很重要的。
订阅统计的数字问题。

据二月五号的 http://blogs.feedsky.com/?p=118 关于beta上统计数字的一些说明讲,是算法有所改变。据说也会在春节前搞好,现在好像已经过去很久了,Beta 的依然 beta。

首先看这个是原先使用的代码
<a href="http://feed.feedsky.com/seoseo"><img src="http://www.feedsky.com/feed/seoseo/sc/gif" style="border:0" alt="" /></a>

现在显示的订阅数字是111.

Update: Feedsky 已经不再服务,所以此文只有历史记录的意义了。 2016.07.18


Update:本站订阅地址改为 https://seo.g2soft.net/atom.xml
而在beta后台现在看到的新代码是这样的

阅读全文

Google Reader的Trends有什么用

Google的主要工作相信会转到把自己各种各样的服务或者产品进行有效合理的结合,组合,发挥其综合作用。

比如今天看到Google Reader再次更新,增加Trends(趋势)功能,keepwalking也写了一篇。
这样Google就把自己的Google Trends结合进了Google Reader。

下面这张截图就是我在用的Reader的情况。
google-reader-trends.jpg

keepwalking说

在Reading trends一项里(Your item reading trends for the last 30 days),以列表形式、以所订阅的blog为"单位",显示阅读偏好,包括阅读的篇目、标注和共享的"排行"。下面是我的阅读篇目"排行榜",说实话,统计数字和直观的感觉不太相同。简单地说,关注、点击和阅读还不是一回事。


看来Google Trends可以提供的是那些统计数字,如文章的数目,却无法统计那些文章的质量,这个只有读者可以体会的到,即便如此强大的Google现在还没有办法做到。

或许更多的人使用Google Reader之后,通过使用者的行为分析,会有机会分析出文章或者作者的水平高低。

对于自己来说Trends在Reader里的运用,最大的好处,并不是纯粹的看统计,要知道如何用这些统计数字,以及有什么用处才是更为重要的事情。

我看来,当一个Reader的使用者的订阅数目超过100之后,就会开始考虑减少订阅的数字了,因为每天没法消化那么多的文章,那么如何来筛选呢?一种靠直觉,一种是靠统计数字,那么就用到Trends了。

看看分析的有关数字,那么可以帮助到你筛选那些Feeds,那些长期不更新,又不算很有兴趣的Feed,就可以去除了。

阅读全文

用Google Analytics来看Blog的访问统计

网站的统计很重要,让我们来看看这个统计,来自Google的Analytics
下面是我的两个Blog的统计,一个英文,一个中文,没有分开,都放在了一起,现在让我们来看看其统计的情况。

图表的数据包括了从5月11日到昨天的数据。
analytics-new-return-source.jpg
第一张图是,新用户同回头客之间的比率,显然新用户占优势,为89%。
第二张图表示的是用户来源,Google占52.07%,遥遥领先于Baidu的29.21%,Yahoo和Sohu的份额不到3%。

下面再看看访问量和来源地区的分布:

阅读全文

看看有些哪些搜索引擎来探访过本站

每天都会有些搜索引擎的蜘蛛来探访每个网站,那么有哪些蜘蛛,它们的出访频率又是怎样的呢?

让我们来研究一下。
下图是本站截至到昨天所统计的资料,采用的统计系统是Advanced Web Statistics 6.5 (build 1.857),关于这个统计系统不做讨论,就谈谈其中的“搜索引擎网站的机器人”部分的资料。

spiders_list.jpg

讨论的前提是,本站的内容是每天都更新的。
我把这些蜘蛛分成两部分,第一部分是很勤快的,几乎天天来,包括了下面几种:
Googlebot
这个是Google搜索的蜘蛛。
Yahoo Slurp
这个是Yahoo搜索的蜘蛛。
BaiDuSpider
百度的蜘蛛
Bloglines
知名的Blog新闻服务的蜘蛛
Google AdSense
Google AdSense发布商内容抓取的蜘蛛。
NewsGator Online
同Bloglines齐名的新闻聚合服务的蜘蛛。
larbin 一个开源的搜索引擎,不知道是谁在抓取。
Unknown robot (identified by 'bot/' or 'bot-')
还有一些其他的未命名的蜘蛛。

这些蜘蛛的每天到访,能够保证抓取本站每天的最新内容,只要网站保持更新,那么蜘蛛的来抓取网页的频率会基本同你更新的频率相同。

阅读全文