Results tagged “Baidu”

Google Analytics新代码对Baidu统计不准

之前有比较分析过Google Analytics和Yahoo统计对Baidu搜索引擎流量的统计。开始怀疑Google Analytics新代码对Baidu流量的统计失去准确度,有丢失数据的可能。

在1月21日,DavidYin把本站的Google Analytics统计代码用旧的代码替换了新的代码,随后,Baidu搜索在Google Analytics统计中的表现就发生了不同。

首先看看Yahoo统计的结果。
yahoo_tongji_jan_change.gif
来自百度的流量上下波动,很规律。

接下来看看Google Analytics统计的结果。
google_analytics_jan_change.gif

注意看那个点,我注明了是21日,就是把旧代码换上的时间点,那天统计到的Baidu的流量就开始上升,之后回到了之前的大致范围,在200多一点,然后又出现了一个小小的滑落,到昨天,又回到了200多。可是并没有跌落到之前新代码时期的50左右。

阅读全文

本站用户的一些分析

通过使用Google Analytics来分析一下本站用户的一些情况。

所用的数据为过去12个月365天的统计。
在浏览器部分,IE占有绝对的多数86.82%,Firefox只有11.88%。
这两部分的用户,就占去了98%以上,其他的就可以不予考虑了。把这两部分用户对比着来看看,IE用户Pages/Visit是1.70,平均逗留时间是2分钟,Bounce Rate为73.66%。Firefox用户 Pages/Visit是1.93,平均逗留时间为2分58秒,Bounce Rate为66.47%。从这两部分可以看出,Firefox的用户看的页面更多一些,看的时间更久一点,而因为误入本站而马上离开的较少。

操作系统部分,Windows用户也是绝对的多数,占99.16%。

屏幕的分辨率,这牵涉到网站页面的设计考量,是否以800X600为主还是以1024X768为主。SEO 网站优化推广的用户中,使用800X600分辨率的只有3%, 1024X768分辨率的占69.83%,剩下的用户使用的分辨率更高。
很显然现在我使用的1000px宽度来设计是适应用户的习惯的。

当然本站以中文书写,来自中国大陆的用户为主,其他地区,比如台湾,香港,马来西亚,日本等加起来也只有大陆用户的一个零头。

用户从以下三种途径访问本站:
直接输入网址: 15.37%
其他网站推介过来:22.71%
从搜索引擎而来:61.92%
而通过搜索引擎而来的流量中,排名最前的三位为:
百度:70.0%
Google:28.6%
Yahoo:0.7%
可见在中国大陆的用户中,使用Baidu的用户还是明显的多过Google很多。

那么接着分析比较一下百度用户和Google用户:
百度用户的Pages/Visit是1.54,逗留了1分37秒,Bounce Rate为77.54%。
Google用户Pages/Visit是1.75,逗留了2分14秒,Bounce Rate为71.54%。
通过Google搜索而来的用户,更多的找到了他们要看的内容,逗留的时间更久,可否认为在搜索结果的质量上,Google更好一点,只是一点点而已。或者说使用Google搜索的用户更有目的性一点。

在中文搜索的环境中,不能不承认Baidu给用户带来的流量是最多的。

阅读全文

难道本站被百度降权了吗

这几天通过Google Analytics的统计,看到本站来自百度,Baidu的流量大减,当然原来就不多,不过是从比例上减少了很多。

首先用Site命令看看。
有2070个页面收录。其中有些页面是之前本站使用MovableType 4.01之前的按日归档页面,现在已经放弃了。
收录的情况还好,没有什么问题。

目前DavidYin使用两个统计工具,一个是Google的Analytics,一个是Yahoo的统计。
首先看看上个月(2007年12月)的数据。
Google Analytics
google_analytics_dec.jpg

Yahoo统计
yahoo_tongji_dec.jpg

两者的统计数据是相近的,趋势一致,没有什么问题。从百度来的流量稳定。

然后我们来看看今年一月一日至今的数据:
Google Analytics
google_analytics_jan.jpg

Yahoo统计
yahoo_tongji_jan.jpg

通过这两张图的比较,可以看到一些诡异的东西,Yahoo统计得到的数据表明,这个月的每天从百度过来的流量通上个月差不多,没有什么变化都在200至300之间。而Google Analytics得到的数据却显示从2007年12月31日开始,百度流量出现大的滑坡,从200多降到60左右。

这样不一致的统计结果的确让人质疑,哪个才是正确的。

Ok,我还有服务器日志可以看,我使用的是Awstats日志分析软件。
从一月一日到今天的日志分析来看,Baidu仍然是最多的。

阅读全文

投放Alimama是否真的影响Baidu的收录

通常本站有很大的一部分流量来自于搜索引擎,今天我想看看最近流量变化的情况,也给大家做个参考。
就从今年七月开始算好了。下面就以给《网站优化手记》带来最多流量的三大搜索引擎为例,所用数据从Advanced Web Statistics 6.6统计本站的Log文件而得。

都是指每个月从某个搜索引擎而获得的页面

Baidu
7月7976
8月10097
9月8709

Google
7月3102
8月2934
9月3490

Yahoo
7月118
8月124
9月10669

而十月的情况,目前看来还是Yahoo领先。

当搜索引擎的流量有所变化时,作为搜索引擎的研究者,总是喜欢做些探讨。
这里提供一个数据,就是本站于八月二十八日开始做阿里妈妈的广告投放。

这里还有两个事实:
1)Yahoo和阿里妈妈的关系
2)Baidu同Yaoo的竞争关系

如果你的想象力够强的话,试试看能够得到什么结论。

现在DavidYin还不愿做任何猜测,而且数据也不够多,也只是一个Blog的数据。只是我觉得有趣的是自八月底开始投放Alimama广告后,来自Baidu的流量略有下降,而来自Yahoo的流量则是大踏步的前进。

那么我很想做一下反向的实验,甚至做一下重复的实验,看看流量来源的比重会有怎样的变化。

目前我已经撤下本站的Alimama的广告,也取消了所有的代码,看看这个月,以及下面的两个月会有什么样的变化。如果如各界的猜测,那么到一月份再开始投放Alimama广告,看看会否重现。


顺便提一句,把某一个搜索引擎带来的流量当作唯一的依靠,是非常不可靠的,多样化是最好的保障。

阅读全文

大陆搜索引擎对海外服务器的问题

昨天有网友留言,提到了下面的问题:

扬扬 said:

David您好 关注你的博客半年了
我最近有一些问题困扰 发到您的邮箱里 但是迟迟得不到答复
是这样 我想购买 国外空间 但是我一个朋友告诉我说国内搜索引擎对国外空间不怎么友好,煞费苦心 望David 前辈指点一下 谢谢!

首先谢谢你的关注,至于你给我的Email,我看了一下,没有找到。每天我都会收到很多邮件,有时少数邮件也会被Spam Filter误认为是垃圾邮件,所以在此表示抱歉。

从中文网站的角度来看,大陆的搜索引擎对于中文网站的地理位置,IP都是不感冒的,并不会因为这个网站host在海外服务器,而给予特别的照顾。

会引起搜索引擎特别注意的网站,往往是那些有大量重复内容的网站,在国内也称为垃圾站
而国内的搜索引擎,对于英文网站基本上是采取不收录的策略,特别是影响力最大的Baidu,就是这样的,最多收录首页而已。
而个别的情况是放在海外服务器的网站上,有大陆政府所禁止的内容,那么这是搜索引擎会根据政府的规定来采取措施,这是你就会有种感觉,怎么网站在搜索引擎上查不到呢?

当然,大部分的中文网站,放在海外都不会有问题,具体例子很多,比如关注SEO网站优化推广的本Blog,就是放在海外,我看Baidu之类的很友好嘛。

阅读全文

Affiliate Program的恶梦

早上看到这个消息客齐集频道定制遭百度全面封杀,稍微查看一下,似乎不是那么严重。不过也是够严重的。

seovista的预测的确符合搜索引擎的规律。

复制内容的确是会收到一定的惩罚,而且当这些复制内容在一定程度上还互相链接起来,同样的内容在同一时间出现在几十个几百个站点,那么明显就是复制内容。

降权是基本的做法,比如Google就会把部分站点都放到补充材料里面,更为直接的就像这次Baidu的行动,把站点从index中剔除出去。

Affiliate Program是搜索引擎不那么喜欢的一种方式,在搜索引擎的算法参数中,这是一个排在前十名的参数,千万不要小看。

在这里只是告诉大家,在参加类似的Affiliate Program计划的时候,要多考虑一下。

阅读全文

度谷游戏快结束了,网站推广能否帮到Zola吗

所谓度谷游戏已经快接近尾声了,据说还有两天就要结束了

这个zola也想赶上这个末班车,还试图把他的http://www.fangeming.com/通过度谷游戏推广出去。我看很难。

首先讲讲这个游戏的规则,和我所了解的背景。

第一,在这个游戏被公布之前,就已经有个别的后来参加的人已经知道消息,先人一步,开始了,可以算是田径比赛中的抢跑。

第二,本身游戏的规则没有很好的指定,比如有些人的参赛域名已经运行了很久了,有一定的流量和PR值,那么每个参赛者的起点也不同。看看国外的SEO世界冠军赛,它规定参加比赛者,必须使用新的域名,而且必须在指定日期之后注册的新域名才可以。

一个没有好的规则的比赛,不参加也罢,因为制度的不公正,那么比赛的结果也很难公正。

在大部分的时候,这种SEO比赛,看上去比的是技术,其实比的是资源,很多业者手里有十几二十个站点,都有不错的排名,那么他们就比较容易得到好的名次。

但是也要看到这里也有一个风险,就是暴露了那些人的站点群。

如果有兴趣参加中文SEO比赛的话,还不如参加渡虎谷比赛。

阅读全文

利用图片alt属性和CSS定位的作弊手法

看到一个貌似很不错的网站,确让我看到许多作弊的手法。这里同大家分享一下,不要去做这样的事情,一定会受到搜索引擎惩罚的。

一、图片alt属性
代码如下,这些图片是被切割的开的背景图片,并无任何特别的意思,只是网站的名称而已。
如果用alt属性的话,只要放网站名称就可以了,下面的样子,这是明显的关键词堆砌作弊。
<img name="sample3_r1_c2" src="../images/sample3_r1_c2.jpg" width="140" height="101" border="0" alt="武当山保健枕-药枕专家 治疗失眠、肩周炎、颈椎病、高血压、头痛、偏头痛、鼻炎、神经衰弱、焦虑、抑郁、护肤、养颜、去皱"><img name="sample3_r1_c3" src="../images/sample3_r1_c3.jpg" width="148" height="101" border="0" alt="武当山保健枕-药枕专家 治疗失眠、肩周炎、颈椎病、高血压、头痛、偏头痛、鼻炎、神经衰弱、焦虑、抑郁、护肤、养颜、去皱">

上面的例子,还是有一点图片在,下面的图片的则是一个空白,spacer.gif,一个透明图片,通常是用于table的布局,而这个站长显然太过分了。放置了大量的关键词,可以称之为极为猖獗的关键词堆砌。

阅读全文

Baidu真的是最大的中文搜索吗

Baidu的口号是:
全球最大的中文搜索引擎。

这样的称呼似乎是比较贴切的。可是有个问题,是否属实,还要小心求证。

所谓最大,就是收录的数目最多,用户最多,我相信,用户最多是可以说的。
就是讲,Baidu是人们搜索中文内容时,使用人数最多的一种搜索引擎。
至于是否收录中文网站数目最多,则未必,因为中文还包括简体,繁体,你总不能说繁体不算中文吧?

下面我做了一点小测试,供参考:
测试平台,Baidu搜索 Vs Yahoo奇摩搜索(雅虎台湾)
测试搜索发出的IP位置,北美。
简体测试词
1)上海机票
百度一下,找到相关网页约1,580,000篇,用时0.067秒
上海机票搜尋結果約18,000,000個,以下為1 - 10個 ,共花0.61秒
第一行是百度的结果,第二行是Yahoo的,下面的搜索相同。
这个结果有点出乎意外,似乎台湾的朋友比大陆的人民更重视上海机票。


2)台北101
百度一下,找到相关网页约313,000篇,用时0.064秒
台北101搜尋結果約1,600,000個,以下為1 - 10個 ,共花0.04秒
这个结果不奇怪,毕竟这个地标是在台北。

3)涮羊肉
百度一下,找到相关网页约730,000篇,用时0.044秒
涮羊肉搜尋結果約421,000個,以下為1 - 10個 ,共花0.60秒
这个时及其本土的关键词,相信使用的人也是国内,大陆的人居多。

让我们再多作些测试,看看用Baidu热门的关键词来比试一下。

阅读全文

关于Zac的Blog被Baidu降权的几点想法

昨天看到Zac的Blog被Baidu降权了,他的这个搜索引擎优化排名SEO每天一贴,是我时常去看得一个SEO类别的Blog,感觉Zac也是一个有想法的SEO观察者。

原先Zac就提到对于Blog程序作SEO优化不方便的问题,我也做过一点说明。因为Zac所用的平台是Wordpress,我没有多大的研究,我使用的是MovableType,这个平台的模版文件定制能力非常强。

根据我从Zac的Blog页面的源码查看,感觉有如下的几个可以改善的地方。
都是关于模版设置,以及标签运用的。
1) 把左边和右边的两栏交换一下,这样可以把网页的主要内容放到代码的前面。

2)使用表格布局,不好,最好还是用CSS+DIV布局。

3)在左侧导航栏,那些非网页主要内容部分的标签,用了很多的H2标签,而在文章的标题,则只用了span标签,没有用H2,至少也要用H类的标签来表示。

4)可以考虑添加Meta标签,来描述主要内容和关键词。如果在Google作Site查询,就可以看出这个Meta的用处。

谈谈我对这次可能的"封杀事件"的可能原因,做一下猜测吧。

阅读全文

搜索引擎的人工干预是为了什么

最近的搜索引擎的人工干预机制,在中文搜索里有些冒起,而且有提高到新层次的趋势。

看过"搜索引擎人工干预神话的背后",让我不禁有些这样的感触。

在技术上不如人,之后,只好扬长避短,把人工干预放到机器算法的前面。

的确,到目前为止,人脑还是比电脑聪明,更有智慧。可是人脑还有一个弱点,就是感情和利益,会驱使人们作出违反规定的事情,作出违反行业习惯的事情。比如前不久的天空搜索和天极网的事件。

从搜索引擎的公平性来说,就是要用机器算法来衡量所有的网站,这样会公平。

当然还有很多厉害的黑帽SEO,采用了一些搜索引擎的算法里还没有包括的手段,那么就需要用到人工干预,而人工干预的目的不只是维持一个合理的算法,而且是改善算法。

阅读全文

在中国市场上,Baidu靠什么领先

在吕伯望的Blog上看到这篇评论

他有这样的一段话:

我们的调查结果,从一个侧面证实了,百度的MP3搜索和百度贴吧,是百度最成功的两个产品。它们的成功,是百度在中国获得大规模用户市场份额的主要原因之一。调查结果也表明,百度的搜索类产品不仅仅相对于Google,即使相对于它的贴吧等非搜索类产品,也需要获得改进和提高。

这里有两个意思,分别夸了Baidu和批评了Baidu。
1)Baidu的MP3搜索Baidu贴吧,为Baidu打下了市场份额的江山。很成功。
2)Baidu的其它的搜索,比如网页搜索等,同Google相比,还是有差距的,需要努力。

这个同很多站长的看法一致,就是Google在网页搜索的准确度,自然排名的效率来说都比Baidu好。
至于MP3搜索,这样的产品,不是Google不行,而是它不为,Google对于版权的问题一直比较重视,所以对于Google AdSense这样的产品,它都规定:

网站发布商不应将 Google 广告展示在带有 MP3 、视频、新闻组和图像结果等内容的网页上

可见,这是一个相当不作恶的公司。


阅读全文

搜索引擎是否真的对复制内容进行惩罚呢

复制内容时常会出现在不同的网站,或者同一个网站上。
虽然现在还有些人认为搜索引擎无法发现复制内容,所以就疯狂采集,不断的复制那些内容重复的网站。这里我就不解释搜索引擎是否能够发现,是如何发现复制内容的了。

首先要澄清一点:
搜索引擎对于复制内容的确是存在惩罚措施的,特别是那些内容完全一样的站点,或者是在一个网站内,内容完全一致的页面。

再要澄清的一点:
所谓惩罚,是指搜索引擎会认为这些网页是违反了搜索引擎的服务条款,或者是站长指南,采取了使这些网页更少的出现在搜索结果里的措施,有时甚至会把这些网页从搜索引擎的索引中去掉。所谓被搜索引擎踢出来,就是这样。

很多做内容采集的人,会把某个内容很好的网站,全站采集,做到自己的网站里,在最初的时候,看到Google,Baidu收录了几万,几十万的页面,之后在很短的时间里,很多收录都消失了,只剩下几个,十几个页面。这就是内容重复,复制内容的惩罚在起作用。
这不是因为你的内容不好,而是采集惹得祸。

阅读全文

丑闻传播也可以带来流量

恶搞之风已经遍及了祖国大地,现在又有了"雅阁女"之流。

看到张翼轸的观点当心"雅阁女"又是高明宣传,才知道国内的学习态度真好,普及的真快,可是总是在那些恶俗的方面,对于好的却学不到。

雅阁女是发在青娱乐上的,看看百度指数,可以看出,两者的关联。

关键词 用户关注度 媒体关注度
雅阁女 15141 ↑ +819% 106 ↑ +10500%
青娱乐 7870 ↑ +181% 96 ↑ +9500%

显著增加的关注度,那么再看看其详细的分析图。
雅阁女
yagenv.jpg

青娱乐
qingyule.jpg

从上面的两个图,看出爆发点都在同一个时间。可称为一夜爆红。
这样的东西可以看作是丑闻传播,一个人人喊打的观点,或者言论,可以的到极大的关注。

好像有这么一句话,叫做,不能名垂千古,也要遗臭万年。

阅读全文

Blog站点如何用RSS搜索来推广

Blog的流行,带来了针对RSS的搜索引擎以及RSS目录的兴起。

当一个Blog建立之后,总会有RSS的,那么如何应用RSS的搜索呢?
让我们来看看如何提交RSS Feeder?到哪里去提交?
上次我已经讲到过RSS服务站点,现在再补充几个。
Technorati 最著名的Blog RSS服务。
2RSS

Aspin

上面只是一些例子,告诉大家当Blog建立好之后如何提交到英文的RSS搜索服务。

至于中文,那就算了,现在国内还是Baidu一家独大的情况,只要提交整个网站到Baidu就好了。

阅读全文

用Google Analytics来看Blog的访问统计

网站的统计很重要,让我们来看看这个统计,来自Google的Analytics
下面是我的两个Blog的统计,一个英文,一个中文,没有分开,都放在了一起,现在让我们来看看其统计的情况。

图表的数据包括了从5月11日到昨天的数据。
analytics-new-return-source.jpg
第一张图是,新用户同回头客之间的比率,显然新用户占优势,为89%。
第二张图表示的是用户来源,Google占52.07%,遥遥领先于Baidu的29.21%,Yahoo和Sohu的份额不到3%。

下面再看看访问量和来源地区的分布:

阅读全文

看看有些哪些搜索引擎来探访过本站

每天都会有些搜索引擎的蜘蛛来探访每个网站,那么有哪些蜘蛛,它们的出访频率又是怎样的呢?

让我们来研究一下。
下图是本站截至到昨天所统计的资料,采用的统计系统是Advanced Web Statistics 6.5 (build 1.857),关于这个统计系统不做讨论,就谈谈其中的“搜索引擎网站的机器人”部分的资料。

spiders_list.jpg

讨论的前提是,本站的内容是每天都更新的。
我把这些蜘蛛分成两部分,第一部分是很勤快的,几乎天天来,包括了下面几种:
Googlebot
这个是Google搜索的蜘蛛。
Yahoo Slurp
这个是Yahoo搜索的蜘蛛。
BaiDuSpider
百度的蜘蛛
Bloglines
知名的Blog新闻服务的蜘蛛
Google AdSense
Google AdSense发布商内容抓取的蜘蛛。
NewsGator Online
同Bloglines齐名的新闻聚合服务的蜘蛛。
larbin 一个开源的搜索引擎,不知道是谁在抓取。
Unknown robot (identified by 'bot/' or 'bot-')
还有一些其他的未命名的蜘蛛。

这些蜘蛛的每天到访,能够保证抓取本站每天的最新内容,只要网站保持更新,那么蜘蛛的来抓取网页的频率会基本同你更新的频率相同。

阅读全文