Results tagged “搜索引擎”

robots.txt

robots.txt的名字,从字面上来看就是机器人文件,是给机器人看得,所谓机器人就是搜索引擎的蜘蛛。这个文件是一个纯文本的文本文档,采用的是Robots排除标准,这项标准是一个协议,有一小组命令组成。

robots.txt的用处:

告诉搜索引擎,网站的内容那些是可以索引的,哪些是不可以索引的。

注意:robots.txt仅仅只是一项指令,并不能强制阻止各种抓取工具对你的网站进行抓取。如果你的网站上有不希望被公开访问的内容,要采取其他方法来屏蔽(比如用密码,用加密等等)。

robots.txt存放的位置:

必须放在网站的根目录,文件名全部小写。

例子:

User-agent: * 
Disallow:
允许所有的机器人
User-agent: * 
Allow:/
这也是允许所有的机器人,另一种写法
User-agent: googlebot 
Disallow: /images/
禁止Google的搜索蜘蛛访问抓取 /images/ 目录
阅读全文

Google Penguin 3.0 更新

几天前,Google搜索的算法又一次做了大的更新,这次应该是Google Penguin 3.0了。
这次的变动,同之前的Penguin 2.0一样,是算法更新,而不是简单的数据更新,所以影响的面会是比较广的。

通常观察自己的网站在19,或者20号之后,的搜索流量同之前相比是否有大的变化,就可以看出是否自己的网站受到了Penguin 3.0的波及了。

阅读全文

Awstats三天的统计状况

安装Awstats不过几天,让我来给大家看看它对本站的log记录所作的统计分析。

这个记录只有三天,就是2月22日,23日,24日这三天的log记录。从搜索引擎来的访客数量,以及各搜索引擎的不同数字。
awstats-source-se.png

Google来的用户最多,占一半多,微软的Bing搜索来的用户有17%多,来自百度的用户约13%,这样搜索引擎三大家合计就超过了80%了。

阅读全文

从搜索引擎来的流量

从搜索引擎来的流量,对于本站来说比较重要,有相当多的读者都是通过搜索来到我的Blog。
其中有下面几个搜索引擎。

360搜索是从今年夏天才开始比较多人使用的,从我的Google Analytics统计分析来看,其流量相对而言比较稳定,没有什麽大的起落,一致性比较好。

Google当然是技术上非常先进,所以它带来的访客也是比较稳定的。访客比较优质,在网站所停留的时间较长。

Baidu当然是一个重要的中文搜索引擎,虽然最近把本站屏蔽了,但之前的统计数据可以看出其带来的访客停留时间,只有Google带来的访客时间的一半,这也是值得注意的现象。

还有搜狗,和Bing,虽然使用的人很少,带来的访客也不多,其稳定性还是很好的。

阅读全文

Cuil 搜索引擎

一个新的搜索引擎出现了,名字就叫做Cuil。
搜索了一下DavidYin,我的网站排在了第一。

Cuil号称是世界上最大的搜索引擎,索引量是Google的三倍,微软的十倍。
这个数据不知道有多少的水分,当然我们也不必太介意这个索引量,毕竟能够满足更多用户的需求才更为重要。

目前存在的问题:
1)中文搜索并不支持。
2)搜索并不稳定,刚才我又看到了Redirect Loop的错误。

这个搜索引擎由三人建立,其中两个是前Google雇员,另外有两个还是夫妻档。
看到新的搜索引擎进入市场,总是好事,因为竞争才会进步,竞争才会防止垄断。

你也可以去试试这个搜索引擎,自己去感受一下,告诉我你的体会。

阅读全文

Google Analytics新代码对Baidu统计不准

之前有比较分析过Google Analytics和Yahoo统计对Baidu搜索引擎流量的统计。开始怀疑Google Analytics新代码对Baidu流量的统计失去准确度,有丢失数据的可能。

在1月21日,DavidYin把本站的Google Analytics统计代码用旧的代码替换了新的代码,随后,Baidu搜索在Google Analytics统计中的表现就发生了不同。

首先看看Yahoo统计的结果。
yahoo_tongji_jan_change.gif
来自百度的流量上下波动,很规律。

接下来看看Google Analytics统计的结果。
google_analytics_jan_change.gif

注意看那个点,我注明了是21日,就是把旧代码换上的时间点,那天统计到的Baidu的流量就开始上升,之后回到了之前的大致范围,在200多一点,然后又出现了一个小小的滑落,到昨天,又回到了200多。可是并没有跌落到之前新代码时期的50左右。

阅读全文

非文本内容的优化策略

有关文本内容的优化已经很普遍了,而且本站也介绍了很多很多。

从搜索引擎的角度来看,文本内容的搜索也是它们最拿手的,可是现在搜索引擎要面对的不再只是文本内容了,还有很多很多不同形式的内容,也需要它去抓取,去索引,去分析其实际的内容。

如果搜索引擎可以如人类般,从图片,从Flash中获取实际的内容,当然就不成问题了,可是现在还不行,否则Google就不会请求人们来帮助它提高图像搜索的质量了。

现在的网站内容除了文本之外,还有很多图像,是作为内容的一部分的图像,而不是装饰性的图片;还有音乐文件,mp3;还有视频文件;还有pdf文档等等。

在网站设计,制作时,通常都会在这些非文本内容的周围,用文本来描述有关的内容,这可能还不够,需要更多的SEO方法,来优化内容。

针对图像和多媒体文件这些非文本内容的搜索引擎优化,乍看上去非常简单。可在实际上,要在搜索引擎的搜索结果中获得好的表现,却不是那么的简单。

DavidYin会在接下来的一段时间,重点介绍有关非文本内容的搜索引擎优化。

阅读全文

难道本站被百度降权了吗

这几天通过Google Analytics的统计,看到本站来自百度,Baidu的流量大减,当然原来就不多,不过是从比例上减少了很多。

首先用Site命令看看。
有2070个页面收录。其中有些页面是之前本站使用MovableType 4.01之前的按日归档页面,现在已经放弃了。
收录的情况还好,没有什么问题。

目前DavidYin使用两个统计工具,一个是Google的Analytics,一个是Yahoo的统计。
首先看看上个月(2007年12月)的数据。
Google Analytics
google_analytics_dec.jpg

Yahoo统计
yahoo_tongji_dec.jpg

两者的统计数据是相近的,趋势一致,没有什么问题。从百度来的流量稳定。

然后我们来看看今年一月一日至今的数据:
Google Analytics
google_analytics_jan.jpg

Yahoo统计
yahoo_tongji_jan.jpg

通过这两张图的比较,可以看到一些诡异的东西,Yahoo统计得到的数据表明,这个月的每天从百度过来的流量通上个月差不多,没有什么变化都在200至300之间。而Google Analytics得到的数据却显示从2007年12月31日开始,百度流量出现大的滑坡,从200多降到60左右。

这样不一致的统计结果的确让人质疑,哪个才是正确的。

Ok,我还有服务器日志可以看,我使用的是Awstats日志分析软件。
从一月一日到今天的日志分析来看,Baidu仍然是最多的。

阅读全文

投放Alimama是否真的影响Baidu的收录

通常本站有很大的一部分流量来自于搜索引擎,今天我想看看最近流量变化的情况,也给大家做个参考。
就从今年七月开始算好了。下面就以给《网站优化手记》带来最多流量的三大搜索引擎为例,所用数据从Advanced Web Statistics 6.6统计本站的Log文件而得。

都是指每个月从某个搜索引擎而获得的页面

Baidu
7月7976
8月10097
9月8709

Google
7月3102
8月2934
9月3490

Yahoo
7月118
8月124
9月10669

而十月的情况,目前看来还是Yahoo领先。

当搜索引擎的流量有所变化时,作为搜索引擎的研究者,总是喜欢做些探讨。
这里提供一个数据,就是本站于八月二十八日开始做阿里妈妈的广告投放。

这里还有两个事实:
1)Yahoo和阿里妈妈的关系
2)Baidu同Yaoo的竞争关系

如果你的想象力够强的话,试试看能够得到什么结论。

现在DavidYin还不愿做任何猜测,而且数据也不够多,也只是一个Blog的数据。只是我觉得有趣的是自八月底开始投放Alimama广告后,来自Baidu的流量略有下降,而来自Yahoo的流量则是大踏步的前进。

那么我很想做一下反向的实验,甚至做一下重复的实验,看看流量来源的比重会有怎样的变化。

目前我已经撤下本站的Alimama的广告,也取消了所有的代码,看看这个月,以及下面的两个月会有什么样的变化。如果如各界的猜测,那么到一月份再开始投放Alimama广告,看看会否重现。


顺便提一句,把某一个搜索引擎带来的流量当作唯一的依靠,是非常不可靠的,多样化是最好的保障。

阅读全文

三个名词解释和各种搜索

摘录几个名词解释:Search Marketing, SEO,PPC

Search Marketing = Search Engine Marketing = the total package
搜索营销,就是搜索引擎营销,可以看作一个完整的服务。

SEO = Organic Search Engine Optimization = nopaid only
SEO就是自然搜索引擎优化,当然是指不用对搜索引擎付费而获得的自然排名。

PPC = Paid Search = pay-per-click only
PPC就是付费搜索,这里是指按点击付费的那种广告。

在英文的搜索引擎世界,最主流的是如下四个:
Google
Yahoo!
MSN Live
Ask

其他的网站上所配备的搜索服务,基本上都是雇用了以上四个主要搜索引擎中的一个。

这四个搜索引擎我们可以称之为通用搜索。而除此之外还有很多专用的搜索。下面DavidYin就来举几个例子。

1)图书
Google Book Search,http://books.google.com
Net Library,http://www.netlibrary.com
Ebrary,http://www.ebrary.com
Oxford Scholarship Online,http://www.oxfordscholarship.com

2)学术文章
CrossRef,http://www.crossref.org/
Annual Reviews,http://arjournals.annualreviews.org
Google Scholar,http://scholar.google.com

3)Blog搜索
Technorati,http://www.technorati.com
Google Blog Search,http://blogsearch.google.com

还有很多各种各类的其他搜索,比如维基百科,新闻搜索,多媒体搜索,图片搜索,地图搜索,政府资料搜索等等。

DavidYin的建议是,在做网站推广时,不要只依赖于某一个搜索引擎,而要多样化,以降低因单个搜索引擎调整算法而对整个网站的影响。

阅读全文

SEO是否同地理相关呢

昨天看到这么一篇文章,Geographical Targeting in SEO

里面从四个方面提出了问题,是地理位置相关的问题,也都是同搜索引擎优化有关,同搜索结果有关的问题。它特别提到了Google在这方面,可能会走的比较快。
下面,让DavidYin来谈谈这四个点。

1)Domain Name
域名问题,用国家域名,还是用通用的.com, .net之类的域名。对于那些非全世界通用语言来说,用该国国家域名比较好,比如中国的就用.com.cn,或者直接用.cn。另外,对于那些客户只限于某个国家的,也同样用国家域名好。
我认为搜索引擎还没有把域名当作一个考虑的对象,当然它是参数之一,可是其作用很小。或者说搜索引擎对于域名没有歧视。

2) Website Hosting
网站寄存的位置,这个是搜索结果参数之一。比如在Google中,你用本站的站名,网站优化推广,在谷歌中搜索,会有四个选项,分别是所有网页,中文网页,简体中文网页,中国的网页,当我用中国的网页作为选项来搜索的时候,搜索结果中就没有包含本站,而采用其他的三个选项就会把本站放在第一。原因就是因为本站没有放在中国。
而Baidu因为只是在中国开展中文业务,基本上没有考虑这个因素。
这里有个问题,就是这个选项,选择中国的网页,会有多少人会去选择呢?

3)Domain Registrar
对于域名注册的地方,我倒是一点意见也没有,我甚至认为是没有关系的。不管在哪里注册,都不会影响搜索结果。

4)Inbound Links
外部链接是非常有趣的事情,当一个网站的大量外部链接是来自于某个国家,或者某个语种,基本上会对从这个国家所来的搜索有所影响,也会对搜索结果中的排名有所影响。这相当于一个社区,或者圈子的概念,当大量的来自某个社区的网页链接过来,就相当于大量的投票,当然会对搜索结果有影响。

而对于一般的网站,没有特别的国别、地区要求的,可以不用理会这些东西,而当你的客户是位于某个国家时,要小心处理这些因素,SEO就是由这些小小的细节来决定的。

阅读全文

Google 网站管理员指南-部分更新

在大约一年前,DavidYin曾经比较详细的介绍过Google的网站管理员指南,见(1)(2)。而前段时间,Google更新了其管理员指南,今天我就来稍微介绍一点这方面的内容。

目前的管理员指南部分,同之前的版本并无原则不同,只是在质量指南 - 具体指南部分做了比较详细的解释,以及细化。

这里Google明确列出了八项要注意的地方:

* 请不要使用隐藏文本或隐藏链接
* 请不要使用隐藏真实内容或欺骗性的重定向手段。
* 请不要发送自动查询给 Google。
* 请不要加载使用无关字词的网页。
* 请不要创建包含大量重复内容的多个网页、子域名或域名。
* 请不要制作安装有病毒、特洛伊木马或其他有害软件的网页。
* 请不要专门针对搜索引擎创建"桥页",或使用其他联属计划这类原创内容很少或几乎没有原创内容的俗套 (cookie cutter) 方法。
* 如果您的网站参加联属计划,请确保您的网站可为其增添价值。请提供独特且相关的内容使用户有理由首先访问您的网站。

如果你的网站有这上面八项中的情况,会令Google十分不悦,而这些情况是其明确指出的,也就是说它有足够的技术能力来发现有这种情况的网站,当然在搜索结果中也会做好适当的处理,不让有害的,无用的网站出现在搜索结果之中。

如果还有这方面的问题,请参照过往我对Google 网站管理员指南的介绍,或者直接到Google官方网站来获得有关的信息。

阅读全文

替换Yahoo到中国雅虎

原来放在右侧小玩意儿的地方,有个Yahoo的工具,就是显示链接到该页面的数量。

可是这个工具已经有很久不能正常工作了。

现在呢,替换为中国雅虎的服务,它称之为链接指数,显示的是具体页面被链接的数量。

获取的地址在这里

下面我放一个本站搜索引擎优化手记,全站的链接指数:

阅读全文

搜索引擎优化的误区

还是谈谈误区吧,在GoogleReader里看到我订阅的某个Blog的文章,忘了是那篇了,看后让我有这么一个想法,想说说。
在做搜索引擎优化的过程中,我们面对的障碍有哪些呢?又会有什么误区呢?

在论坛上,常会看到有人自豪的说,自己把Baidu怎么怎么了,或者是把Google怎么怎么了。
似乎他们面对的就只是搜索引擎。

而DavidYin不是这么看的。在我看来有这么几个关系要处理好。
有这么几个主体:自己的网站,搜索引擎,用户,竞争者的网站。
搜索引擎就像一块玻璃,我们同竞争者都在努力尽可能的靠近搜索引擎,这样在玻璃的另一边的用户就可以更容易的看到我们,当然我们自身也要建设好,做的漂亮一点,否则用户看了不舒服,马上就会找第二个去的。

搜索引擎优化,就是把网站同搜索引擎之间搞的清楚点,让用户可以看的更清楚;或者是同搜索引擎走的更近一点,那么用户看我们就会大一点;还有就是我们把自己的网站做的更有特色,那么在众多的竞争者中才会出挑。

面对用户,其实网站主要的优化工作还是同其他竞争者的比较。谁做的更好,谁做的更为符合搜索引擎和用户的需要,谁就是赢家。

而同搜索引擎的关系,还是合作,不要搞对抗,这没有用,只有按照搜索引擎的规律来做才会有好的效果。走偏门,或许可以得意一时,终不长久。

真正作搜索引擎优化的朋友,都是作长期优化的。就是说这个优化的过程如水银泻地,是慢慢的,是扎实的,是渗透到骨子了的。

不要指望一蹴而就,要知道上去快的东西,下来也快。

在作优化工作的初期,要注重打基础,建设好网站的自身,要有足够充实的内容,还要有够宽的外部链接,当中再有些质量高的网站链接过来,这就是主要的工作。在作优化的最初一两个月,不要急着想看到成果,要多些耐心,如果做的对路,而且力度适中,我的经验是在两个月到三个月之间,会看到成果。

最近很少谈务虚的东西,偶尔谈谈也是必要的,毕竟哲学是统领一切,指导一切的。

阅读全文

英文搜索引擎第二部分

上次DavidYin介绍了提交你的网站到主要的英文搜索引擎,其中包括了九个搜索引擎,接下来我在给大家介绍一下,其他的搜索引擎。

1)Accoona
提交页面:Submit Your WebSite

2)ADMCity
提交页面:add URL

3)Amfibi
提交页面:Add URL

4)Amidalla
提交页面:add your website

5)Anoox
提交页面:Add URL

阅读全文

提交你的网站到主要的英文搜索引擎

今天DavidYin先来介绍一下,主要的英文搜索引擎。
当你的网站初步架构完成,内容已经有了一部分,至少有一个主页吧,那么就可以去各大英文搜索引擎提交了。不要说没有用处,至少在网站建立之初,还是有用的,一旦搜索引擎收录了,就不需要再提交了。又有人说每个月提交一次,我觉得是没有必要。

好了言归正传,下面就依次介绍这些英文搜索引擎,(这些虽说是英文界面,可是同样也可以收录中文或者其他语种的网页),排名不分先后。

1)MSN Search,现在也叫做Live Search Bing。
提交页面:Submit your site to Live Search

2)Yahoo Search,可以提交网页或者feeds,记得需要yahoo ID登录后才可以。
提交页面:Submit a Website or Webpage

现在yahoo使用Bing的搜索服务 Update: 2013.08.31

3)Google Search
提交页面: Add your URL to Google

4)Exactseek,这个搜索需要注册一个帐号,才可以提交。
提交页面:Add your URL

阅读全文

首先投诉10个侵权的网站

对于那些肆无忌惮的抄袭者,DavidYin维护自己知识产权的行动定于周一,也就是六月十八日,本人将首先对十个侵犯本站版权的网站,进行投诉,当然一定是排名在我的原文之前的,而且有投放Google AdSense的网站优先考虑。

我现在也不知道是哪些网站会有这么好的运气,到周日就知道了。
不过我暂时不会考虑透露具体的网站。

具体的投诉方法,是向Google的版权处理部门投诉

我会采用书面投诉,传真到Google的User Support, DMCA Complaints部门,接着再用Email来通知AdSense的客服支持部门,email地址是adsense-zhs@google.com。

一般这样的投诉,Google必须处理,如果还有时间我会接着投诉到Google搜索部门。

这里起到两个作用:
一、侵权者将不能从抄袭我的文章中获益;
二、侵权的文章也无法再获得好的排名。

DavidYin并不十分的生气,而只是想维护自己的合法权益。希望还没有改正的侵权者在明后天尽快改正,不要走到被Google AdSense屏蔽域名或者停止帐号的地步。

顺便说一下,本人目前只在艾瑞网设有专栏,还有同意浩杰网转载我的文章。


阅读全文

对于那些肆无忌惮的抄袭者,需要容忍吗

最近看到很多转载本Blog文章的网站,几乎每篇都有,有些文章流传甚广。其实之前也是有转载或者抄袭现象的,不过现在侵犯我的版权的人有越来越多的迹象,而且肆无忌惮到改掉作者当成他自己的文章,所以决定不再容忍。

看看转载的情况吧:
比如用 "Adsense单价的秘密" 这个文章标题来搜索,可以看到有883个搜索结果,还好我的文章排在第一,觉得Google的眼光还不错,能够分辨谁是原创,谁是转载。

可是这篇文章 "无效点击的判定和报告",在1490个搜索结果中,原文却没有排在第一,那么看来我要帮助Google来提高搜索排名的质量了。

今天DavidYin想再次重申SEO 网站优化推广Blog的版权规定

必须按照署名-非商业性使用-禁止演绎 2.5 中国大陆的CC授权来转载我的文章。

任何违反本站规定的非法转载,我都视为抄袭,现在只是警告。

一个星期后,我若再看到那些转载却不保持文章的完整性,或者转载后改掉我的版权说明或著作人的,我都会采取措施。

所有的措施都会在法律框架之内,抄袭者的结果无非是,被搜索引擎除名,或者被AdSense屏蔽帐号之类的。我会按照DMCA,千禧数字条款的规定来处理,就是这样。
不会有皮肉之痛,你的网站也不会收到任何攻击。

DavidYin是个理智的人,我只要自己应得的。

一个星期为限,我想抄袭者一定会看到此文的。我就不一一发信给你们了,自己保重吧。

阅读全文

隐藏真实内容和桥页

这是一种Google明确指出属于作弊的行为。

隐藏真实内容
通过对用户代理(user agent)的判断,给出不同的网页内容,比如给搜索引擎一个版本的内容,给实际的网站用户另外一个版本的内容。
其实这也只是属于一种技术,合理的使用,没有问题,只有当这两个版本的内容存在主要差别的时候,而且这种差别是为了欺骗搜索引擎,以获得好的排名的时候,这才是真正的作弊行为。

桥页也是一种作弊。
Google的说明如下:

"桥页"指专门为搜索引擎制作的网页。桥页包括多个链接 - 往往是数百个 - 对访问者用处极小或无用,不包含有价值的内容。HTML Sitemap 对访问者而言是有价值的资源,但请确保访问者很容易浏览这些链接对应的网页。如果要使用多个链接,请考虑将其整理为不同的类别,或编入多个页面。在进行此操作时,请确保它们的用意是让访问者浏览您的网站,而不只是用于搜索引擎。

这里请注意,在Blog世界里,Tag Cloud并不属于桥页。

阅读全文

Affiliate Program的恶梦

早上看到这个消息客齐集频道定制遭百度全面封杀,稍微查看一下,似乎不是那么严重。不过也是够严重的。

seovista的预测的确符合搜索引擎的规律。

复制内容的确是会收到一定的惩罚,而且当这些复制内容在一定程度上还互相链接起来,同样的内容在同一时间出现在几十个几百个站点,那么明显就是复制内容。

降权是基本的做法,比如Google就会把部分站点都放到补充材料里面,更为直接的就像这次Baidu的行动,把站点从index中剔除出去。

Affiliate Program是搜索引擎不那么喜欢的一种方式,在搜索引擎的算法参数中,这是一个排在前十名的参数,千万不要小看。

在这里只是告诉大家,在参加类似的Affiliate Program计划的时候,要多考虑一下。

阅读全文