SEO 网站优化推广 SEO 网站优化推广
第 1 页

“病毒” 的搜索结果

你的网站被 Google 用于 AI 训练了吗?

这是我看到了 Zac 的文章《你的网站内容被用于AI训练了吗?你愿意吗?》之后,而想到的。

基本上就是, Google 所使用的 AI 训练,需要很多的语料,而各大网站,或者小网站,都会成为它的目标。我对于这些 AI 工具在最近半年内的快速出现,以及快速的病毒式传播,看法也许并不相同。我认为在科技激流猛进的时候,普通用户需要耐心等待,可以尝试,不要陷入太深,等大浪淘沙后,还能为人所用的,那一定是能提高生产力,帮助人们提高效率的工具。

二月,在 Grandpa try the new technology 一文中,我向岳父大人介绍了Midjourney,以及 ChatGPT,他觉得挺有意思的。三月,我自己在本地电脑上尝试了  Stable Diffusion, 觉得蛮痛苦的。个人普通电脑还是不要尝试了,太费时间。

暂时我还是会认为各大互联网巨头都会向 OpenAI 做出挑战,做自己的 AI 训练。今天看到的 Zac 的文章,就是说 Google AI 训练集的情况。

Google 使用的是 C4 数据集,这里面有海量的网站,当然还有更多的网站并没有包括在内。The Washington Post 有做了一个互动工具,可以查看是否被包括在内,以及使用的数量。

C4开始是由非营利组织 CommonCrawl 从2019年4月开始进行的一次抓取,这是人工智能模型的一个很出名的资源。CommonCrawl 告诉《邮报》,它试图优先考虑最重要和最有信誉的网站,但并不试图避免许可或版权内容。

根据 Zac 的测试,他的网站排名 11,196,890,有 280 Tokens

seozac.com rank in C4

我也很好奇,看看本站的情况。

seo.g2soft.net ranking in Google C4

关于新冠病毒

有差不多两个月多一点的时间没有发布新的内容,这不是我的做法,但是的确,这段时间,没有心思来写内容。

整个世界陷入了这样的境界,不知道是人类自己作孽,还是其它的。

一直认为全球化,不是一个好的方向。

比如说,越是全球化,那么世界各地的行业协作就更加的紧密,互相的依赖也越大,这是就更需要一个强有力的全球性的机构,或者地球管理者来做全局的管理。而这样的一个机构必然是垄断独裁的,这不是人类的幸事。

我更加希望的是一个多极的世界,各个地区,或者势力范围互相制约,互相有依赖,但是又没有到谁离不开谁的地步,那样的话,即使世界的局部发生巨大的灾难性事件,其它地方还能救助它,或者更差的情况是能留下人类的种子。

我不认为人类的智慧可以解决所有的问题,而且我们现在生活的环境,日常所依赖的生活必需品,其实都是这几十年里发展出来的,从基本需求上也算不得什么必需品。再回到医药方面,据说现代医学也不过从17世纪的科学革命后从欧洲开始的,实际上很多病症,疫苗等等也不超过一百年。

回到现在的对抗新冠病毒全球流行的问题上,加拿大BC省的主要策略就是待在家里,除了必要的出行,就安全的待在家里,开门营业的店铺都是那些必要的行业,比如超市,加油站,卖蔬菜的,酒类专卖店,大麻专卖店,药房,银行(保留部分分行开门)。学校都关门了,中小学从春假开始就宣布无限期不回学校,现在都是在上网课,各种不同的方式来解决。大学生是早就关闭,但是上网课。

加拿大同其它国家的旅行已经关闭了,只有很多特别的情况才允许,这同世界上大多数国家的做法相同,很有必要。各省之间的航班也减少了许多。

避免不必要的出行,但是BC省的各个城市还是保持了很多户外地方,允许大家出门活动,只要保持必要的社交距离,就是两米的距离。没有推荐戴口罩,这是同亚洲国家最大的不同了。

坦白说,我对于此次病毒流行,本国,本省的政府所作的应对,还是比较满意,并感到放心的。上午看看东部省份的新增病例,以及联邦政府的发布,每天下午三天准时看本省的卫生官员所作的通报,只要看到每天的病例在相对稳定的数值,没有很大的增长,那就还好。

Google AdSense 禁止发布商的那些内容

使用Google AdSense的发布商们有很多,常常发生收到警告的情况,有时候还会被停止账号。通常都是违反了相关的条款,所以为了避免类似情况,好好学习 Google AdSense 的条款还是很有必要的。今年9月 Google 对此有了一些调整,再次了解一下,也更新一下有关的知识。

2019年9月,Google对于 AdSense,AdMob,和Ad Manager的部分内容合作规范做了修订,据说可以让发布商更加容易理解和运用合作规范。
简单而言有两条。

  • 禁止展示 AdSense 广告的内容:非法内容、儿童性虐待材料和恋童癖、露骨色情内容、老少皆宜内容中的成人主题、知识产权滥用、濒危或受威胁物种、危险内容或诋毁内容、促成不诚实行为、与虚假陈述相关的内容、恶意软件或垃圾软件、邮购新娘等。
  • 限制展示 AdSense 广告的内容:色情内容、惊悚内容、爆炸物、枪支、枪支零部件及相关产品、其他武器、烟草、消遣性药物、酒类销售和滥用、在线赌博、处方药以及未获批准的药物和补充剂。Google Ads(以前称为 AdWords)仍然不会投放宣传任何受限内容的广告;此类广告只会来自其他广告产品,或来自发布商与广告客户之间的直接交易。

对于限制内容,展示广告并不算是违规行为,但是可能会发生没有足够的广告内容显示。

而对于禁止内容,在该页面放置 AdSense 广告单元就是违规了,这就可能会受到停止账号的处理。

外链对于SEO的四大好处

看到一位徐老师的问题,如下:
我是一名老师,业余时间喜欢做网站,并对SEO很感兴趣
我想请教您一个问题"在网站的低页(或者是内容页面)放友情连接(或者是外部连接)对网站的SEO有好处还是有坏处?"请您帮我分析一下原因.

我还真不知道什么是低页。不过我猜想问题是有关外链的,那么我就试着来回答一下。

比如A站,B站,两个站点。
在A站的首页,或者内容页面,放一个文字链接,指向B站的某个页面。
对于A站来说,有好处,但并不会太多。就说四个吧。
1)增加A站的信誉度,比如A站,默默无名,但指向的都是高质量,高排名的网站,当然有好处,访客看到的观感就很好。
2)增加A站的内容,当然这个链接所指向的B站也要同A站内容相关,或者相补,当访客看完A站后,很大机会会到B站去逛逛。这样对于A站来说也是内容的一个补充,或扩展。
3)有机会增加A站自身的外部链接,当B站站长看到有关的流量referr来源,会过来看的,如果质量够高也会链接回来。
4)如果B站有显示反向链接或者访客来源历史的话,就会显示A站的链接,在B站的访客也会有机会点击该链接而访问A站。

Google 网站管理员指南-部分更新

在大约一年前,DavidYin曾经比较详细的介绍过Google的网站管理员指南,见(1)(2)。而前段时间,Google更新了其管理员指南,今天我就来稍微介绍一点这方面的内容。

目前的管理员指南部分,同之前的版本并无原则不同,只是在质量指南 - 具体指南部分做了比较详细的解释,以及细化。

这里Google明确列出了八项要注意的地方:

* 请不要使用隐藏文本或隐藏链接
* 请不要使用隐藏真实内容或欺骗性的重定向手段。
* 请不要发送自动查询给 Google。
* 请不要加载使用无关字词的网页。
* 请不要创建包含大量重复内容的多个网页、子域名或域名。
* 请不要制作安装有病毒、特洛伊木马或其他有害软件的网页。
* 请不要专门针对搜索引擎创建"桥页",或使用其他联属计划这类原创内容很少或几乎没有原创内容的俗套 (cookie cutter) 方法。
* 如果您的网站参加联属计划,请确保您的网站可为其增添价值。请提供独特且相关的内容使用户有理由首先访问您的网站。

如果你的网站有这上面八项中的情况,会令Google十分不悦,而这些情况是其明确指出的,也就是说它有足够的技术能力来发现有这种情况的网站,当然在搜索结果中也会做好适当的处理,不让有害的,无用的网站出现在搜索结果之中。

如果还有这方面的问题,请参照过往我对Google 网站管理员指南的介绍,或者直接到Google官方网站来获得有关的信息。

看看你的Blog值多少钱

一个基于Technorati的数据,所作的评估Blog价格的玩具,算不上工具。

只要填入一个Blog的地址,它就会告诉你,该Blog价值几许。

SEO 网站优化推广,目前的估价是
Your blog, seo.g2soft.net, is worth $24,839.76
看清了,是美元啊!

如果是中文的Blog,这个价格估计没有人接盘。而若是英文的话,价格还是比较合理的。

比如我的一个英文Blog,估价是$11,855.34,看着还好。不过如果有人真的会按这个价钱来买别人的Blog才怪。
整个Blog出售比较诡异,而在Blog上出售链接倒是常见的,而且这个价钱更为实际,会真的有人付钱给你哦。

这个东西,我当作一个小玩意儿,放在了右侧。

其实把它当作一个网站优化推广的案例来讲,其病毒营销的手法,的确值得研究。

来自台湾的Blog观察

现在,你如果留心的话,会在本站的右栏里看到部落格观察的指数和其它的相关参数。

很有趣的一个东西,简体中文介绍的相关介绍文章可以看未完成 ,或者 草根的力量,以及i.blogbeta

这样的Blog排名机制对于Blog优化有好处。

比如增加了病毒营销的机会;
提高了曝光率;

现在在SEO 网站优化推广的页面的右侧,新增的一个内容,叫做"小玩意儿",包括SEO工具和社会化工具。

Google Webmaster中心的重要性

过去,我曾经介绍过有关Badware的情况

有时候,那个Badware是站长特意放在网站上的,有时却是被黑客植入了木马后放上的。

Google有个站长中心,Webmaster Center,在那里提交网站的有关资料后,Google的蜘蛛会顺着Sitemaps来抓取。

在那个页面的概要里,会显示有关的情况,一旦Google确认你的网站有Badware,会危及上你的网站的用户,那么就会在这里显示警告

作为站长有责任查看网站的代码等有关的内容,以确保上网站用户的安全。要知道有时候那些木马或者其它的Badware不光会破坏你的电脑,还可能会盗取你的银行账户,密码等资料。

如果你的检查,没有发现任何的问题,不存在Badware的话,那么就给Email到appeals@stopbadware.org申诉,要求再次评估。

最近的Google Webmaster官方Blog发布的消息就是要站长注意。

Google 网站管理员指南(2)

现在我们来讲讲技术层面的东西。在这一部分,Google中文的内容简直是惨不忍睹,我还是链接英文原文,加上我的解释好了,至少看得懂。

Technical guidelines技术指南
大部分的搜索引擎蜘蛛拜访你的网站时候,如同一个文本浏览器,比如Lynx,你可以下载一个Lynx浏览器,看看你的网页在Google蜘蛛的眼中是什么样子。如果由于你使用了Javascript、Cookie、会话ID、框架等复杂的技术,造成在文本浏览器中看不到你希望的样子,那么,显然Google的蜘蛛也看不到。所以要避免这种状况出现。

在Google蜘蛛抓取你的网页的时候,要避免使用会话ID,session ID,这个东西会造成Google抓取网页不完全。
Update:10月25日,Google修改了这条,可以接受参数,尽量简短,不要超过两个,如果可以得话,还是用静态网址的好。

如果你的网站所在的WEB服务器支持if-Modified-Sice HTTP头,那么就打开它,可以告诉Google蜘蛛哪些网页是新的要抓取,那些是旧的不用抓取,这样可以节省你的带宽和服务器开销。

要设置好网站的robots.txt,这个文件是用来告诉搜索引擎的蜘蛛,那些目录可以抓取,那些不可以。要注意的是,确保该文件正确反映你的网站的现状,不要阻止蜘蛛抓取你想给它抓取得目录。你也可以在使用Google Sitemaps的工具来分析。

如果使用了内容管理系统CMS,那么也要确保其能正确导出内容,以便搜索引擎的蜘蛛可以抓取你的网站。

切勿使用"&id="作为网址的参数,因为Google不会在索引中包含这些网页。

从上面的六条内容来看,文本内容很重要,确保您的网站在文本浏览器的样子是你所期望的。
不要使用太多花哨的技术,这样不利于Google的收录。
而且会话ID是Google很不喜欢的。

搜索
关于
David Yin
研究(SEO)搜索引擎优化排名和(PPC)竞价排名技术,总结搜索营销学的各种方法和趋势。专业SEO优化研究,致力于搜索引擎优化技术的普及和推广。
David Yin
Email:seo[AT]g2soft.net
版权说明
如果想转载,而又不明白转载的条件,请看本站的详细版权说明
推荐
Dreamhost Hosting
使用优惠码“save252015”,节省更多,每月只要 $2.59。
标签云
热门标签