Googlebot 很快就要支持 HTTP/2 了

从 2020 年 11 月开始,Google 的 网络蜘蛛就要开始对部分网站开始用 HTTP/2 的方式抓取了。

各大网站和主流浏览器,支持 HTTP/2 已经有相当长的一段时间了。CDN 服务商也大多都支持了 HTTP/2 了。

采用 HTTP/2 方式,Google 可以用更少的资源来更快的抓取内容,效率当然就更高了。

HTTP/2 的具体优势

  • 二进制分帧机制
  • 多路复用
  • 服务器推送
  • 头部压缩
  • 数据流优先级

这些都能给与 GoogleBot 更多的获益。

AWS CloudFront 支持 TLS1.3

根据 AWS 的公告,可以看到它们的 CloudFront 支持 TLS1.3 了。

Amazon CloudFront 现在支持 TLSv1.3,以提高性能和安全性。Amazon CloudFront 是一个全球内容交付网络 (CDN),使您能够以低延迟和高可用性的方式将内容安全地分发到浏览者。Amazon CloudFront 支持使用传输层安全 (TLS) 的 HTTPS,以加密和保护您的浏览者客户端和 CloudFront 之间的通信。TLSv1.3 是 TLS 的最新版本。

更好的性能

TLSv1.3 提供了更好的性能,更简单的握手过程,更少的往返次数。TLSv1.3 只需要一次往返(1-RTT),而 TLSv1.2 则需要两次往返(2-RTT)来协商一个新的安全连接,这在实际的性能上得到了改善,降低了第一字节延迟。以我们在美国地区的内部测试为例,与之前的TLS版本相比,TLSv1.3 新连接的首字节延迟降低了33%。

安全性改进

TLSv1.3 删除了以前版本的 TLS 中的旧功能和旧的密码套件,同时只支持 PFS(完美前向保密)密码套件。TLSv1.3 也只支持 PFS(完美前向保密)密码套件,它可以生成一个只用于当前网络会话的一次性密钥。

TLSv1.3 今天就可以使用,并在所有 Amazon CloudFront 安全策略选项中默认启用。您无需对 CloudFront 配置进行额外的更改,即可从 TLSv1.3 对查看器连接的安全性和性能改进中获益。虽然大多数现代 Web 浏览器已经支持 TLSv1.3,但不支持 TLSv1.3 的客户端将自动协商到客户端支持的最高 TLS 版本(TLS 1.2、1.1 或 1)。在使用自定义SSL证书时,您可以选择一个最小支持的安全策略。

华为的 AspiegelBot 或者说 Petalbot

前些日子,屏蔽了一些 IP ,在做了一些研究后,发现这些都是来自华为。

一直以来,都认为华为只是做硬件,做软件,还没想到它们还要做搜索。可惜的是,他们一如既往的不按规矩来,过度的抓取,以及完全不考虑被抓取的网站的性能影响。

打开 http://aspiegel.com/en/about/ 网页,可以看到写着。

Aspiegel: The HUAWEI Mobile Services (international) are provided by Aspiegel Limited.

如果继续,打开 http://aspiegel.com/en/how-petal-search-works/ 网页,可以看到Petal Search 的相关介绍。

所以华为搜索引擎,就是 Aspiegel 搜索,现在改名成为了 Petal Search。就是一回事。

petal-search.jpg

根据 Hyypernode.com 主机商的情况报导,华为的搜索引擎蜘蛛对他们的用户的影响,很多人抱怨,机器人淹没了他们的网站,在线服务因被 AspiegelBot 的流量淹没而无法使用。

如何屏蔽华为的蜘蛛、机器人

一般就是两种办法。

1) 用 Robots.txt 设置,禁用它。


User-agent: PetalBot
Disallow: /

MovableType 7.4.0 r4609 的富文本编辑器问题,以及本站的改动

之前,升级到了最新的MovableType 7.4.0,据报道,有部分用户出现了富文本编辑器的编辑按钮不显示的问题。甚至在 MovableType 6 也有同样的情况。

主要的原因就是升级了 TinyMCE 的版本。

在之前的升级中,系统更新了 TinyMCE 到 5.2.2 版本。

https://www.sixapart.jp/movabletype/news/2020/08/21-1710.html

看看官方的说明,如果遇到类似情况,可以参考。

其实今天,主要我是把本站做了小小的更新。

首先,本站的模板是定制的,用了 Bootstrap 框架,以及 jQuery,等等 js 库。

主要更新包括如下:

  • 更新 Bootstrap, 从 4.3.1 到 4.5.2
  • 更新 jQuery, 从 3.4.1 到 v3.5.1.
  • 更新代码高亮的 js 库, Highlight, 从10.0.0. 到 v10.1.2
  • 去掉了 原先添加的 lazyloading 的 js 库, lazysizes 5.1.2
  • 不考虑旧的浏览器,新一代的浏览器原生已经支持图片的 lazy loading了,所以,在 MovableType 的程序中,做了硬改动。

升级到 MovableType 7.4.0 r4609

好了,SixApart 发布了更新版本,就是 MovableType 7.4.0, R4609。对于一直保持更新的我来说,这是一个小版本的升级,也就是下载源文件,上传到服务器覆盖,基本上没有什么数据库的事情,都是源文件的更新。


MT4609-update.jpg

Google 搜索 2020 五月核心算法更新,以及如何应对

在五四这个伟大的日子里,Google 搜索宣布,推出 2020年五月 核心算法更新。如果过去一样,直接称之为 May 2020 Core Update。

一般这种算法大更新,从宣布开始,到全球各地数据同步,并反映到普通用户的搜索结果上,大概总要一到两个星期。这样推算,大概到今天,也就是五月十八日,基本更新完成。

may2020-core-update.jpg

Google 核心算法更新

每一天,谷歌通常会发布一个或多个旨在改善我们的搜索结果的变化。大多数变化并不明显,但会帮助 Google 逐步地继续改进。有时,更新可能会更加明显。

每年都会针对搜索算法和系统进行几次重大的、广泛的改动。Google 把这些变化称为 "核心更新"。这些更新的目的是为了确保向搜索者提供相关的权威内容。

Google 所确认的 核心更新,对某些网站可能有很大的影响,站长会注意到流量的下降和手机的变化,而那些遇到下降的网站都会试图修复,但Google 希望确保站长们不会把对的改成错的,另外,可能根本从网站的角度没有什么好修复的。

升级到 MovableType 7.3 (r.4607)

看到新的通知,MovableType 7.3.0 发布了,是 release 4607版本。
我目前用的是 r4605,所以基于对安全性的考虑还有性能方面的改进,当然是尽快升级为好。

因为使用的是个人免费版,到这个网址提取下载链接。

通常这种小升级,就做好备份就可以升级了,不需要做升级测试的。

升级的方式也就是覆盖文件,然后登录后台,会提示升级,继续就可以了。

movabletype7.jpg

最重要的还是做了哪些改进,下面来看看。

新增或者改进的功能

  • [MTC-26528] Add Table in RichText Editor.
  • [MTC-27218] Enable selecting tasks via run-periodic-tasks
  • [MTC-27190] Improve not to insert unnecessary line-feed or space in "Convert to Linefeed".
  • [MTC-27130] Log to STDERR when MT::Util::Log is not set.
  • [MTC-27119] Add PurePerl Digest::SHA、Digest::MD5 modules for fallback.
  • [MTC-27063] Log removing a file at rebuilding.
  • [MTC-27039] Improve the UI of editing category fields in Content Data.
  • [MTC-27011] Support PHP 7.4
  • [MTC-27006] Enable DBHost with Oracle.
  • [MTC-26629] Enable "requiresslreuse=YES" in Content Sync.
  • [MTC-26558] Add ids of HTML elements in the admin menu.
  • [MTC-10962] Support Emoji, with utf8mb4 of MySQL / MariaDB.

我把自认为比较有用的功能做了标记。

更新了一下 CDN 服务比较表

早几年为了寻找合适自己的网站和 Blog 的 CDN 服务,做了不少的搜索研究和比较,后来,想着或许有人也会需要,就做了这个比较表。

我用 Amazon 的 Cloudfront CDN 服务有些年头了,一直也用的不错,没有什么问题或者故障。但是人总是会想着会有更好的,或者新奇感,想尝试一些其它的服务商。

所以这就找出去年做的比较表,查找了各个服务商官方网站,更新了一下信息,并且加上 Beluga CDN 替换下了 Verizon。

belugacdn-home.jpg

Beluga CDN 介绍

节点数量和布局

Beluga CDN 的覆盖在全球有 28个全球节点,和 9 个超级节点。

价格及收费

Beluga CDN 是全球统一费率,US$0.01/GB。

对于 Request 收费而言,只有在每 GB 的流量超过 5K requests 的情况下才会额外收取费用,根据说明是$0.0035 / 10,000 request,举例来说,就算是通过 CDN 服务的都是 20KB 大小的文件,算上额外的 request 的费用,每 GB 也不过是 $0.026,还是非常低廉的。

可以免费试用,无需长期合同,按需使用付费。

迁移到新 VPS 并重建系统

在尝试安装新的 Ubuntu 20.04 ,并且把原来 VPS 上的网站所需要的那些功能,或者必要的模块,都能正常使用,没有兼容性的问题之后,在前天,开始新建一台 VPS,仍然放在了 DigitalOcean

基本上都是按照,上周所写的步骤,按照这样的顺序来安装:

  • Ubuntu 20.04 LTS
  • Webmin
  • Nginx
  • MariaDB
  • php7.4-fpm
  • Perl-Fastcgi
  • SSL 证书签发

迁移网站的过程也比较简单,主要包括两个部分,备份和恢复。

  • 原 VPS 上,打包所有的网站目录和文件,用 mysqldump 把相关的数据库都做了备份。
  • 新 VPS 上,从原 VPS 转移打包的文件和备份的数据库,先恢复数据库,然后解压缩打包的网站文件。如果数据库的连接用户名和密码同原来不同,做相应的修改。
  • 新 VPS 上,配置 nginx 的网站配置文件,参考原 VPS 上的配置文件。临时修改本机的 hosts 文件,把网站指向新 VPS 的 IP 地址,然后再本机调试,没有问题后。修改 DNS 设置,更新 IP,大概十五分钟后,全球 DNS 的访问都已经指向新 VPS 了。
  • 待所有的网站都迁移完毕,把原 VPS 上的网站 access.log 文件也备份到本地。用来分析网站访问来源的。
  • 大概等待两天左右,观察原 VPS 上的网站已经没有访问者了,就可以关闭,摧毁它了。

安装 Ubuntu 20.04, Webmin, Nginx, MariaDB, PHP7.4-FPM,Perl-Fastcgi 到 DigitalOcean 的 VPS(5)

安装 Ubuntu 20.04 LTS, Webmin, Nginx, MariaDB, PHP7.4-FPM,Perl-Fastcgi 到 DigitalOcean 的 VPS上。

之前介绍了如何在 DigitalOcean 创建新 VPS。并且完成基本的 Ubuntu 20.04 LTS的系统。然后介绍如何安装 Webmin 主机控制面板,时区设置和 SSH 的安全设置。再之后说明一下如何用之前的新添加的用户来安装 Nginx Web 服务器和 MairaDB数据库服务器。以及安装完 php 语言和SSL 证书的申请。

现在要来介绍一下如何配置 nginx了。

第五部分

修改 Nginx 配置文件,以满足证书的使用之前,先执行一个命令,来生成一个4096位的 dhparam 文件。

cd ~/ssl
openssl dhparam -out dhparam.pem 4096

需要等待一段时间,这个命令会执行比较长时间。

配置 https 主机

先来确认各个部分的版本信息,下面要用到。

[email protected]:~/ssl$ nginx -v
nginx version: nginx/1.17.10 (Ubuntu)
[email protected]:~/ssl$ openssl version
OpenSSL 1.1.1f 31 Mar 2020

配置参数的来源根据 Mozilla SSL Configuration Generator 这个生成器来产生。

ssl-config-generator.jpg我会建议采取 Modern 方式的配置。

主机配置文件做相应的修改, http 网站重定向到 https。 采用 http2,还有就是 HSTS 与载入配置,最后完整的 u20.webexample.win 的配置文件,可以到 gist 查看,也可以本地下载查看,仅供参考。

到 SSL Labs 检测 SSL的配置,评分得到 A。

ssllab-a-rating.jpg

安装 Ubuntu 20.04, Webmin, Nginx, MariaDB, PHP7.4-FPM,Perl-Fastcgi 到 DigitalOcean 的 VPS(4)

安装 Ubuntu 20.04 LTS, Webmin, Nginx, MariaDB, PHP7.4-FPM,Perl-Fastcgi 到 DigitalOcean 的 VPS上。

DavidYin 介绍了如何在 DigitalOcean 创建新 VPS。并且完成基本的 Ubuntu 20.04 LTS的系统。然后介绍如何安装 Webmin 主机控制面板,时区设置和 SSH 的安全设置。再之后说明一下如何用之前的新添加的用户来安装 Nginx Web 服务器和 MairaDB数据库服务器。

现在就是很重要的语言支持部分了。因为我用的最多的就是 php 以及 perl 语言。所以这两部分就是重点了。

第四部分

安装 php7.4-fpm

Ubuntu 20.04 LTS 仓库所包含的是 php7.4,目前 php 官方支持的版本是 从7.2,7.3,7.4 这三个系列。所以直接使用Ubuntu的就已经是很新的版本了。

sudo apt install php7.4 php7.4-fpm php7.4-cli php7.4-common php7.4-mbstring php7.4-gd php7.4-intl php7.4-xml php7.4-mysql php7.4-zip php7.4-json php7.4-curl

安装完成后,执行 php -V 命令,可以看到版本信息。

[email protected]:~$ php -v
PHP 7.4.3 (cli) (built: Mar 26 2020 20:24:23) ( NTS )
Copyright (c) The PHP Group
Zend Engine v3.4.0, Copyright (c) Zend Technologies
    with Zend OPcache v7.4.3, Copyright (c), by Zend Technologies

再看一下 php7.4-fpm 是否已经运行。

sudo service php7.4-fpm status

php74-fpm-status.jpg

搜索
关于
David Yin
研究(SEO)搜索引擎优化排名和(PPC)竞价排名技术,总结搜索营销学的各种方法和趋势。专业SEO优化研究,致力于搜索引擎优化技术的普及和推广。
David Yin
Email:seo[AT]g2soft.net
版权说明
如果想转载,而又不明白转载的条件,请看本站的详细版权说明
推荐
Dreamhost Hosting
使用优惠码“save252015”,节省更多,每月只要 $2.59。
归档
标签云
热门标签