健康检查

我们可以在分区级别/集群级别为网关节点开启健康检查。

开启健康检查后,edge-admin 会按照配置,向 edge-node 发起检查请求, 如果不符合预期,则认为该 node 不健康。

注意:需要 edge-admin 到 edge-node 的网络是通畅的,才可以开启健康检查,否则会因为网络不通,node 节点会被 admin 认为是不健康。

分区级别开启网关节点健康检查

我们先看分区级别的配置,我们可以配置某个分区的所有网关节点是否开启健康检查,默认也推荐这种方式。

我们首先点击进入 集群分区 页面,里面列出了已经存在的分区(通常情况下,只有一个默认的分区,或者少量的分区):

接下来,我们编辑一个分区,选择 基础 标签栏,可以看到健康检查的开关(默认是关闭的)。

我们点击开启健康检查,也可以配置健康检查的参数:

Edge 支持三种健康检查模式:

  1. TCP
  2. HTTP
  3. HTTPS

意味着 edge admin 会向 edge node 发送

  1. TCP connection
  2. HTTP 请求
  3. HTTPS 请求

对于 TCP 检查模式,只需要 TCP 连接成功,就认为 node 是健康的。 对于 HTTP/HTTPS 模式,还可以配置期望的期望的响应状态码,或者响应体需要包含的字符串模式。

点击保存,就会开启健康检查。

当某个网关节点连续检查不健康的次数达到配置的阈值, Edge 会自动将该节点标记为“离线”状态(此时在 网关集群 页面上,节点 IP 前的绿色指示灯会变成红色)。 意味着:该节点会自动从 DNS 和 集群内缓存服务中剔除。

我们还可以查看健康检查的具体日志:

这里可以看到每个 node 节点最近的检查成功/失败次数,以及失败的原因。

网关集群级别开启健康检查

如果我们想针对某个网关集群,做一些特殊的健康检查配置,也是可以的。 我们首先点击进入 网关节点 页面,里面列出了已经存在的网关集群:

我们点击一个网关集群的 编辑按钮,可以看到有健康检查的三个选项:

  1. 使用分区的配置(默认会使用这个配置)
  2. 启用(针对这个网关集群,定制开启健康检查)
  3. 禁用(针对这个网关集群,关闭健康检查,但是不影响该分区的其他网关集群)

比如,我们针对这个网关集群关闭健康检查。

点击保存,这个网关集群的健康检查就关闭了。