2025吐槽季第一弹---腾讯云EO边缘安全加速平台服务

前言:

关于EO边缘安全加速平台服务

参照:产品概述,具体如下:

边缘安全加速平台 EO(Tencent Cloud EdgeOne,下文简称为 EdgeOne)是国内首款基于全新架构的真正一体化的边缘安全加速平台。提供全面的安全防护、网络&应用性能加速、领先的边缘计算和完善的监控运营分析能力。当前 EdgeOne 产品四大板块已逐步成熟,为开发者提供多样化的技术解决方案:

边缘加速 通过优化 HTTP/HTTPS,TCP/UDP 网络传输,并结合动静态内容,以一站式极简的模式为客户多样化的业务内容提供高效的加速服务
边缘安全 通过分布式架构为业务提供 DDoS/WAF/Bot/ 速率限制等全面的安全防护能力,将安全能力进一步开放普惠,为用户提供常态化防护
边缘媒体 依托于腾讯20多年来在网络与音视频技术上的深度积累,将媒体能力进一步下沉至边缘节点,为多媒体类业务提质增效
边缘开发 根据业务发展需要灵活编程,结合 AI 为开发者提供丰富易用的工具,支持快速开发、部署和管理边缘应用

名词太多,我个人的理解就是其所谓的下一代cdn服务,内容分发服务的首页也是这样推荐的:

当时CDN的首页界面显示下一代CDN我个人的理解是后续两个产品会进行整合,我个人也进行了简单的体验,应该也是比较早的一批用户:

后续发现两个服务是割裂的,没有整合的迹象。就继续使用了传统的内容分发网络CDN服务。

突然出现的问题

合作方项目,廊坊合肥双中心。静态资源使用了腾讯云的EO边缘安全加速平台服务,下周要进行灾备切换演练。在更新窗口期进行了一遍灾备脚本的测试,在关闭合肥数据中心互联网入口,访问应用服务出现大量522报错,业务场景无法进入:

由于我们作为第三方,没有合作方EO边缘安全加速平台服务的权限,联系腾讯云人员查看该加速域名出现525异常错误码的源站ip地址:

通过腾讯云人员的反馈我发现返回异常的节点全部为合肥数据中心节点ip,到这里基本确认了是关闭合肥中心,EO去访问关闭源站的服务造成的访问错误,后续按照这里开始排查!

关于http 525错误码:

参照:EdgeOne 4XX/5XX 状态码排障指南

当然了我的源站关闭了,他的ssl握手必然是失败的。后续问题就围绕这里开始展开了!

腾讯云EO边缘安全加速平台服务吐槽

按照我个人的理解,我的源站某些关闭了web服务,不管是主动 或者被动的方式我的异常节点应该是自动下线了。不应该去访问我的异常节点了?我尝试刷新频繁浏览器访问我的加速域名url完成我对该问题的猜想:

频繁访问发现基本是轮训的状态(525返回错误码较多,因为合肥4个ip绑定了一个源站,廊坊只有一个ip...别问为什么,合作方是打野)

这里就围绕着我与腾讯云人员的交流展开这里的吐槽!

EO服务是否有对源站的容灾方案

对比内容分发网络CDN服务,我记得该服务是有热备源站的配置方法的:

我看了一遍EO的控制台:

,域名管理添加域名的这里有ip/域名 源站组的概念。我需要增加多个ip/域名看了就不支持了,要尝试使用源站组的配置:

but源站组这里确实没有我针对源站异常处理的方式?

与腾讯云人员确认:源站组的策略是轮训,默认兜底逻辑:EO的回源节点单机请求源站60s内失败5次该机器会停止访问该源站10分钟

到这里了我就很不满意:

  1. 轮训的策略是否合理,当然了控制台也可以看到用户可以设置源站的权重,所以这里不是什么问题。
  2. 兜底策略是否合理?以上兜底策略可以匹配一些用户。但是我的应用场景并不匹配。我也需要对于我的个人场景进行自定义的设置

关于EO新的负载均衡的模式

腾讯云的小伙伴一直在跟我交流说负载均衡的模式可以满足我的需求,参照:域名服务与源站配置

但是这貌似是一个内测功能,并且马上内存一年了.我特意看了一眼我司的企业账号,我竟然还没有灰度到...作为一个10年以上腾讯云企业用户(并且反馈了n多用户体验的老用户),竟然还没有体验到该功能...虽然群里的小伙伴说可以给我加白...但是我要的是这体验吗?腾讯云的产品给我加白的各种体验的也有十多款了...图什么啊,一年多了还没有灰度到我这种用户?每个都是单独产品联系加白名单,体验很差对我来说。通过健康检查策略确实能实现我的上述的问题处理:

体验后的吐槽总结

  1. 源站组的兜底策略我希望是用户可控的,你可以有默认,但是我业务场景不一样,我希望可以能自己设置。
  2. 新功能与加白方式的用户体验很差,内测时间较长。
  3. eo首页这个站点和域名的概念让我很是纠结。我的后知后觉站点其实是增加我一个二级域名?域名是让我在耳机域名下可以加三级or其他?
  1. 日志服务跟cls的整合跳转我也感觉设计的很不好,虽然是支持cls了:

页面就这样...没有个查询的什么or跳转到cls服务该日志集的...

  1. 未与腾讯云可观测平台进行很好的整合:

起码我在eo控制台首页只看到了告警服务的自定义指标,没有与可观测平台很好的整合,并且,告警服务,为什么我没有看到接收告警信息的起码的用户组?

  1. 我想要的不只是所谓的监控告警:我觉得为什么不能介入可观测平台,然后可以对我源站探活(主动or被动),然后我可以自由设置规则,比如第一次失败后多久,继续第二次探活...失败后执行什么样的策略.什么时候出发告警。如果是腾讯云本身的业务,我如果触发一个操作区完成故障自愈?
  2. 一直都在说其他厂商的产品怎么样怎么样...我们还是需要创新的...

吐槽完毕,周一看我的灾备切换合作方能否配合不,比较修改这种配置他们都需要走所谓的窗口...卑微的打工人上线...

相关推荐
黑客老李1 分钟前
JavaSec | SpringAOP 链学习分析
java·运维·服务器·开发语言·学习·apache·memcached
BOB-wangbaohai2 分钟前
阿里云ACP云计算备考笔记 (4)——企业应用服务
阿里云·云计算·云监控·云解析·云cdn·sls日志服务
杨浦老苏2 分钟前
轻量级Docker管理工具Docker Switchboard
运维·docker·群晖
江湖有缘5 分钟前
【Docker管理工具】部署Docker可视化管理面板Dpanel
运维·docker·容器
这儿有一堆花39 分钟前
安全访问家中 Linux 服务器的远程方案 —— 专为单用户场景设计
linux·服务器·安全
RussellFans1 小时前
Linux 文本三剑客(grep, awk, sed)
linux·运维·服务器
猴哥聊项目管理1 小时前
什么是DevOps智能平台的核心功能?
运维·项目管理·制造·devops·软件·项目管理软件·软件分享
Chuncheng's blog1 小时前
CentOS 7如何编译安装升级gcc至7.5版本?
linux·运维·c++·centos
aitav02 小时前
⚡️ Linux Docker 基本命令参数详解
linux·运维·docker
Nazi62 小时前
docker数据管理
运维·docker·容器