首先分享之前的所有文章 , 欢迎点赞收藏转发三连下次一定 >>>> 😜😜😜
文章合集 : 🎁 juejin.cn/post/694164...
Github : 👉 github.com/black-ant
CASE 备份 : 👉 gitee.com/antblack/ca...
一. 前言
后端程序员碰到这个概念的场景其实不多,我首次碰到还是在搭建自己博客网站的时候。
用最直观的场景来描述就是 : 买的服务器带宽太低,导致前端下载静态文件卡顿。
解决的方式是 : 将域名配置 CDN , 让静态文件获取不走后端服务器。
在高并发的系统中, CDN 可以帮助用户对静态文件分流,减少服务器负载.
二. 先看流程
2.1 原本的问题
- 请求直接打到业务源服务器上面 ,占用资源(带宽,CPU,端口,内存等等)
- 请求很难就近选择服务端,数据传输过程长,稳定性差,延时高
- 恶意请求会直接打到服务器上,增加风险
- 稳定性差,业务稳定性依赖于源服务器的可用性
2.2 CDN 的处理流程
- 当用户向源域名 (image.a.com) 发起请求的时候,会发起 DNS 查询
- DNS 基于源域名通过 CNAME 获取到 CDN 域名 (dns.a.com)
- 请求在 CDN 服务节点中,通过智能路由选择最近的 CDN 节点 (PS :这一步也可以通过负载均衡 DNS 实现)
- 用户获取解析IP 地址 , 向 IP 地址发起访问
- 访问 CDN 节点如果没有缓存,则透传到源节点访问,同时回写 CDN
关于智能路由
智能路由是指根据用户的地理位置、网络状况和其他条件,动态地选择最优的 CDN 节点来提供内容。
这个机制可以在 CDN 服务节点中实现,也可以在 DNS 服务集群中实现。从阿里藏经阁中找到的文档就能看到 :
通过 DNS 调度服务找到了对应最近的 IP ,再直接访问对应的 IP 地址。
三. 再看使用
以某云为例,当初几块钱搞了一个域名 :
先看专业术语
- CDN : 内容分发网络 (Content Delivery Network)
- 边缘节点 : 即 CDN 节点 ,本质上是部署在全球的服务器,用于缓存和分发内容
- Cache 缓存 : 即 CDN 上缓存的请求内容
- 源站 : 存储网站或应用程序内容的实际服务器
- 回源 : 当用户请求的内容在 CDN 节点上没有缓存时,CDN 节点向源站服务器请求获取内容,并将其缓存到节点上
- 缓存命中和缓存未命中 : 存在缓存时则为缓存命中
- 清除缓存 : 当数据不正确时,需要把 CDN 节点上的内容清除
- DDoS 防护 : 帮助抵御恶意的 DDoS 攻击
四. 深入原理
4.1 怎么把 CDN 配置到 DNS 里面
第一步就是让请求打到 CDN 服务器 ,而不是源服务器。要实现这一步最终还是需要 DNS 的配合
java
// 方式一 : CNAME 记录
- 1. CDN 服务提供商提供一个用于 CDN 的域名
- 2. 在 DNS 解析服务提供商 中配置 CNAME , 将源域名指向 CDN 域名
- 3. DNS 辅助访问源域名时自动指向 CDN 域名
// 方式二 : A 记录
- 1. 从 CDN 服务商处获取 CDN 节点的 IP 列表
- 2. 将 IP 列表配置到 DNS 的 A 记录中,走常规的 DNS 解析 IP 的流程
CNAME 是什么 ?
- CNAME 是 DNS 记录类型之一,全称为"Canonical Name"(规范名字)
- CNAME 是创建了一个域名的别名,将一个域名指向另外一个域名
- 通过 CNAME 可以把加速域名指向 CDN 域名,这样 DNS 就能将请求解析到 CDN 域名
A 记录是什么 ?
- DNS 的基础概念,用于将域名映射到 IPv4 地址
- 一个域名可以配置多个 IP 地址
4.2 CDN 命中失败的原因
- 客户端请求是动态请求
- 源站返回强制不缓存的HTTP 头
- 未返回响应头Etag 和Last-modified
- 全站加速未配置静态加速
4.3 CDN 缓存慢的原因
- 刷新缓存,可能导致短时间内命中率下降。
- 带宽突增,会导致CDN 节点回源较多,命中率会表现有下降趋势。
- CDN 节点访问新内容,导致CDN 节点回源较多,命中率会表现有下降趋势。
- 缓存规则调整,可能会影响命中率。
五. 成本估算及场景
5.1 成本估算
- 参考国内的阿里云和腾讯云 ,10TB的 CDN 总量大概在 1200 左右
- 掘金里面第一次访问一个页面的流量大概在3M左右 (后续访问会走本地缓存,这一块实际上不会走到 CDN)
- 那么 10TB CDN 平均可以支持 300万 次单页面的访问 (假设忽略浏览器缓存和大图片)
这个价格相比扩充带宽肯定是更划算的,带宽闲时供应商可不会给你减钱哦,同时处理网络请求带来的负载消耗也不小。
看了一下掘金的 img 确实走的 CDN 。
5.2 适用场景
- 静态文件缓存 : 如图片、样式表、脚本等
- 流媒体和视频分发 : 分发流媒体和视频内容,减少视频加载时间和缓冲
- (不过我感觉流媒体走 DNS 效果可能不好)
- 动态内容加速 :应该是基于关键字进行缓存,功能肯定没有服务端的强大
- 全球负载均衡 :根据用户的地理位置和网络状况,将请求路由到最优的服务器节点
- 高峰期缓存预热 :支持缓存内容的刷新和预热,确保内容更新后能及时生效
5.3 一般服务商会提供的功能
- 访问控制 :白名单 、 盗链 、鉴权 、QPS 、限速 、端口限制 等等
- 缓存规则 :基于缓存键 ,基于状态码 ,基于 HTTP 头部 ,缓存过期时间等等
- 回源方式 : 分片 ,回源请求头配置 , 超时时间等等
- HTTPS 配置 : 版本,配置等
- 定制化 : 错误页面,指定状态码,压缩等等
总结
这篇是系列文章的第一篇,后续会陆陆续续把并发场景的知识点详细的过一遍。
想做一个秒杀的全流程系列文章,只能做后端层面的压测,所以前端限制这一块只能通过概念的形式展现了~~
CDN 原理了解就行,应用使用供应商的服务即可,基本上云开发商都提供了这些服务接口。