字节流到输出流

文档

dom.spec.whatwg.org/#parsing

考虑几个字节流到输出流的问题

  • 网络获取是chunk获取【分段获取】,那对于浏览器来说是否是获取到所有资源后在统一进行解析?
  • 压缩的风险是什么?
  • 想"白嫖"cdn时,js和图片有区别不?找个git平台可以不?
  • Meta信息可以修改编码,http也有,他们的区别是什么?
  • ....

本文不解释,直接上现象

content-type决定了那个解析器 : text/html - byte/1.js

显然,这种解析规则跟html是不一样的

content-type决定了使用哪种解析器

注:同样包含决定使用哪个解析器的还有标签

思考题

  • 考虑下如何"白嫖"cdn或者建站?
  • 考虑下如何"反白嫖"

分段传输 - byte/1.html

限下流,速度降低,可看到如下页面

解析是可以分段的,这并不复杂,但会包含一个笼统的特点,普通的html标签可以不闭合【script/style等特殊的不行】

我们在看cdn【js/css】,小说或者图片时,很容易遇见一段一段的现象

思考题

  • 如果是你,你会怎么设计以下实现
javascript 复制代码
 // 页面显示: <div>123</div>
document.write("<div>123")
 // 页面显示: <div>123456</div>
document.write("456")
 // 页面显示: <div>123456789</div>
document.write("789</div>")

标签可以不闭合 - byte/2.js

如果1s发送1段内容,那么浏览器会如何渲染?

javascript 复制代码
const express = require('express');
const fs = require('fs');
const app = express();

app.get('/1', (req, res) => {
    const text = fs.readFileSync("2.html","utf-8")
  
    const arr = text.split("\r\n")
    arr.forEach((txt,i)=>{
        setTimeout(()=>{
            res.write(txt)
        },i*1000)
    })

    setTimeout(()=>{
        res.end()
    },arr.length*1000)
    
});
    

app.listen(3000)
html 复制代码
<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Document</title>
</head>
<body>
    <div>11111111
         22222222
         33333333
         44444444
         55555555
    </div>
</body>
</html>

标签可以不闭合,一般没啥问题,但考虑下,比如"严格"限制闭合标签,可能会产生的问题,当然,对于现在的网络环境而言并不复杂【至少国内是】

注:这也是比较老的一个点,以前table中包含tbody,浏览器解析时,必须遇见/tbody才会解析里面的内容,所以会分割很多个tbody用于加速显示,现在无所谓了

Gzip压缩 - byte/3.js

一般的字节流和字符流可以直接转换【直接解码】,同时我们也知道Receive Response后会进入渲染流水线线,但是压缩呢?

如果使用压缩,html是否可以分段解析?

将网速调低,可以看到如下结构,指解析了一次

去掉gzip压缩,在看一次没有压缩的情况

显然,字节流转换到字符流,此处与压缩格式【Content-Encoding:gzip】有关,同时也会影响到后续的渲染流水线

注1:理论上gzip更常见的是资源文件【js/css】,因为资源文件大多需要等待完成后在解析【获取一半也没法解析】

注2:实际上减少传输次数的优化,远远大于分块解析【我瞎掰的,也可以描述为动态解析】

注3:更何况html文件一般不大【无视后端渲染哈】,远远不足1.5k【tcp包大小】

思考题

  • 如果压缩后,传输过程中错了一个字符,是不是数据全丢了重新传?

对于字节流到字符流,还有一些其他的内容,此处直接忽略

解码会根据meta影响- byte/4.html

如图,我的编码格式是gbk,我的内容却进行了解码

最大的"bug"在于,编码以后得到的meta值需要修改编码这个值

解码不完全会根据meta影响 - byte/5.html

更大的"bug",如果meta前的数据N多,解码的规则就会失效

  • 原因来自于解析规则,只针对前1k信息处理编码相关的内容

规范/原理

有兴趣的可自行读取,后续不再重复

html.spec.whatwg.org/multipage/p...

字节流就是来自网络层,确定编码后会将字节转换为字符

相关推荐
Ziky学习记录5 分钟前
从零到实战:React Router 学习与总结
前端·学习·react.js
wuhen_n10 分钟前
JavaScript链表与双向链表实现:理解数组与链表的差异
前端·javascript
wuhen_n14 分钟前
JavaScript数据结构深度解析:栈、队列与树的实现与应用
前端·javascript
狗哥哥35 分钟前
微前端路由设计方案 & 子应用管理保活
前端·架构
前端大卫1 小时前
Vue3 + Element-Plus 自定义虚拟表格滚动实现方案【附源码】
前端
却尘1 小时前
Next.js 请求最佳实践 - vercel 2026一月发布指南
前端·react.js·next.js
ccnocare1 小时前
浅浅看一下设计模式
前端
Lee川2 小时前
🎬 从标签到屏幕:揭秘现代网页构建与适配之道
前端·面试
Ticnix2 小时前
ECharts初始化、销毁、resize 适配组件封装(含完整封装代码)
前端·echarts
纯爱掌门人2 小时前
终焉轮回里,藏着 AI 与人类的答案
前端·人工智能·aigc