字节流到输出流

文档

dom.spec.whatwg.org/#parsing

考虑几个字节流到输出流的问题

  • 网络获取是chunk获取【分段获取】,那对于浏览器来说是否是获取到所有资源后在统一进行解析?
  • 压缩的风险是什么?
  • 想"白嫖"cdn时,js和图片有区别不?找个git平台可以不?
  • Meta信息可以修改编码,http也有,他们的区别是什么?
  • ....

本文不解释,直接上现象

content-type决定了那个解析器 : text/html - byte/1.js

显然,这种解析规则跟html是不一样的

content-type决定了使用哪种解析器

注:同样包含决定使用哪个解析器的还有标签

思考题

  • 考虑下如何"白嫖"cdn或者建站?
  • 考虑下如何"反白嫖"

分段传输 - byte/1.html

限下流,速度降低,可看到如下页面

解析是可以分段的,这并不复杂,但会包含一个笼统的特点,普通的html标签可以不闭合【script/style等特殊的不行】

我们在看cdn【js/css】,小说或者图片时,很容易遇见一段一段的现象

思考题

  • 如果是你,你会怎么设计以下实现
javascript 复制代码
 // 页面显示: <div>123</div>
document.write("<div>123")
 // 页面显示: <div>123456</div>
document.write("456")
 // 页面显示: <div>123456789</div>
document.write("789</div>")

标签可以不闭合 - byte/2.js

如果1s发送1段内容,那么浏览器会如何渲染?

javascript 复制代码
const express = require('express');
const fs = require('fs');
const app = express();

app.get('/1', (req, res) => {
    const text = fs.readFileSync("2.html","utf-8")
  
    const arr = text.split("\r\n")
    arr.forEach((txt,i)=>{
        setTimeout(()=>{
            res.write(txt)
        },i*1000)
    })

    setTimeout(()=>{
        res.end()
    },arr.length*1000)
    
});
    

app.listen(3000)
html 复制代码
<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Document</title>
</head>
<body>
    <div>11111111
         22222222
         33333333
         44444444
         55555555
    </div>
</body>
</html>

标签可以不闭合,一般没啥问题,但考虑下,比如"严格"限制闭合标签,可能会产生的问题,当然,对于现在的网络环境而言并不复杂【至少国内是】

注:这也是比较老的一个点,以前table中包含tbody,浏览器解析时,必须遇见/tbody才会解析里面的内容,所以会分割很多个tbody用于加速显示,现在无所谓了

Gzip压缩 - byte/3.js

一般的字节流和字符流可以直接转换【直接解码】,同时我们也知道Receive Response后会进入渲染流水线线,但是压缩呢?

如果使用压缩,html是否可以分段解析?

将网速调低,可以看到如下结构,指解析了一次

去掉gzip压缩,在看一次没有压缩的情况

显然,字节流转换到字符流,此处与压缩格式【Content-Encoding:gzip】有关,同时也会影响到后续的渲染流水线

注1:理论上gzip更常见的是资源文件【js/css】,因为资源文件大多需要等待完成后在解析【获取一半也没法解析】

注2:实际上减少传输次数的优化,远远大于分块解析【我瞎掰的,也可以描述为动态解析】

注3:更何况html文件一般不大【无视后端渲染哈】,远远不足1.5k【tcp包大小】

思考题

  • 如果压缩后,传输过程中错了一个字符,是不是数据全丢了重新传?

对于字节流到字符流,还有一些其他的内容,此处直接忽略

解码会根据meta影响- byte/4.html

如图,我的编码格式是gbk,我的内容却进行了解码

最大的"bug"在于,编码以后得到的meta值需要修改编码这个值

解码不完全会根据meta影响 - byte/5.html

更大的"bug",如果meta前的数据N多,解码的规则就会失效

  • 原因来自于解析规则,只针对前1k信息处理编码相关的内容

规范/原理

有兴趣的可自行读取,后续不再重复

html.spec.whatwg.org/multipage/p...

字节流就是来自网络层,确定编码后会将字节转换为字符

相关推荐
小小小小宇8 分钟前
PC和WebView白屏检测
前端
天天扭码20 分钟前
ES6 Symbol 超详细教程:为什么它是避免对象属性冲突的终极方案?
前端·javascript·面试
小矮马23 分钟前
React-组件和props
前端·javascript·react.js
懒羊羊我小弟27 分钟前
React Router v7 从入门到精通指南
前端·react.js·前端框架
DC...1 小时前
vue滑块组件设计与实现
前端·javascript·vue.js
Mars狐狸1 小时前
AI项目改用服务端组件实现对话?包体积减小50%!
前端·react.js
H5开发新纪元1 小时前
Vite 项目打包分析完整指南:从配置到优化
前端·vue.js
嘻嘻嘻嘻嘻嘻ys1 小时前
《Vue 3.3响应式革新与TypeScript高效开发实战指南》
前端·后端
恋猫de小郭2 小时前
腾讯 Kuikly 正式开源,了解一下这个基于 Kotlin 的全平台框架
android·前端·ios
2301_799404912 小时前
如何修改npm的全局安装路径?
前端·npm·node.js