技术栈

stanford 335

nuowenyadelunwen
5 小时前
bpe tokenizer·stanford 335·llm scratch
Stanford CS336 Assignment 1 BPE Tokenizer 优化回顾下 BPETrainer_Simple 中,循环体内部是这样的:可以发现假设有 10,000 个单词,要进行 1,000 次合并。你的代码执行了 1,000×10,000≈1071,000×10,000≈107 次扫描操作。
我是有底线的