技术栈

336assignment 1

nuowenyadelunwen
1 个月前
大语言模型llm·bpe tokenizer·stanford cs336·llm scratch·336assignment 1
Stanford CS336 Assignment 1 BPE Tokenizer trainning on tinystories dataset这个题目有两个要求按照作业要求,我将分三步来完成:编写训练脚本:包含加载数据、训练、保存模型、统计时间和内存。
我是有底线的