技术栈
sacaling law
云端FFF
10 个月前
llm
·
sacaling law
序列模型(4)—— Scaling Laws
原文符号有点乱,直接引用前文的分析结论,详见:序列模型(3)—— LLM的参数量和计算量。首先给出符号约定