技术栈

sacaling law

云端FFF
1 年前
llm·sacaling law
序列模型(4)—— Scaling Laws原文符号有点乱,直接引用前文的分析结论,详见:序列模型(3)—— LLM的参数量和计算量。首先给出符号约定