技术栈

scaling law

叶庭云
1 年前
大模型·scaling law·工业化思维·token 工厂·token 生意 ai 产品
大模型 Scaling Law 的本质是工业化思维,Token 工厂,Token 生意🍉 CSDN 叶庭云:https://yetingyun.blog.csdn.net/1. Scaling Law 的本质是工业化思维
BQW_
1 年前
人工智能·自然语言处理·llm·scaling law·可预测性
【自然语言处理】【Scaling Law】Observational Scaling Laws:跨不同模型构建Scaling Law相关博客 【自然语言处理】【Scaling Law】Observational Scaling Laws:跨不同模型构建Scaling Law 【自然语言处理】【Scaling Law】语言模型物理学 第3.3部分:知识容量Scaling Laws 【自然语言处理】Transformer中的一种线性特征 【自然语言处理】【大模型】DeepSeek-V2论文解析 【自然语言处理】【大模型】BitNet:用1-bit Transformer训练LLM 【自然语言处理】BitNet b1.58:1bit LLM
自律版光追
1 年前
人工智能·语言模型·自然语言处理·llm·注意力机制·scaling law·perplexity
【Roadmap to learn LLM】Large Language Models in Five Formulasby Alexander RushOur hope: reasoning about LLMs Our Issue