技术栈

可预测性

BQW_
1 年前
人工智能·自然语言处理·llm·scaling law·可预测性
【自然语言处理】【Scaling Law】Observational Scaling Laws:跨不同模型构建Scaling Law相关博客 【自然语言处理】【Scaling Law】Observational Scaling Laws:跨不同模型构建Scaling Law 【自然语言处理】【Scaling Law】语言模型物理学 第3.3部分:知识容量Scaling Laws 【自然语言处理】Transformer中的一种线性特征 【自然语言处理】【大模型】DeepSeek-V2论文解析 【自然语言处理】【大模型】BitNet:用1-bit Transformer训练LLM 【自然语言处理】BitNet b1.58:1bit LLM