技术栈

扩散

TGITCIC
1 个月前
人工智能·自回归·扩散·deepseek·大模型自回归·大模型扩散
7B斗671B:扩散模型能否颠覆自回归霸权?DeepSeek V3以6710亿参数稳坐自回归模型的“巨无霸”地位,而70亿参数的Dream 7B却在多项测试中与其不分伯仲。例如,在需要复杂规划的“倒计时任务”中,Dream 7B的解题成功率比DeepSeek V3高出12%,甚至超越了同参数量级的Qwen2.5和LLaMA3。这种“以小搏大”的表现,让研究者重新审视模型架构的底层逻辑。
deardao
1 年前
人工智能·机器学习·生成·时序预测·扩散
扩散模型在时间序列预测中的兴起本文探讨了扩散模型在时间序列预测中的应用。扩散模型在生成式人工智能的各个领域展示了最先进的成果。本文包括扩散模型的全面背景资料,详细说明了它们的调节方法,并回顾了它们在时间序列预测中的应用。分析涵盖了11个具体的时间序列实现,它们背后的直觉和理论,在不同数据集上的有效性,以及彼此之间的比较。这项工作的主要贡献是对扩散模型在时间序列预测中的应用进行了深入的探索,并按时间顺序对这些模型进行了概述。此外,本文还对该领域的现状进行了深刻的讨论,并概述了潜在的未来研究方向。这为人工智能和时间序列分析的研究人员提供了