对比使用DeepSeek与文新一言,了解DeepSeek的关键技术论文

DeepSeek是国内大模型技术的新秀,最近也在业界和媒体界火爆出圈,所以想学习一下其技术。

大模型时代,学习知识,当然首先想到利用大模型,由于在过去一年,对DeepSeek使用不多,所以想和文新一言(4.0 Turbo)对比使用。

通过对比,针对同一个问题"DeepSeek发扬开源文化,将核心技术都以论文形式发表,关键的技术论文都有哪些?",文心一言效果明显好很多,但是这可能和DeepSeek的"联网搜索暂不可用"有关系。

以下是使用结果
文新一言问答结果:



DeepSeek问答结果:



对以上回答结果进行核实

文新一言回答的四篇论文均为真实论文,结果正确,且按照时间排序,体验较好

DeepSeek回答的结果中

《DeepSeek-MoE: Towards Ultimate Specialization in Mixture-of-Experts Language Models》是正确的

其他几篇论文,通过搜索引擎,均未搜索到相应的地址,应为虚幻回答

《DeepSeek-Long: Advancing LLMs' Context Window to 128K through Positional Interpolation and Attention Optimization》

《DeepSeek-R1: Retrieval-Augmented LLM with Real-Time Knowledge Update》

《DeepSeek-Math: Improving Mathematical Reasoning in LLMs via Symbolic Supervision》

相关推荐
爱吃泡芙的小白白11 小时前
模型微调——模型性能提升方法及注意事项(自用)
大模型·数据生成·模型微调·模型训练
好多渔鱼好多2 天前
【大模型学习】第九章 机器学习中的数据预处理技术详解
人工智能·机器学习·ai·大模型
Archie_IT2 天前
AI视频领域的DeepSeek—阿里万相2.1图生视频
人工智能·大模型·aigc·通义万相·deepseek
好多渔鱼好多2 天前
【大模型学习】第十章 机器学习中的特征工程技术详解
人工智能·算法·机器学习·ai·大模型
Dontla3 天前
Dify+DeepSeek | Excel数据一键可视化(创建步骤案例)(echarts助手.yml)(文档表格转图表、根据表格绘制图表、Excel绘制图表)
大模型
KoiC3 天前
内网环境部署Deepseek+Dify,构建企业私有化AI应用
linux·人工智能·ubuntu·docker·大模型·ai应用·deepseek
胡耀超3 天前
5.训练策略:优化深度学习训练过程的实践指南——大模型开发深度学习理论基础
人工智能·python·深度学习·大模型
Nicolas8933 天前
【大模型实战篇】vllm本地部署阿里最新的QwQ-32B推理模型以及体验
大模型·强化学习·千问·r1·推理模型·32b
摸鱼小天才3 天前
关于大模型这些术语,你都知道吗?
ai·大模型
TGITCIC3 天前
大模型为何无法达到AGI?
ai·大模型·aigc·agi·大模型发展·大模型未来·ai与人