对比使用DeepSeek与文新一言,了解DeepSeek的关键技术论文

DeepSeek是国内大模型技术的新秀,最近也在业界和媒体界火爆出圈,所以想学习一下其技术。

大模型时代,学习知识,当然首先想到利用大模型,由于在过去一年,对DeepSeek使用不多,所以想和文新一言(4.0 Turbo)对比使用。

通过对比,针对同一个问题"DeepSeek发扬开源文化,将核心技术都以论文形式发表,关键的技术论文都有哪些?",文心一言效果明显好很多,但是这可能和DeepSeek的"联网搜索暂不可用"有关系。

以下是使用结果
文新一言问答结果:



DeepSeek问答结果:



对以上回答结果进行核实

文新一言回答的四篇论文均为真实论文,结果正确,且按照时间排序,体验较好

DeepSeek回答的结果中

《DeepSeek-MoE: Towards Ultimate Specialization in Mixture-of-Experts Language Models》是正确的

其他几篇论文,通过搜索引擎,均未搜索到相应的地址,应为虚幻回答

《DeepSeek-Long: Advancing LLMs' Context Window to 128K through Positional Interpolation and Attention Optimization》

《DeepSeek-R1: Retrieval-Augmented LLM with Real-Time Knowledge Update》

《DeepSeek-Math: Improving Mathematical Reasoning in LLMs via Symbolic Supervision》

相关推荐
CoderJia程序员甲27 分钟前
GitHub 热榜项目 - 日榜(2026-03-29)
人工智能·ai·大模型·github·ai教程
王小义笔记8 小时前
大模型微调步骤与精髓总结
python·大模型·llm
CoderJia程序员甲10 小时前
GitHub 热榜项目 - 日榜(2026-03-30)
人工智能·ai·大模型·github·ai教程
hhzz11 小时前
Claude Code 实战---开发华尔街日报风格新闻卡片应用
人工智能·大模型·智能体开发·ai编程工具
core51211 小时前
赋予AI真正的“长期记忆”:开源大模型记忆操作系统 MemOS 深度解析与实战
人工智能·开源·大模型·记忆·长期记忆·memos
Flying pigs~~12 小时前
基于Bert的模型迁移文本分类项目
人工智能·深度学习·算法·大模型·nlp·bert
再不会python就不礼貌了20 小时前
从工具到个人助理——AI Agent的原理、演进与安全风险
人工智能·安全·ai·大模型·transformer·ai编程
有为少年21 小时前
告别“唯语料论”:用合成抽象数据为大模型开智
人工智能·深度学习·神经网络·算法·机器学习·大模型·预训练
张彦峰ZYF1 天前
大模型LLM ACA - ACP认证考试模拟试卷二
大模型·llm·aca - acp
*JOKER1 天前
Flow Matching&生成算法
人工智能·深度学习·机器学习·大模型·生成模型·flow matching