对比使用DeepSeek与文新一言,了解DeepSeek的关键技术论文

DeepSeek是国内大模型技术的新秀,最近也在业界和媒体界火爆出圈,所以想学习一下其技术。

大模型时代,学习知识,当然首先想到利用大模型,由于在过去一年,对DeepSeek使用不多,所以想和文新一言(4.0 Turbo)对比使用。

通过对比,针对同一个问题"DeepSeek发扬开源文化,将核心技术都以论文形式发表,关键的技术论文都有哪些?",文心一言效果明显好很多,但是这可能和DeepSeek的"联网搜索暂不可用"有关系。

以下是使用结果
文新一言问答结果:



DeepSeek问答结果:



对以上回答结果进行核实

文新一言回答的四篇论文均为真实论文,结果正确,且按照时间排序,体验较好

DeepSeek回答的结果中

《DeepSeek-MoE: Towards Ultimate Specialization in Mixture-of-Experts Language Models》是正确的

其他几篇论文,通过搜索引擎,均未搜索到相应的地址,应为虚幻回答

《DeepSeek-Long: Advancing LLMs' Context Window to 128K through Positional Interpolation and Attention Optimization》

《DeepSeek-R1: Retrieval-Augmented LLM with Real-Time Knowledge Update》

《DeepSeek-Math: Improving Mathematical Reasoning in LLMs via Symbolic Supervision》

相关推荐
绵满5 小时前
"HyFormer: Revisiting the Roles of Sequence Modeling and Feature Interaction in CTR Prediction" 论文笔记
大模型·推荐系统
DogDaoDao8 小时前
【GitHub】Ruflo:面向 Claude Code 的企业级多智能体编排平台深度解析
人工智能·深度学习·大模型·github·ai编程·claude·ruflo
xixixi7777712 小时前
《从心理诱导突破Claude到AI仿冒直播首张拘留单:AI安全、监管与商用的三重转折点》
大数据·网络·人工智能·安全·ai·大模型·风险
程序员三明治13 小时前
【AI】一文讲清 RAG:从大模型局限到企业级知识库落地流程
java·人工智能·后端·ai·大模型·llm·rag
AI机器学习算法13 小时前
说走就走的AI之旅第01课:浅谈机器学习
数据结构·人工智能·python·深度学习·机器学习·大模型·线性回归
nvd111 天前
OpenClaw 避坑指南:如何彻底从本地/Hunyuan 切换到第三方大模型
大模型
前端摸鱼匠1 天前
【AI大模型春招面试题31】什么是“零样本学习(Zero-Shot)”“少样本学习(Few-Shot)”?大模型实现这类能力的核心原因?
人工智能·学习·面试·大模型·求职招聘
一切皆是因缘际会1 天前
可自我迭代升级数字生命工程:从记忆厮杀到自我意识觉醒全链路——AGI内生智能硅基生命心智建模(下)
系统架构·大模型·agi·具身智能·通用人工智能·数字生命·自主智能体
Resistance丶未来1 天前
Sub2API:订阅转API网关平台,魔芋AI接入指南
人工智能·gpt·大模型·claude·gemini·skill·sub2api
CoderJia程序员甲1 天前
GitHub 热榜项目 - 周榜(2026-05-10)
人工智能·ai·大模型·llm·github