对比使用DeepSeek与文新一言,了解DeepSeek的关键技术论文

DeepSeek是国内大模型技术的新秀,最近也在业界和媒体界火爆出圈,所以想学习一下其技术。

大模型时代,学习知识,当然首先想到利用大模型,由于在过去一年,对DeepSeek使用不多,所以想和文新一言(4.0 Turbo)对比使用。

通过对比,针对同一个问题"DeepSeek发扬开源文化,将核心技术都以论文形式发表,关键的技术论文都有哪些?",文心一言效果明显好很多,但是这可能和DeepSeek的"联网搜索暂不可用"有关系。

以下是使用结果
文新一言问答结果:



DeepSeek问答结果:



对以上回答结果进行核实

文新一言回答的四篇论文均为真实论文,结果正确,且按照时间排序,体验较好

DeepSeek回答的结果中

《DeepSeek-MoE: Towards Ultimate Specialization in Mixture-of-Experts Language Models》是正确的

其他几篇论文,通过搜索引擎,均未搜索到相应的地址,应为虚幻回答

《DeepSeek-Long: Advancing LLMs' Context Window to 128K through Positional Interpolation and Attention Optimization》

《DeepSeek-R1: Retrieval-Augmented LLM with Real-Time Knowledge Update》

《DeepSeek-Math: Improving Mathematical Reasoning in LLMs via Symbolic Supervision》

相关推荐
刘大猫.8 小时前
智造短剧新引擎:火山引擎上线「火山剧创 1.0」,制作效率提升 80%
人工智能·ai·chatgpt·机器人·大模型·火山引擎·短剧新引擎
绵满11 小时前
"TokenFormer: Unify the Multi-Field and Sequential Recommendation Worlds" 论文笔记
大模型·推荐系统
Komorebi_999914 小时前
多模态基础、图文大模型原理
大模型
格桑阿sir17 小时前
13-大模型智能体开发工程师:工具使用(Tool Use)范式
ai·大模型·agent·工具·智能体·tool·tool use
Komorebi_999919 小时前
多模态 Embedding、CLIP 概念
大模型·embedding
Komorebi_999920 小时前
Day1:LLMOps 核心概念、工程架构、行业流程
人工智能·大模型
晓山清21 小时前
什么是好的提示词
大模型·提示词
weixin_4684668521 小时前
Cherry-Studio 新手极速上手指南
人工智能·python·深度学习·ai·自然语言处理·大模型
Komorebi_99991 天前
Day3:监控、日志、限流、成本管控、版本灰度
大数据·运维·人工智能·大模型
weixin_468466851 天前
Ava 2.0 智能应用场景落地指南
人工智能·自然语言处理·大模型·智能交互·ava