对比使用DeepSeek与文新一言,了解DeepSeek的关键技术论文

DeepSeek是国内大模型技术的新秀,最近也在业界和媒体界火爆出圈,所以想学习一下其技术。

大模型时代,学习知识,当然首先想到利用大模型,由于在过去一年,对DeepSeek使用不多,所以想和文新一言(4.0 Turbo)对比使用。

通过对比,针对同一个问题"DeepSeek发扬开源文化,将核心技术都以论文形式发表,关键的技术论文都有哪些?",文心一言效果明显好很多,但是这可能和DeepSeek的"联网搜索暂不可用"有关系。

以下是使用结果
文新一言问答结果:



DeepSeek问答结果:



对以上回答结果进行核实

文新一言回答的四篇论文均为真实论文,结果正确,且按照时间排序,体验较好

DeepSeek回答的结果中

《DeepSeek-MoE: Towards Ultimate Specialization in Mixture-of-Experts Language Models》是正确的

其他几篇论文,通过搜索引擎,均未搜索到相应的地址,应为虚幻回答

《DeepSeek-Long: Advancing LLMs' Context Window to 128K through Positional Interpolation and Attention Optimization》

《DeepSeek-R1: Retrieval-Augmented LLM with Real-Time Knowledge Update》

《DeepSeek-Math: Improving Mathematical Reasoning in LLMs via Symbolic Supervision》

相关推荐
keep_learning1117 小时前
Z-Image模型架构全解析
人工智能·算法·计算机视觉·大模型·多模态
CoderOnly8 小时前
【代码】下载COIG-CQIA数据集并转为alpaca jsonl/json格式
大模型
CoderJia程序员甲9 小时前
GitHub 热榜项目 - 日榜(2025-12-31)
开源·大模型·llm·github·ai教程
司南OpenCompass12 小时前
司南“六位一体”评测体系的一年演进
人工智能·大模型·多模态模型·大模型评测·司南评测·ai评测
KG_LLM图谱增强大模型13 小时前
OntoMetric:破解ESG报告难题的“大模型+本体知识图谱”新范式,准确率提升10倍
人工智能·大模型·知识图谱
喜欢吃豆1 天前
OpenAI Realtime API 深度技术架构与实现指南——如何实现AI实时通话
人工智能·语言模型·架构·大模型
前端程序猿之路1 天前
基于扣子(Coze)工作流 API 的微信小程序开发实践总结
前端·微信小程序·小程序·大模型·api·ai编程·扣子
xixixi777771 天前
大模型的运行离不开芯片和搭载在它上面的计算框架
机器学习·大模型·编程·编译·芯片·计算框架·技术框架
模型启动机1 天前
港大联合字节跳动提出JoVA:一种基于联合自注意力的视频-音频联合生成模型
人工智能·ai·大模型
AI人工智能+1 天前
融合OCR与大模型的智能文本信息抽取技术,推动合同管理从静态文档向智能化商业载体的转型
大模型·ocr·文本信息抽取