对比使用DeepSeek与文新一言,了解DeepSeek的关键技术论文

DeepSeek是国内大模型技术的新秀,最近也在业界和媒体界火爆出圈,所以想学习一下其技术。

大模型时代,学习知识,当然首先想到利用大模型,由于在过去一年,对DeepSeek使用不多,所以想和文新一言(4.0 Turbo)对比使用。

通过对比,针对同一个问题"DeepSeek发扬开源文化,将核心技术都以论文形式发表,关键的技术论文都有哪些?",文心一言效果明显好很多,但是这可能和DeepSeek的"联网搜索暂不可用"有关系。

以下是使用结果
文新一言问答结果:



DeepSeek问答结果:



对以上回答结果进行核实

文新一言回答的四篇论文均为真实论文,结果正确,且按照时间排序,体验较好

DeepSeek回答的结果中

《DeepSeek-MoE: Towards Ultimate Specialization in Mixture-of-Experts Language Models》是正确的

其他几篇论文,通过搜索引擎,均未搜索到相应的地址,应为虚幻回答

《DeepSeek-Long: Advancing LLMs' Context Window to 128K through Positional Interpolation and Attention Optimization》

《DeepSeek-R1: Retrieval-Augmented LLM with Real-Time Knowledge Update》

《DeepSeek-Math: Improving Mathematical Reasoning in LLMs via Symbolic Supervision》

相关推荐
重生之我要成为代码大佬5 分钟前
pytorch与视觉检测
人工智能·pytorch·深度学习·大模型·视觉检测
拓朗工控9 小时前
当大模型遇上大电网:算力与电力的“双向奔赴”
大模型·算力·电网·电力
DavidSoCool12 小时前
win11系统使用DockerDesktop搭建Dify实现知识库问答
ai·大模型·知识库·dify
刘大猫.13 小时前
华为昇腾芯片将为DeepSeek-V4推理,通往国产算力自由
华为·ai·大模型·算力·deepseek·deepseek-v4·昇腾芯片
Flying pigs~~1 天前
Dify平台入门指南:开源LLM应用开发平台深度解析
人工智能·开源·大模型·agent·dify·rag
CoderJia程序员甲1 天前
GitHub 热榜项目 - 日榜(2026-04-20)
ai·大模型·llm·github·ai教程
zhangfeng11331 天前
llamfactory 微调中用到的cpu的两处参数preprocessing_num_workers dataloader_num_workers
大模型
带娃的IT创业者1 天前
深度解析 Qwen3.6-35B-A3B:重塑 AI 编程代理的开源新标杆
人工智能·python·ai·开源·大模型·qwen·编程代理
liu****1 天前
LangGraph-AI应用开发框架(五)
python·langchain·大模型·langgraph
ACCELERATOR_LLC2 天前
【DataWhale组队学习】DIY-LLM Task1分词器
人工智能·大模型·datawhale