深度求索

winner88811 小时前
windows·deepseek·deepseek-r1·深度求索·ollama 离线部署
Windows 系统下使用 Ollama 离线部署 DeepSeek - R1 模型指南随着人工智能技术的飞速发展,各类大语言模型层出不穷。DeepSeek - R1 凭借其出色的语言理解和生成能力,受到了广泛关注。而 Ollama 作为一款便捷的模型管理和部署工具,能够帮助我们轻松地在本地环境中部署和使用模型。本文将详细介绍如何在 Windows 系统下使用 Ollama 离线部署 DeepSeek - R1 模型,并展示在 Windows CMD 窗口与 Google 浏览器插件 Page Assist 的交互案例。
熊文豪1 天前
人工智能·ai·自然语言处理·nlp·cv·deepseek·深度求索
深度求索(DeepSeek)的AI革命:NLP、CV与智能应用的技术跃迁Deepseek官网:DeepSeek近年来,人工智能技术以指数级速度重塑全球产业格局。在这场技术革命中,深度求索(DeepSeek)凭借其前沿的算法研究、高效的工程化能力以及对垂直场景的深度理解,逐渐成为AI领域的核心参与者之一。 本文将从自然语言处理(NLP)、计算机视觉(CV)两大核心技术领域切入,结合智能客服、自动驾驶、医疗影像分析等场景,解析DeepSeek的技术突破及其对行业的深远影响。
winner88812 天前
人工智能·语言模型·自然语言处理·性能优化·deepseek·grpo·深度求索
DeepSeek-V3 论文解读:大语言模型领域的创新先锋与性能强者论文链接:DeepSeek-V3 Technical Report在大语言模型(LLMs)的激烈竞争赛道上,开源与闭源模型均在飞速发展,不断突破性能极限。DeepSeek-V3的诞生,犹如一颗璀璨新星,照亮了开源模型的前行之路。它拥有高达 671B 的总参数,在每次处理令牌时激活 37B 参数,以强大的姿态跻身前沿模型行列。其训练成本效益显著,仅需 2.788M H800 GPU 小时的总训练时长,折合 557.6 万美元,却在多个关键领域展现出惊人的实力,成为当前开源模型中的佼佼者,有力地推动了自然语言