deepseek-v4

HeeRiver2 天前
ide·vscode·api·deepseek-v4
VSCode调用deepseek-v4-pro/flash api的方法deepseek-v4-pro/flash预览版,在4月24号上线。 DeepSeek-V4 预览版:迈入百万上下文普惠时代 DeepSeek-V4 拥有百万字超长上下文,在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。模型按大小分为两个版本:
GPUStack2 天前
ai·性能调优·模型推理·gpustack·deepseek-v4
NVIDIA H200/H20 DeepSeek-V4-Pro 部署指南、压测性能与稳定性调优建议随着 DeepSeek 正式发布 DeepSeek-V4 系列,大模型的工程边界再次被明显推高。该系列基于 MoE 架构,提供了 DeepSeek-V4-Flash 284B 和 DeepSeek-V4-Pro 1.6T 两种规格,同时在推理阶段仅激活数十亿参数,在性能与成本之间取得了新的平衡。配合百万级上下文窗口与全新的注意力优化机制,其在长文本理解、复杂推理以及智能体任务中的表现,已经开始逼近甚至挑战当前主流闭源模型。
zhayujie3 天前
ai·大模型·agent·deepseek-v4
DeepSeek V4模型的Agent能力实测DeepSeek V4 系列发布之后,关于它能不能用、好不好用的讨论很多,但大部分评测还停留在普通对话或编码上。CowAgent 作为一个中立的 Agent 框架,则更关心模型在 Agent 链路中的真实表现,包括工具调用、长上下文、长期记忆、浏览器自动化、知识组织,本文用这 6 个真实场景在 CowAgent 中对 DeepSeek V4 模型做了全面测试。
刘大猫.9 天前
华为·ai·大模型·算力·deepseek·deepseek-v4·昇腾芯片
华为昇腾芯片将为DeepSeek-V4推理,通往国产算力自由V4的推理将运行在950 PR上,其异构计算架构CANN Next将兼容CUDA。不过,V4的训练仍然使用英伟达先进的GPU。
viperrrrrrrrrr74 个月前
microsoft·deepseek-v4
DeepSeek-V4架构详解🍋🍋AI学习🍋🍋🔥系列专栏: 👑哲学语录: 用力所能及,改变世界。💖如果觉得博主的文章还不错的话,请点赞👍+收藏⭐️+留言📝支持一下博主哦🤞
viperrrrrrrrrr74 个月前
人工智能·开源·deepseek-v4
开源模型如何盈利🍋🍋AI学习🍋🍋🔥系列专栏: 👑哲学语录: 用力所能及,改变世界。💖如果觉得博主的文章还不错的话,请点赞👍+收藏⭐️+留言📝支持一下博主哦🤞
我是有底线的