deepseek

赋范大模型技术社区8 小时前
langchain·agent·deepseek·deep research·智能体开发
LangChain + DeepResearch 实战 :从 0 到 1 构建深度研究智能体(附源码)随着 Manus、Claude Code 以及 Deep Research 等应用的爆火,其背后的核心技术——深层代理(Deep Agents) 正在成为 AI 领域的新焦点。
你真的可爱呀8 小时前
前端·deepseek
对接deepseek(全面版)【前端写全局图标和对话框】前提: 技术栈:vue3+ant组件库前端实现功能:全局图标点击和拖拽吸附侧边功能。点击图标弹出对话框,对话框支持自由拖拽和调节大小。对话框中实现基础问答,复制答案,会话整理等。 后端接口实现:对话标题修改,对话内容返回等等。
TechTrek8 小时前
英伟达·deepseek·cuda 13.1·lightx2v
英伟达推出CUDA 13.1版本,DeepSeek V3到V3.2技术演进全解析1. 英伟达发布革命性CUDA Tile模型,Python代码性能匹敌C++ 英伟达推出CUDA 13.1版本,引入全新的CUDA Tile编程模型,允许开发者用15行Python代码实现GPU内核编程,性能可媲美200行手动优化的CUDA C++代码。这一变革将GPU编程从传统的线程级管理提升至瓦片(Tile)级抽象,大幅降低开发门槛,但也被行业质疑可能削弱CUDA的生态壁垒,因为Tile模型更易移植到其他硬件平台。此次更新重点支持Blackwell架构,未来将扩展至更多GPU代际。 博客: https
ariesjzj18 小时前
大模型·llm·deepseek·推理优化·大规模ep
DeepSeek时代的Large-scale LLM推理2025年底DeepSeek V3发布炸场,几乎为业界之后的LLM优化方向定了调,尤其是大规模推理优化方面。去年快年底时对LLM的推理优化技术做过一个简单的总结:《LLM时代中的AI推理优化》,现在看来已有很多变化。在DeepSeek V3问世快一年之际,这里简单整理总结一下业界与之相关的推理优化技术。
带刺的坐椅1 天前
ai·chatgpt·llm·solon·deepseek
Solon AI 开发学习18 - generate - 生成示例参考GenerateModel 是非常自由的一个接口,本质是组装一个 http post 请求,并尝试解析响应内容。但仍然有大量的 ai 模型无法覆盖(花样太多了),可使用 HttpUtils 直接请求。
懷淰メ2 天前
yolo·目标检测·计算机视觉·pyqt·检测系统·deepseek·水体污染
【AI加持】基于PyQt5+YOLOv8+DeepSeek的水体污染检测系统(详细介绍)本系统功能强大!支持对引起水体污染(废弃物、废弃船、水污染、漂浮物)的目标进行检测,支持多种数据数据源输入并且接入了AI实现了对当前分析结果的评估,欢迎了解!
AI大模型学徒2 天前
chatgpt·langchain·大模型·deepseek·提示词模板
大模型应用开发(九)_LangChain提示词模板提示词工程的基石:LangChain 提示词模板的艺术与实践在 LLM 应用开发中,提示词(Prompt)是核心。但如果直接将提示词硬编码在代码中,会导致代码混乱、难以维护、不易优化。
懷淰メ3 天前
yolo·目标检测·计算机视觉·pyqt·deepseek·监测系统·输电隐患
【AI加持】基于PyQt5+YOLOv8+DeepSeek的输电隐患检测系统(详细介绍)本系统功能强大!支持对输电隐患(气球、鸟巢、风筝、垃圾)进行目标检测,支持多种数据数据源输入并且接入了AI实现了对当前分析结果的评估,欢迎了解!
tiger1193 天前
人工智能·llm·推理·moe·decode·deepseek·prefill
DeepSeek V3.1 的推理解析之前仔细学习过大模型的推理解析,但只是针对通用的早期大模型,并没有针对目前流行的MoE的在模型的推理进行解析。比如:DeepSeek。也就是针对通用的早期Transformer架构进行了学习。
冯骐4 天前
人工智能·agent·deepseek
基于 DeepSeek V3.2 的 Native Agent 实践指南,真香DeepSeek V3.2 发布了,除了模型能力本身的提升之外,最值得关注的是原生支持的“思考时调用工具”的机制。DeepSeek 体现了非常好的工程师审美,对于“思考时调用工具”的 API 设计是非常优雅的。
缘友一世4 天前
llm·模型微调·unsloth·deepseek
Unsloth高效微调实战:基于DeepSeek-R1-Distill-Llama-8B与医疗R1数据SFTTrainer(来自 trl 库):提供 监督微调(SFT) 和 强化学习(RLHF) 相关的功能,主要用于 有监督微调(Supervised Fine-Tuning),适用于 LoRA 等低秩适配微调方式。
懷淰メ4 天前
yolo·目标检测·计算机视觉·pyqt·deepseek·ai分析·结核杆菌
【AI加持】基于PyQt5+YOLOv8+DeepSeek的结核杆菌检测系统(详细介绍)本系统功能强大!支持对结核杆菌进行目标检测,支持多种数据数据源输入并且接入了AI实现了对当前分析结果的评估,欢迎了解!
有意义4 天前
sqlite·llm·deepseek
说人话,查数据:构建一个自然语言驱动的 SQLite 后台AI First 时代:用自然语言操作数据库,让非技术人员也能“写”SQL“未来,开发能力将不再局限于程序员。”——在大语言模型(LLM)的赋能下,这一设想正加速落地。
大模型真好玩4 天前
人工智能·agent·deepseek
全网最通俗易懂DeepSeek-Math-V2与DeepSeek-V3.2核心知识点解析笔者文章 架构大突破! DeepSeek-V3.2发布,五分钟速通DeepSeek-V3.2核心特性为大家系统剖析了DeepSeek-V3.2 实验版的核心特性,并重点解读了其开创性提出的一项全新的技术 DeepSeek Sparse Attention(DeepSeek稀疏注意力机制),简称DSA。
realhuizhu5 天前
提示词工程·deepseek·ai调试·程序员效率·bug修复
凌晨3点,代码"完美"却报错?你需要一位"数字法医"凌晨3点,监控报警群炸了。 你揉着惺忪的睡眼坐在屏幕前,盯着那段逻辑看起来天衣无缝的代码。 日志里只有一行冷冰冰的 Undefined 或 NullPointerException,但你找不到任何空值的来源。你试了重启,试了回滚,试了满屏的 console.log,Bug 就像幽灵一样,看得见抓不着。
lxmyzzs5 天前
人工智能·rk3588·deepseek
在 RK3588 开发板上部署 DeepSeek-R1-Distill-Qwen-1.5B 模型:RKLLM API 实战指南近年来,随着大语言模型(LLM)能力的不断提升,如何将这些模型高效部署到边缘设备(如国产瑞芯微 RK3588 芯片)成为开发者关注的重点。本文将手把手带你完成 DeepSeek-R1-Distill-Qwen-1.5B 模型在 RK3588 上的转换、部署与推理全流程。
小码编匠5 天前
后端·ai编程·deepseek
基于 Microsoft Agent Framework 集成 DeepSeek 大模型的实践Microsoft Agent Framework(简称 Agent Framework)发布已有一段时间。在“观望”(摸鱼)一阵后,在老板的“鼓励”下,我们果断将多个 AI 微服务从 Semantic Kernel(SK) 迁移至 Agent Framework。
youcans_6 天前
论文阅读·人工智能·语言模型·智能体·deepseek
【DeepSeek 论文精读】15. DeepSeek-V3.2:开拓开源大型语言模型新前沿欢迎关注[【AIGC论文精读】](https://blog.csdn.net/youcans/category_12321605.html)原创作品 【DeepSeek论文精读】1. 从 DeepSeek LLM 到 DeepSeek R1 【DeepSeek论文精读】14. DeepSeek-V3.2-Exp 技术报告详解 【DeepSeek论文精读】15. DeepSeek-V3.2:开拓开源大型语言模型新前沿
未来智慧谷6 天前
deepseek
DeepSeek-V3.2 Agent模型发布,推理性能媲美GPT-52025年12月2日,深度求索(DeepSeek)发布了其当前性能最强大的开源模型——DeepSeek-V3.2系列。