技术栈
deepseek
AI大模型
16 小时前
程序员
·
llm
·
deepseek
手把手教你本地部署DeepSeek:解锁私有化AI的无限可能
本文较长,建议点赞收藏,以免遗失。更多AI大模型开发学习视频籽料,都在这>>Github<<在人工智能技术爆发的今天,企业级AI应用正从云端服务向私有化部署加速演进。DeepSeek作为国内领先的智能认知引擎,其强大的自然语言处理能力已在多个行业得到验证。
量子位
18 小时前
openai
·
deepseek
被曝蒸馏DeepSeek还造假!欧版OpenAI塌房了
离职掀桌!Mistral 被曝 “蒸馏”DeepSeek。网友在推特上爆料,一位 Mistral 离职女员工群发邮件,直指公司多项黑幕。
Spider_Man
2 天前
javascript
·
llm
·
deepseek
和AI畅聊不掉线:本地部署LLM聊天界面全攻略
你是否曾幻想,拥有一个只属于自己的AI助手,随时随地陪你聊天、解答疑惑、写代码、甚至吐槽生活?今天,我们就来打造这样一个本地部署的LLM(大语言模型)聊天框,让你的电脑秒变“私人ChatGPT”!
Chaos_Wang_
4 天前
人工智能
·
语言模型
·
自然语言处理
·
chatgpt
·
deepseek
ShadowKV 机制深度解析:高吞吐长上下文 LLM 推理的 KV 缓存“影子”方案
在LLM的长上下文推理中,KV Cache成为影响速度和内存的关键因素。每生成一个新token,模型需要对所有先前token的键(Key)和值(Value)向量执行自注意力计算。传统方法会将所有过去的K/V向量保存在GPU上,并在每步将查询向量与整个K缓存做点积计算,然后加权累加对应的V向量。这种全量 KV 缓存方案有两个主要问题:
玄明Hanko
4 天前
人工智能
·
deepseek
DeepSeek是不是名不副实?
DeepSeek到底咋样?虽然网上有些媒体吹得有点过,但换个角度想想——在国内大厂一个个放弃从0到1的原创创新,转头去做“1到100”的应用生意的环境下,深度求索这样一家小公司还能咬牙坚持,硬是做出了一款媲美GPT的AI模型,还免费、还开源,这事本身就很值得夸一夸。 李白有句诗——“人生得意须尽欢”。在全球普遍觉得中国AI落后国外的大背景下,DeepSeek没花大价钱打广告,就靠实力冲上了苹果App Store的下载榜第一,这已经很能说明它有两把刷子了。 其实DeepSeek早在2023年底就发布了,我在
知了一笑
4 天前
人工智能
·
大模型
·
kimi
·
千问
·
deepseek
AI编程:代码多,效果好?
七号楼专栏,大模型测评第01期。2024年AI编程刚有热度,互联网又嗅到降本增效的味道。入职场到现在,记忆里还有低代码,超级SaaS,数字化转型,大模型,AI应用之编程;这些新概念的出场,都是在各种骂骂咧咧中,深夜王炸的吹嘘声中。
北'辰
5 天前
前端
·
后端
·
架构
·
开源
·
github
·
deepseek
DeepSeek智能考试系统智能体
https://github.com/bei-chen-1/AIbei-chen-1/AI: 存放AI相关的项目/Store AI-related projects
产品经理独孤虾
5 天前
人工智能
·
产品经理
·
需求分析
·
产品设计
·
提示词工程
·
deepseek
·
业务流程优化
流程优化点识别与分析:从混沌到清晰的产品体验突破法
内容简介: 产品流程优化传统分析需要数周时间,且常陷入经验盲区。本文揭秘基于DeepSeek的SPEED分析框架,让产品经理在5分钟内完成从流程瓶颈识别到优化方案设计的全链路分析,发现隐藏断点,实现从"凭感觉优化"到"科学化改进"的认知跃迁。 #产品经理必备 #流程优化 #DeepSeek应用 #效率提升 #AI工具 #业务分析 #提示词工程 #实战案例
科大饭桶
6 天前
人工智能
·
语言模型
·
llm
·
prompt
·
deepseek
AI大模型专题:LLM大模型(Prompt提示词工程)
LLM大模型(初识)Prompt提示词工程是一门新兴的技术, 是指设计、编写、优化输入给大语言模型(如GPT-4、ChatGPT)的文本提示(Prompt),以引导模型产生期望的高质量输出的过程。它不仅是简单地构造输入文本,更涉及到对模型行为的深入理解和对各种影响因素的综合考量。提示工程 的目标是通过精心设计的提示,引导模型生成精准、富有洞察力的输出,从而更好地完成特定任务。
高克莱
7 天前
macos
·
llm
·
agent
·
知识库
·
anythingllm
·
ollama
·
deepseek
【macOS操作系统部署开源DeepSeek大模型,搭建Agent平台,构建私有化RAG知识库完整流程】
昨天在马路上捡到一台全新的Mac Studio。拆开一看配置还挺高的,好家伙早就听说macOS操作系统也非常适合拿来跑大模型了,赶紧激活系统试了一下,以下是部署流程的完整记录。
袁庭新
7 天前
llm
·
aigc
·
deepseek
五大提示词撰写原则
在与DeepSeek交互时,提示词是沟通的桥梁。清晰、有效的提示词不仅能让AI准确理解你的需求,还能显著提升输出内容的质量和效率。本节将介绍学习提示词的基本使用,为后续的实际应用打下坚实基础。
递归尽头是星辰
7 天前
人工智能
·
大模型
·
spring ai
·
deepseek
大模型与Spring AI的无缝对接:从原理到实践
本文系统梳理了大模型知识,以及与Spring AI的集成方案,涵盖本地部署、云服务、API调用三种模式的技术选型对比。通过DeepSeek官方API示例详解Spring AI的四种开发范式(纯Prompt/Agent/RAG/微调),并提供架构决策矩阵和性能优化技巧。
IT闫
7 天前
人工智能
·
deepseek
【AI】——SpringAI通过Ollama本地部署的Deepseek模型实现一个对话机器人(二)
🎼个人主页:【Y小夜】😎作者简介:一位双非学校的大三学生,编程爱好者,专注于基础和实战分享,欢迎私信咨询!
AI大模型
9 天前
程序员
·
llm
·
deepseek
《大模型技术30讲》——从原理到实战的终极指南
2025年,AI技术迎来爆发式增长——DeepSeek等开源模型异军突起,MCP协议重构Agent开发范式,技术迭代速度远超想象。在这样的浪潮中,仅掌握应用层技术已远远不够,深入理解大模型底层原理,才是开发者构建长期竞争力的关键。
Shinpei
10 天前
前端
·
deepseek
如何在AI流式数据中渲染mermaid图表
接上一篇文章《如何优雅的在AI应用中渲染Markdown数据》,有同学提出希望可以支持mermaid图表渲染,最近我周末把这个功能加上来,接下来,我将结合 ds-markdown 介绍在AI对话场景中,如何优雅地处理流式输出的Mermaid图表代码,并实现实时渲染?本文将深入探讨一个完整的技术解决方案。
charlee44
11 天前
mysql
·
数据分析
·
nlp
·
pandasai
·
deepseek
PandasAI连接LLM对MySQL数据库进行数据分析
在之前的文章《PandasAI连接LLM进行智能数据分析》中实现了使用PandasAI连接与DeepSeek模型通过自然语言进行数据分析。不过那个例子中使用的是PandasAI 2.X,并且使用的是本地.csv文件来作为数据。在实际应用的系统中,使用.csv作为库表的情况比较少见。在本文中,就试试使用最新的PandasAI 3.0对MySQL数据库中涉及到多个表的数据进行数据分析。
NullPointerExpection
11 天前
spring boot
·
llm
·
ocr
·
springai
·
deepseek
·
mcp
dify + mcp 实现图片 ocr 识别
pom.xml:application.yml:application-dev.yml:BootApplication.java:
deephub
11 天前
人工智能
·
深度学习
·
transformer
·
deepseek
·
稀疏注意力
NSA稀疏注意力深度解析:DeepSeek如何将Transformer复杂度从O(N²)降至线性,实现9倍训练加速
当前人工智能模型在处理长序列任务时面临着根本性的计算瓶颈。无论是分析完整的法律文档、处理大型代码仓库,还是进行长篇对话,现有模型都受到Transformer架构中注意力机制的限制——其计算复杂度随序列长度呈二次增长(
GetcharZp
12 天前
langchain
·
llm
·
deepseek
RAG 应用进阶指南:别再“一次性”加载了!教你构建可分离、可维护的动态 AI 知识库
还在用脚本一次性跑完 RAG 流程?太 Low 了!本教程带你将数据处理与 AI 应用彻底解耦。你将学会:1) 建立一个独立的“数据中心”,随时增删改查你的知识。2) 让 RAG 应用加载指定知识库。