大模型

Java研究者1 天前
人工智能·大模型·openai·api·agent·智能体
AI智能体研发 | 什么是OpenAI API协议一行命令,直连模型。没有 SDK,没有抽象层——你面对的是最原始的 HTTP 与 JSON,这正是 OpenAI API 协议的真正面貌。
小七-七牛开发者1 天前
ai·大模型·agent·claude·token·loop·mcp·claudecode·ai coding
Coding Agent 规则管理:CLAUDE.md、Skills、Hooks、Subagents 到底怎么选?Coding Agent 用久了,规则管理就会变成一个绕不开的问题:哪些内容该放进项目说明,哪些流程得按需调用,哪些动作必须由系统强制执行。
小七-七牛开发者2 天前
ai·大模型·编程·ai coding
论文解读:DeepSeek DSpark 在真实高并发推理服务中,如何保证 Token 生成又好又快?刚刚过去的周末,DeepSeek 发布了一篇关于推理加速的新论文:《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》,内容聚焦在大模型推理服务中的一个具体问题:在真实高并发场景下,Speculative Decoding 如何既提升生成速度,又减少目标大模型的无效验证计算?
fengliaoai4 天前
大模型
DeepSeek搞了个DSpark,AI直接进入“秒回时代”,你还在傻等?峰哥说:别让AI聊天,变成“等AI”前几天,一个朋友跟我吐槽——“峰哥,我现在用AI写周报,打个字它都要想半天,急得我差点把键盘吃了。”
aqi005 天前
人工智能·python·大模型·ai编程·ai应用
15天学会AI应用开发(九)利用Chroma持久化向量数据Chroma是一个本地向量数据库,专门用来保存 RAG 知识库,并且快速检索相关内容。Chroma与FAISS之间的区别如下:
aqi0011 天前
人工智能·python·大模型·ai编程·ai应用
15天学会AI应用开发(八)使用向量数据库实现RAG功能向量化一段文本的时候,经常用到all-MiniLM-L6-v2,它是一个轻量级的文本嵌入Embedding模型,专门把文字转成数字向量,给RAG做语义检索用。
aqi0012 天前
人工智能·python·大模型·ai编程·ai应用
15天学会AI应用开发(七)有了大模型为什么还要引入RAG1、使用第三方的摘要库对文本摘要; 2、使用在线大模型对文本摘要; 3、使用离线大模型对文本摘要;以上对会话记录的各种处理操作,统称为AI应用的上下文管理,即让AI理解用户之前的意图。接下来将开启有关RAG部分的AI应用开发教程介绍。
vivo互联网技术14 天前
算法·大模型·cvpr·影像
CVPR 2026 | 全新强化学习框架 BeautyGRPO:重塑真实人像本文入选 CVPR 2026 HighlightCVPR(IEEE/CVF Conference on Computer Vision and Pattern Recognition)IEEE 国际计算机视觉与模式识别会议,主要内容是计算机视觉与模式识别技术。
AndrewHZ15 天前
人工智能·语言模型·大模型·llm·cot·思维链·icl
【LLM技术全景】大模型能力探秘:In-Context Learning与思维链(CoT)摘要:本文是《LLM技术全景:从Token到部署》系列第七篇。为什么大模型"看几个例子就能举一反三",而无需任何参数更新?为什么只是加上"Let’s think step by step",数学推理准确率就能翻倍?本文深度解析两大神秘能力——In-Context Learning(上下文学习)与Chain-of-Thought(思维链),拆解其工作机制,探讨涌现现象背后的规律,并给出实用的Prompt工程指南。
Vergelight15 天前
架构·大模型·aigc·agent·ai产品经理·转行·ai后台设计
实战拆解|三类RAG架构差异:朴素、进阶、多轮RAG落地选型指南很多AI产品、转行求职者、初级研发都有一个通病:只会笼统说“我做过RAG项目”,但不会选型、分不清架构层级。
IRevers15 天前
人工智能·pytorch·深度学习·大模型·datawhale·vllm·amdev
【大模型】Gemma4在ROCm和vLLM部署Gemma 4 是 Google DeepMind 于 2026 年 4 月推出的一系列最新、最强的开源大模型。它的定位非常明确:以极高的"参数效率"为核心,将强大的 AI 能力从云端带到你的手机、电脑等本地设备上。
DogDaoDao15 天前
人工智能·python·ai·大模型·github·ai agent·cl4r1t4s
【GitHub】CL4R1T4S:AI 系统提示词的透明革命深度解析 GitHub 上近 4 万 Star 的 AI 系统提示词泄露项目——它如何撕开 AI 行为的"黑箱",以及这对整个 AI 行业意味着什么。
问道飞鱼15 天前
大模型·意图识别
【大模型相关】意图识别实现方案行业分析报告当前意图识别已经从传统的“关键词 / 规则 / 分类模型”演进到 LLM + 向量检索 + 工具路由 + 工作流编排 的混合架构。
文艺倾年15 天前
人工智能·分布式·大模型·强化学习·vibecoding
【强化学习】数学推导专题,20W字总结(十五)😊你好,我是小航,一个正在变秃、变强的文艺倾年。 🔔本文讲解【强化学习】数学推导专题,20W字总结(十五),期待与你一同探索、学习、进步,一起卷起来叭!
张彦峰ZYF16 天前
人工智能·大模型·向量空间
从嵌入、表征到潜空间:理解大模型向量世界的三种视角目录一、问题的真正难点:不是三个术语,而是三种视角二、嵌入:把离散世界变成连续坐标(一)嵌入的本质:从符号到几何
troubles maker16 天前
语言模型·自然语言处理·lora·大模型·peft
LoRA: Low-Rank Adaptation of Large Language Models论文链接:https://arxiv.org/pdf/2106.09685v1/1000大模型下游迁移微调是行业落地的关键环节,传统全参数微调存在参数量大、算力消耗高、权重分发不便、易发生原有知识覆盖等缺陷。Adapter、Prefix Tuning、Prompt Tuning 等一系列参数高效微调(Parameter-Efficient Fine-Tuning,PEFT)方案被陆续提出,其中低秩自适应( Low-Rank Adaptation,LoRA)[1]方案凭借收敛速度快、推理无额外延迟、兼容性强
SXJR16 天前
java·spring boot·后端·大模型·milvus·rag·langchain4j
spring boot + langchain4j +milvus实现向量存储我在gitee上有整体的项目示例,有兴趣的可以拉下来看看:https://gitee.com/JR542784/langchain4j-test,如果不知道怎么部署milvus可以从我的主页走索milvus有相关的说明
智海观潮16 天前
人工智能·ai·大模型
UniScientist:30B开源科研大模型突破,重构AI自主研究范式UniPat AI 推出 30B 参数量开源科研大模型 UniScientist,突破科研大模型 “只写报告不做研究” 的行业痛点,以统一范式搭建通用科研智能,实现 “提出假设 - 收集证据 - 可复现推导 - 迭代验证” 的全流程科研闭环,性能匹敌甚至超越参数量大一个数量级的顶尖闭源模型,为 AI 科研落地提供关键参考。
Tbisnic16 天前
人工智能·python·学习·大模型·工作流·智能体·coze
AI大模型学习第十四天:Coze项目实战中的分治智慧前面几节课,我们学习了工作流、知识库、数据库、多模态这些“零件”。今天,我们要做一件更重要的事:把这些零件组装起来,解决一个真实的问题。