大模型

CoderJia程序员甲11 分钟前
人工智能·ai·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2026-04-06)生成于:2026-04-06共发现热门项目: 10 个榜单类型:日榜Token赞助:siliconflow
Flying pigs~~33 分钟前
自然语言处理·大模型·agent·多模态·rag·prompt提示词
多模态RAG实战:从表格到音视频的全链路落地指南多模态处理 = 对文本、表格、图片、音频、视频等不同模式的数据,分别用最优方案处理,最终融合得到结果的过程。
最初的↘那颗心34 分钟前
大模型·prompt·spring ai·结构化输出·meta prompt
结构化Prompt与Meta Prompt实战——让AI输出你想要的格式你有没有遇到过这样的问题:调用大模型接口,期望返回一个干净的 JSON,结果模型"放飞自我",在 JSON 前面加了一段解释文字,外面还裹了一层 Markdown 代码块,字段名大小写乱改,空值填了个 "N/A"……下游系统直接解析失败,线上告警一片红。
最初的↘那颗心1 小时前
大模型·llm·prompt·few-shot·spring ai
Prompt基础功:角色分工与样本策略——System Prompt与Few-Shot实战在大模型应用开发中,很多人写 Prompt 时习惯把所有内容一股脑塞进一条消息里 —— 角色设定、行为规范、用户问题全部混在一起。结果呢?接口维护困难、Token 浪费严重,甚至可能引发 Prompt 注入攻击。
最初的↘那颗心1 小时前
大模型·prompt·版本控制·spring ai·a/b测试
Prompt工程化实战:模板管理、版本控制、A/B测试与调试当你学会了写 Prompt,掌握了各种进阶技巧之后,真正的挑战才刚刚开始 —— 如何在工程实践中管理好 Prompt?
最初的↘那颗心2 小时前
大模型·prompt·react·cot·思维链
Prompt高级推理:COT思维链、Self-Consistency与ReAct模式实战导读:在与大模型交互的过程中,简单的"一问一答"往往难以胜任复杂的推理任务。本文将深入介绍三种提升大模型推理能力的核心技术——思维链(Chain of Thought, COT)、自我一致性(Self-Consistency) 和 ReAct 模式。从"让模型先想再答"的基本思路,到"多次采样投票取最优"的暴力美学,再到"推理与行动交织"的 Agent 底层逻辑,逐步带你掌握 Prompt 高级推理的完整技能树。
绵满13 小时前
大模型·多智能体
"Natural-Language Agent Harnesses" 论文笔记Agent 系统的性能越来越依赖 Harness,但这些逻辑通常藏在代码里、框架默认设置里,或者特定运行时的各种约定里。结果就是很难把一个 Harness 移植到另一个系统、拿来比较,或者系统性地研究改进
大数据AI人工智能培训专家培训讲师叶梓14 小时前
人工智能·计算机视觉·大模型·医疗·ct·视觉大模型·医疗人工智能
Merlin:面向腹部 CT 的三维视觉语言基础模型腹部 CT 年检查量巨大且放射科医师资源持续短缺,现有医学视觉语言模型多局限于二维图像与短文本处理,难以解析三维容积信息,且高度依赖人工标注,泛化能力与临床实用性不足。斯坦福大学研究团队提出Merlin,构建原生三维视觉语言模型,联合电子健康记录与放射报告进行无标注预训练,突破二维模型在三维医学影像理解中的局限,实现多任务自动化分析。
guslegend16 小时前
人工智能·大模型·知识图谱
系统整体设计方案根据参考资料中派聪明的业务流程设计,在结果排序后再次进行权限过滤,主要基于以下关键原因:二次权限过滤是安全架构的核心设计,通过“预防+兜底”双重机制,确保在检索效率与数据安全间取得平衡,满足企业级应用对权限控制的严苛要求。
guslegend17 小时前
人工智能·大模型
4月5日(大语言模型训练原理)平时我们使用豆包,符合心意,是因为其后训练做到位了完整的9个阶段预训练仍然是训练链路的起点,搞清楚它到底在做什么,才能理解后面的每一层都在补充什么。没有这一步,就没有语言建模能力,没有知识压缩,也没有后面那些能力迁移的空间。在工程上,它要做的不只是让模型学会预测下一个 token:把语言分布学进去,把大规模文本里的知识和模式压进参数,还要给后面的能力激活留出空间。下一个 token 预测只描述了训练形式,解释不了为什么规模上来之后,模型会突然多出一些之前没有的能力。
一 铭17 小时前
人工智能·大模型
Claude Code实现原理分析-架构设计Claude Code 是 Anthropic 官方出品的 AI 编程 CLI 工具,代号 Tengu。它不是一个简单的 LLM 包装器,而是一个完整的 AI Agent 运行时框架,具备以下核心能力:
handsomestWei17 小时前
ai·大模型·llm·oneapi
OneAPI网关使用简介全文链接 OneAPI网关使用简介OneAPI 是 OpenAI 接口管理与分发系统,统一对接多家大模型服务,支持渠道管理、令牌与额度控制、计费与日志,便于在应用侧通过单一 API 访问不同模型或自建服务。
行者无疆_ty19 小时前
人工智能·大模型·agent
如何在个人电脑部署大模型实现Token自由这一步可以交给AI,把你的电脑配置发给它,比如我的:给我推荐的模型如下我尝试安装了GPT-OSS-20B、Qwen3.5-4B。对于我这个i7处理器、16G运行内存、集成显卡的电脑,实测结果如下: 统一测试问题:把大象装冰箱分几步? ①GPT-OSS-20B模型思考了135秒后开始回答,最终回答正确; ②Qwen3.5-4B模型陷入了死循环,无法给出回答。另外问它是谁,也得思考50多秒,token生成很慢,看着它几个字几个字的蹦,很捉急,这个量级的模型能力还是弱了点。
装不满的克莱因瓶19 小时前
人工智能·ai·大模型·ai编程·cursor
Cursor中agent、plan、ask三种模式区别于对比这是最基本、最直观的交互模式,适合解决具体、单一的问题。核心思想:基于当前光标位置或选中的代码,进行一轮简洁的问答或代码生成。
handsomestWei1 天前
ai·大模型·llm·智能问数·sqlbot
sqlbot智能问数使用简介全文链接:sqlbot智能问数使用简介基于v1.5.0版SQLBot 是一款基于大语言模型和 RAG 的智能问数系统,用户可以实现对话式数据分析(ChatBI),快速提炼获取所需的数据信息及可视化图表,并且支持进一步开展智能分析。
CoderJia程序员甲1 天前
人工智能·ai·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2026-04-05)生成于:2026-04-05共发现热门项目: 8 个榜单类型:日榜Token赞助:siliconflow
巧妹儿1 天前
python·mysql·ai·大模型·华为云·腾讯云
AI Agent 实战:MySQL 监控指标查询 Skill|华为云 + 腾讯云双兼容可直接复用作者:WangQiaomei标签:AI Agent、AgentSkills、MySQL 监控、Prometheus、华为云、腾讯云、可复用技能
麦哲思科技任甲林1 天前
大模型·知识库·anythingllm
用AnythingLLM 搭建知识库,我所经历过的坑在用AnythingLLM搭建知识库时,按阶段分类整理了我遇到的所有问题如下:一、核心概念与选型类问题
CoderJia程序员甲4 天前
ai·大模型·llm·github·ai教程
GitHub 热榜项目 - 日榜(2026-04-02)生成于:2026-04-02共发现热门项目: 7 个榜单类型:日榜本期 GitHub 热榜呈现出 AI 深度集成与工程化落地的强劲趋势。技术重心已从基座模型转向 Agentic 交互,Anthropic 与 OpenAI 竞逐终端编码代理工具,通过自然语言指令重塑代码理解与 Git 工作流。微软在语音 AI 领域的开源推进及 Google 对时间序列基础模型的探索,展示了预训练模型向多模态与垂直预测领域的渗透。同时,开发者更关注可复现的实战价值,围绕提示词工程和可视化教程的项目热度不减。整体洞察显示,软件
CoderJia程序员甲2 天前
人工智能·ai·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2026-04-04)生成于:2026-04-04共发现热门项目: 7 个榜单类型:日榜Token赞助:siliconflow