大模型

前端小超人rui17 小时前
人工智能·大模型·prompt
Prompt 提示词原理/组成/编写原则/编写技巧一个有效的Prompt 可以:
哥本哈士奇(aspnetx)17 小时前
大模型
LangChain DeepAgents 学习笔记LangChain的DeepAgents已经发布有段时间了,最近的几个版本基本覆盖了大多数智能体都应该有的功能。本笔记基于 LangChain 的 DeepAgents 框架,演示如何构建了一个具有角色扮演能力的 AI 助手,并集成了自定义技能系统。以此方便后续的knowledge review以及vibe coding的reference。
Mr.朱鹏18 小时前
python·gpt·langchain·大模型·llm·rag
9-检索增强生成RAG详解**RAG (Retrieval-Augmented Generation,检索增强生成) **是目前大模型应用的核心技术。
Soari19 小时前
开源·大模型·webrtc·实时音视频·voiceagent·语音智能体·dograh
挑战 100ms 延迟极限:深度拆解 dograh,构建企业级开源 WebRTC 实时语音智能体平台发布日期: 2026-05-18标签: #VoiceAgent #WebRTC #语音智能体 #dograh #大模型 #实时音视频
AI玫瑰助手19 小时前
pdf·大模型·知识库·表格·md·文字识别·paddleocr
PDF 转 Markdown 主力方案怎么选:PaddleOCR-VL-1.5、MinerU、HunyuanOCR 与 MonkeyOCR 实测对比本文对比了四种主流PDF转Markdown工具(PaddleOCR-VL-1.5、MinerU、HunyuanOCR和MonkeyOCR)的性能表现。测试基于OmniDocBench和MDPBench数据集,评估维度包括文本块识别、阅读顺序、表格和公式处理等结构化要素。结果显示PaddleOCR-VL-1.5综合表现最优,在两个数据集上都保持稳定性能,特别在表格和公式处理方面表现突出。HunyuanOCR在复杂文档解析上单集表现优异但部署门槛高,MinerU工程系统能力强但分数略低,MonkeyOCR轻量
AI原来如此20 小时前
学习·ai·大模型·ai编程
[特殊字符]2026AI Agent入门学习路径⚡效率篇 | 本文面向普通职场人、学生、想转AI方向的开发者,结合2026年最新行业趋势和工具生态,给出分人群的适配学习路径,还有可直接复制的7天实操步骤,不用啃复杂技术原理,普通人也能快速用AI Agent提升工作效率,抓住2026年AI Agent落地的第一波红利。
魔乐社区21 小时前
人工智能·开源·大模型
小参数・大码力・易部署 | Qwen3.6-27B上线魔乐社区,基于昇腾的部署教程来了继一周前Qwen3.6-35B-A3B模型开源发布后,千问再度开源Qwen3.6-27B —— 一个拥有270亿参数的稠密多模态模型,也是社区呼声最高的模型规格。Qwen3.6-27B 依然支持多模态思考与非思考模式,在智能体编程方面达到了旗舰级表现,全面超越前代开源旗舰 Qwen3.5-397B-A17B(总参数397B / 激活参数17B的MoE模型)。作为稠密架构,它无需MoE路由即可部署,是开发者在实用、可广泛部署规模上获取顶尖编程能力的理想选择。
damo王21 小时前
大模型·agent·token·向量模型·open claw·coding plan·agent plan
极简Agent plan指南在使用agent时,既需要推理模型让它思考,也需要VLM模型生成图片,更想有视频模型直接生成视频,还想要向量模型做向量数据库,还得让它写代码。
四六的六1 天前
大模型·个人开发·ai编程·next.js·技术干货·独立开发·ai工具
我用什么技术做了TLDR Scholar——AI论文速读产品完整技术栈拆解TLDR Scholar:AI论文速读工具地址 https://www.tldrscholar.cn,支持上传PDF/Word文档,30秒提取核心发现,输出学科领域、研究方法、核心发现、可重现指标等结构化摘要。
DogDaoDao1 天前
人工智能·大模型·aigc·音视频·ai agent·生成视频·skyreels-v2
【GitHub】SkyReels-V2 无限时长电影级视频生成模型:技术架构与核心原理深度解析SkyReels-V2 是由昆仑万维 Skywork AI 团队于 2025 年 4 月 21 日正式发布并开源的全球首个采用扩散强迫(Diffusion-forcing)框架的无限时长电影生成模型。该模型通过融合多模态大语言模型(MLLM)、多阶段预训练、强化学习(RL)和扩散强迫框架,实现了视频生成技术在提示词遵循、视觉质量、运动动态和视频时长四个维度的重大突破。
guslegend1 天前
人工智能·大模型
第5节:RAG知识库上传,解析和验证AI Agent 拖拉拽:AI Agent 拖拉拽上一节:第4节:UI页面对接(流式应答界面)本节:第5节:RAG知识库上传,解析和验证
knight_9___2 天前
人工智能·python·算法·面试·大模型·agent
大模型project面试7我理解量化(Quantization)的本质是把模型参数从「高精度浮点数」(FP32 或 FP16)映射到「低精度整数」(INT8 或 INT4),用更少的比特表示同样的信息。
刘大猫.2 天前
android·数码相机·ai·机器人·大模型·算力·snapseed4.0
重塑经典:Snapseed4.0全面登陆安卓,内置“胶片相机”与专业手动模式谷歌今日正式向安卓平台推送了Snapseed4.0的重大版本更新。这是继去年 iOS 版迎来3.0更新及今年年初确认结束 iOS 独占期后,这款老牌修图工具在 Android 系统上的首次重磅亮相。本次更新不仅彻底重构了用户界面,更引入了强大的相机功能与一系列专业级编辑工具。
Justinyh2 天前
大模型·agent·claude code·cc switch·superpowers
安装与体验 Claude code、CC Switch、SuperPowers安装完成,直接可以使用了。windows 中简单配置可以直接放到环境变量,vscode 中可以放到 setting.json。但若要方便切换模型,可以安装 CC Switch。 前往 GitHub Releases: https://github.com/farion1231/cc-switch/releases/latest 下载对应平台的安装包。
Cosolar2 天前
人工智能·架构·大模型·agent·智能体
智能体 Agent 完全拆解:架构、组件与实战指南智能体(Agent)是一种能够自主感知环境、制定计划、调用工具并执行行动的 AI 系统。其核心思想源于经典的 Sense-Plan-Act 循环,但在大语言模型(LLM)的加持下,规划与推理能力得到了质的飞跃。
Cosolar2 天前
人工智能·系统架构·大模型·agent
大模型量化技术实战指南大语言模型(LLM)的参数规模在过去三年内呈现爆炸式增长,从GPT-3的1750亿参数到如今动辄万亿级的模型,单张80GB显存的A100已经无法满足单卡部署需求。以Llama 3.1 70B为例,FP16精度下需要约140GB显存,即使是H100 80GB也需要2卡并行,部署成本高昂。
CoderJia程序员甲2 天前
ai·大模型·github·ai教程
GitHub 热榜项目 - 周榜(2026-05-17)生成于:2026-05-17共发现热门项目: 15 个Token赞助:siliconflow本期 GitHub 热榜明显聚焦 AI Agent 工程化:从 代码代理记忆、技能链、研究工作流,到 多模型路由、终端编程和 React 质量诊断,核心是让大模型可控、可复现、可落地。与此同时,安全对抗与代理检测、量化交易、WiFi 感知、3D Gaussian Splat 等项目升温,反映出 “AI + 基础设施 + 垂直场景” 正成为开发者最关注的技术主线。
牧子川2 天前
人工智能·大模型·api 调用
014-国产大模型API封装💡 摘要:通过抽象基类 BaseModelClient 统一不同厂商的 SDK 接口,实现异步聊天调用、费用计算和智能路由推荐,让国产大模型调用像调用统一服务一样简单。
牧子川2 天前
大模型·api·封装api
013-多模型API调用💡 摘要:通过构建 MultiModelComparator 架构,抽象不同厂商 SDK 差异,实现并发调用多个大模型并对比响应内容、延迟和 Token 消耗。
guslegend2 天前
大模型
第10节:后端业务基础设施前面几节里,Hify 的工程骨架其实已经搭得差不多了。我们有了 Maven 多模块结构,有了 hify-common 里的统一返回 Result、全局异常处理器、MyBatis-Plus 配置、Redis 配置,也把前端 Vue 工程和一键启动链路打通了。按理说,接下来好像就该直接写业务模块了。