大模型

love530love2 小时前
人工智能·windows·python·大模型·gradio·博客之星·z-image
Windows 下 Z-Image-Turbo 专业版 Gradio 生成器实战:功能增强全记录发布时间:2025年12月28日基础功能版:Windows 环境下为 Z-Image-Turbo 加装 Gradio 图形生成器
骚戴3 小时前
人工智能·大模型·llm·api·ai gateway
LLM API 全方位实战指南:从 AI 大模型API选型到高效应用开发(2025年12月)摘要:随着 AI 技术的爆发,AI 大模型(LLM)已成为现代软件开发的核心。本文深入解析 LLM API 生态,对比 OpenAI GPT-4、Claude、文心一言等主流 AI 大模型,探讨 LLM API 聚合策略如何降低 AI 成本。通过 Python 实战,带你掌握 AI 大模型 的 API 接入、Prompt 优化及 LLM 应用开发全流程。
致Great6 小时前
人工智能·算法·大模型·agent·智能体
大模型对齐核心技术:从第一性原理完整推导 PPO 算法!近期关于 DPO、GRPO 和 RLVR 等强化学习方法在大语言模型(LLM)后训练中的研究成果令人瞩目。对于刚接触强化学习的研究者来说,从 Proximal Policy Optimization(PPO)入手是个不错的选择。这正是 OpenAI 在 InstructGPT 论文中展示的用于改进 LLM 对齐的算法。理解 PPO 能帮助建立策略梯度方面的正确心智模型,为后续学习基于类似思想构建的新型 LLM 专用强化学习方法打下基础。
CoderJia程序员甲7 小时前
ai·开源·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2025-12-28)生成于:2025-12-28共发现热门项目: 9 个榜单类型:日榜本期GitHub趋势显示,AI智能体与RAG应用开发依然是绝对热点。项目集中于解决大模型实际落地的关键痛点:智能体平台Yuxi-Know集成知识图谱增强决策,awesome-llm-apps和cognee分别汇集和简化AI应用构建,而ragas和llm-transparency-tool则专注提升应用的可评估性与透明度。同时,LightX2V推动轻量级视频生成,TradingAgents-CN探索金融垂域落地,反映出技术正朝着专业化、实用化
骚戴7 小时前
java·人工智能·大模型·llm·api
2025企业级架构演进:重构 Java/Python 的 RAG 与 Agent 系统的六种核心策略摘要:在 AI 全面落地的 2025 年,企业架构师的核心命题已从“如何调用”转向“如何治理”。本文结合最新的 大模型(LLM)技术趋势,深入剖析 RAG、Agent 与微调等六大 AI 定制策略。我们将探讨如何利用标准化的 LLM API 聚合层,构建高可用、低成本的企业级 AI 基础设施,助力 AI 大模型 在业务中的深度应用。
熊猫钓鱼>_>8 小时前
ai·大模型·llm·多模态·deepseek-r1·文心4.5·qwen3.0
「源力觉醒 创作者计划」_巅峰对话:文心4.5 vs DeepSeek R1 vs 通义Qwen3.0 谁最符合中国人体验?目录开场:一、明星登场:三种“中国方案”同台竞技,切磋国产大模型真功夫!1. 文心4.5:多模态异构MoE,请叫我国产首个“全能选手”!
山顶夕景9 小时前
大模型·llm·agent·deepresearch
【Agent】自动化深度研究智能体搭建让智能体具备三个核心能力: (1)问题剖析:将用户的开放主题拆解为可检索的查询语句。 (2)多轮信息采集:结合不同搜索 API 持续挖掘资料,并去重整合。 (3)反思与总结:依据阶段结果识别知识空白,决定是否继续检索,并生成结构化总结。
名誉寒冰9 小时前
人工智能·学习·大模型·prompt
AI大模型-Prompt工程参考学习在大模型应用开发中,Prompt工程是决定应用质量的核心技能。一个优秀的Prompt可以让模型输出准确率提升40%,Token消耗降低50%。
骚戴10 小时前
人工智能·大模型·llm·gateway·api
AI架构指南:大型语言模型 (LLM) API 的通用集成与企业级配置(2025年)摘要:在 AI 原生应用开发的浪潮下,构建稳定的 大模型(LLM)接入层是核心挑战。本文深入剖析 LLM API 的异构问题,探讨 API 聚合网关 n1n.ai 在 AI 开发中的关键作用。我们将演示如何通过 Python 实现全球 AI 大模型(OpenAI/Claude/国产 大模型)的统一接入与 LLM API 高可用配置。
WWZZ20251 天前
大模型·sam·slam·多模态·具身智能·dino·grounded-sam2
快速上手大模型:实践(Grounded-SAM2与Depth Anything V2)博主使用云服务器训练,配置环境版本为:PyTorch2.3.0、Python3.12、CUDA12.1,GPU4090 24GB;本次使用数据集是20G,考虑后续打包传输建议给到220G+、直接文件传输需要给到120G+。
技术路上的探险家1 天前
python·大模型·qwen·vllm
vLLM常用启动参数的详细解释以下是 vLLM(特别是 v0.8+ 版本)常用启动参数的详细解释,包括:说明:以下参数基于 vllm.entrypoints.openai.api_server 启动方式。
小龙1 天前
笔记·学习·ai·大模型
大模型训练全流程学习笔记最近啃完大模型训练全流程的基础逻辑,总算把“数据到模型落地”的脉络理清楚了——核心就是“问题牵方向,数据定上限,训练追上限,验证做优化”,用大白话讲就是先明确要干嘛,再找对“粮食”,选对“工具”,盯着训练过程,最后反复打磨,直到能用。
CoderJia程序员甲1 天前
ai·开源·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2025-12-27)生成于:2025-12-27共发现热门项目: 16 个榜单类型:日榜本期GitHub热榜显示AI实用化工具全面爆发,开发者正积极构建解决实际问题的代码方案。RAG技术持续火热,LEANN和LightRAG等项目致力于提升检索精度与效率,VideoRAG更将其拓展至视频领域。智能体应用成为焦点,TradingAgents构建多智能体金融交易框架,Yuxi-Know融合知识图谱打造智能体平台。工具链日趋成熟,LLaMA-Factory统一大模型微调,browser-use赋能网页自动化,chatterbox提
CoderJia程序员甲2 天前
开源·大模型·llm·github·ai教程
GitHub 热榜项目 - 日榜(2025-12-26)生成于:2025-12-26共发现热门项目: 13 个榜单类型:日榜本期GitHub热榜显示人工智能技术落地应用正全面提速,热点聚焦于提升大型语言模型的实用性与效率。以Yuxi-Know和LEANN为代表的RAG项目通过集成知识图谱与轻量化技术,显著优化了知识库的构建成本与检索精度;vllm-omni和LightX2V等项目致力于多模态模型的高效推理与视频生成,推动AI处理复杂现实任务的能力边界。同时Pathway等流式数据处理框架和claude-code-templates等开发工具的热度攀升,反映出行
KAI智习2 天前
人工智能·大模型
大模型榜单周报(2025/12/27)本周大模型领域持续涌现创新成果,数学、编程和多模态能力均出现显著进展。字节推出数学模型Seed Prover 1.5,在国际数学奥林匹克竞赛中取得金牌线成绩,而智谱AI开源GLM-4.7在多项评测中超越GPT-5.1。MiniMax的M2.1编码模型以10B激活参数创下多语言软件工程能力新高,北航提出的代码模型Scaling Laws为最优数据配比提供理论基础。
KG_LLM图谱增强大模型2 天前
人工智能·大模型·知识图谱·agi
[150页最新PPT]深度解析大模型与知识图谱的融合范式,通往AGI的必由之路?当大语言模型(LLM)的通用能力遇上知识图谱(KG)的结构化精度,人工智能的下一个拐点在何方?本文深度剖析LLM与KG两大技术范式的互补优势与内在缺陷,系统性阐述了“KG增强LLM”和“LLM增强KG”的双向赋能路径。通过解读前沿技术、应用场景与未来趋势,本文旨在为科研专家、产业决策者和投资者揭示这一融合技术如何克服AI幻觉、提升可解释性,并最终构筑通往通用人工智能(AGI)的关键阶梯 。
空城雀2 天前
大模型·prompt
大模型知识之promptprompt,意为提示词。 是用户发给大模型的“指令”或“问题”,它直接决定了模型会“思考”什么以及如何“回答”。prompt写的越清晰,回答的越好。
千桐科技2 天前
大模型·知识图谱·智能问答·知识库·rag·qknow·知识平台
qKnow 知识平台商业版 v2.1.1 正式发布:图谱问答与语义检索能力全面升级qKnow 商业版 v2.1.1 并不是一次简单的功能叠加,而是围绕“是否好用、是否稳定、是否可持续使用”进行的一次系统升级。从图谱问答能力的引入,到抽取任务状态与日志完善,再到搜索体验和界面细节优化,新版本在多个关键路径上提升了实际使用体验。
逐云者1232 天前
人工智能·架构·大模型·数据中心·cdc·任务中心·大数据同步
构建高效任务中心:CDC 数据同步的工程实践与架构权衡在现代业务系统中,任务中心(Task Center)作为连接数据与行动的核心枢纽,其核心能力之一是从上游业务数据库中可靠、高效、低延迟地同步关键状态变更,并以此驱动任务生成、告警或自动化决策。然而,面对“百表千字段”的复杂数据模型,如何在保障实时性的同时控制资源消耗、确保一致性,并为后续的标签化、规则匹配与智能增强提供高质量输入,是工程落地的关键挑战。
程序员柒叔2 天前
大模型·workflow·知识库·工作流·dify
Dify 工作流类型说明文档版本:1.9.2 最后更新:2025年12月Dify 平台支持三种工作流类型,每种类型针对不同的使用场景进行了优化: