大模型

PKUMOD9 小时前
大模型·多智能体系统
论文导读 | 大模型多智能体系统的故障归因大模型(Large Language Models, LLM)能力的不断提升推动了大模型智能体(Agents)的发展。大模型智能体是能够感知环境、规划任务和执行行动的智能实体。与仅对用户输入做出响应的传统人工智能模型不同,当前的大模型智能体能接入各种工具、记忆、知识源,在与环境互动的过程中反思自身并自我进化。进一步地,基于大模型的多智能体系统(Multi-Agent Systems, MAS)也随之出现,能够利用多个智能体的集体智慧与技能。相比单智能体系统,多智能体系统能更加有效地模拟复杂的现实世界环境,
小毅&Nora12 小时前
人工智能·架构·大模型
【人工智能】【大模型】 从“读心术“到“智能助手“:大模型架构的演进与革命你有没有想过,为什么现在AI能像人类一样理解复杂的故事?为什么它能一边听你说话,一边看着图片回答问题?这背后,是大模型架构的不断进化——从"机械记忆"到"智能理解"的飞跃。
白云千载尽14 小时前
人工智能·算法·大模型·微调·llama
LLaMA-Factory 入门(一):Ubuntu20 下大模型微调与部署参考链接:LLaMA-Factory 是一个面向大语言模型(LLM)的高效训练与微调框架,专为简化 LLaMA 系列以及各类开源大模型的训练流程而设计。它以“开箱即用、灵活高效”为核心理念,提供从数据准备、参数高效微调(PEFT)、训练配置管理到模型部署的一站式解决方案。
TracyCoder12315 小时前
linux·ubuntu·大模型·wsl·miniconda·jupiter
在WSL中构建基本的大模型开发环境在当今 AI 爆发的时代,大模型应用开发已成为技术热点。对于 Windows 用户而言,直接在 Windows 上配置深度学习环境往往面临依赖冲突、路径兼容性等“深坑”。
阿正的梦工坊15 小时前
人工智能·深度学习·机器学习·大模型·llm
WebArena:一个真实的网页环境,用于构建更强大的自主智能体最近,在 ICLR 2024 上发表了一篇来自卡内基梅隆大学的论文——WebArena: A Realistic Web Environment for Building Autonomous Agents(arXiv: 2307.13854)。这篇论文提出并实现了一个高度逼真、可复现的网页环境,专门用于开发和评估基于自然语言指令的自主智能体(Autonomous Agents)。今天这篇博客就来详细介绍这篇论文:它到底想解决什么问题、如何解决,以及其中的关键细节。
阿正的梦工坊17 小时前
人工智能·深度学习·机器学习·大模型
ARE:Meta 发布的代理研究平台,如何构建动态环境并实现大规模扩展2025年12月,Meta Superintelligence Labs 在论文《ARE: scaling up agent environments and evaluations》中开源了 Meta Agents Research Environments (ARE) ——一个专为代理(Agent)研究设计的平台。它不仅用于运行和评估代理,还提供了一套简单却强大的抽象,让研究者能够快速、可控地创建复杂、多样的模拟环境,并无缝集成合成或真实应用。
骚戴1 天前
人工智能·python·大模型·llm·api·ai gateway
2025 Python AI 实战:零基础调用 LLM API 开发指南摘要:在 AI 重塑行业的今天,掌握 大模型(LLM)开发技能是核心竞争力。本文作为保姆级 Python AI 教程,将带你从零开始,用 20 行代码完成对全球主流 AI 大模型(GPT-4o/Claude)的 API 调用。我们将深入解析 LLM API 聚合原理,助你低成本构建企业级 AI 系统。
love530love1 天前
人工智能·windows·python·大模型·gradio·博客之星·z-image
Windows 下 Z-Image-Turbo 专业版 Gradio 生成器实战:功能增强全记录发布时间:2025年12月28日基础功能版:Windows 环境下为 Z-Image-Turbo 加装 Gradio 图形生成器
骚戴1 天前
人工智能·大模型·llm·api·ai gateway
LLM API 全方位实战指南:从 AI 大模型API选型到高效应用开发(2025年12月)摘要:随着 AI 技术的爆发,AI 大模型(LLM)已成为现代软件开发的核心。本文深入解析 LLM API 生态,对比 OpenAI GPT-4、Claude、文心一言等主流 AI 大模型,探讨 LLM API 聚合策略如何降低 AI 成本。通过 Python 实战,带你掌握 AI 大模型 的 API 接入、Prompt 优化及 LLM 应用开发全流程。
致Great2 天前
人工智能·算法·大模型·agent·智能体
大模型对齐核心技术:从第一性原理完整推导 PPO 算法!近期关于 DPO、GRPO 和 RLVR 等强化学习方法在大语言模型(LLM)后训练中的研究成果令人瞩目。对于刚接触强化学习的研究者来说,从 Proximal Policy Optimization(PPO)入手是个不错的选择。这正是 OpenAI 在 InstructGPT 论文中展示的用于改进 LLM 对齐的算法。理解 PPO 能帮助建立策略梯度方面的正确心智模型,为后续学习基于类似思想构建的新型 LLM 专用强化学习方法打下基础。
CoderJia程序员甲2 天前
ai·开源·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2025-12-28)生成于:2025-12-28共发现热门项目: 9 个榜单类型:日榜本期GitHub趋势显示,AI智能体与RAG应用开发依然是绝对热点。项目集中于解决大模型实际落地的关键痛点:智能体平台Yuxi-Know集成知识图谱增强决策,awesome-llm-apps和cognee分别汇集和简化AI应用构建,而ragas和llm-transparency-tool则专注提升应用的可评估性与透明度。同时,LightX2V推动轻量级视频生成,TradingAgents-CN探索金融垂域落地,反映出技术正朝着专业化、实用化
骚戴2 天前
java·人工智能·大模型·llm·api
2025企业级架构演进:重构 Java/Python 的 RAG 与 Agent 系统的六种核心策略摘要:在 AI 全面落地的 2025 年,企业架构师的核心命题已从“如何调用”转向“如何治理”。本文结合最新的 大模型(LLM)技术趋势,深入剖析 RAG、Agent 与微调等六大 AI 定制策略。我们将探讨如何利用标准化的 LLM API 聚合层,构建高可用、低成本的企业级 AI 基础设施,助力 AI 大模型 在业务中的深度应用。
熊猫钓鱼>_>2 天前
ai·大模型·llm·多模态·deepseek-r1·文心4.5·qwen3.0
「源力觉醒 创作者计划」_巅峰对话:文心4.5 vs DeepSeek R1 vs 通义Qwen3.0 谁最符合中国人体验?目录开场:一、明星登场:三种“中国方案”同台竞技,切磋国产大模型真功夫!1. 文心4.5:多模态异构MoE,请叫我国产首个“全能选手”!
山顶夕景2 天前
大模型·llm·agent·deepresearch
【Agent】自动化深度研究智能体搭建让智能体具备三个核心能力: (1)问题剖析:将用户的开放主题拆解为可检索的查询语句。 (2)多轮信息采集:结合不同搜索 API 持续挖掘资料,并去重整合。 (3)反思与总结:依据阶段结果识别知识空白,决定是否继续检索,并生成结构化总结。
名誉寒冰2 天前
人工智能·学习·大模型·prompt
AI大模型-Prompt工程参考学习在大模型应用开发中,Prompt工程是决定应用质量的核心技能。一个优秀的Prompt可以让模型输出准确率提升40%,Token消耗降低50%。
骚戴2 天前
人工智能·大模型·llm·gateway·api
AI架构指南:大型语言模型 (LLM) API 的通用集成与企业级配置(2025年)摘要:在 AI 原生应用开发的浪潮下,构建稳定的 大模型(LLM)接入层是核心挑战。本文深入剖析 LLM API 的异构问题,探讨 API 聚合网关 n1n.ai 在 AI 开发中的关键作用。我们将演示如何通过 Python 实现全球 AI 大模型(OpenAI/Claude/国产 大模型)的统一接入与 LLM API 高可用配置。
WWZZ20252 天前
大模型·sam·slam·多模态·具身智能·dino·grounded-sam2
快速上手大模型:实践(Grounded-SAM2与Depth Anything V2)博主使用云服务器训练,配置环境版本为:PyTorch2.3.0、Python3.12、CUDA12.1,GPU4090 24GB;本次使用数据集是20G,考虑后续打包传输建议给到220G+、直接文件传输需要给到120G+。
技术路上的探险家2 天前
python·大模型·qwen·vllm
vLLM常用启动参数的详细解释以下是 vLLM(特别是 v0.8+ 版本)常用启动参数的详细解释,包括:说明:以下参数基于 vllm.entrypoints.openai.api_server 启动方式。
小龙3 天前
笔记·学习·ai·大模型
大模型训练全流程学习笔记最近啃完大模型训练全流程的基础逻辑,总算把“数据到模型落地”的脉络理清楚了——核心就是“问题牵方向,数据定上限,训练追上限,验证做优化”,用大白话讲就是先明确要干嘛,再找对“粮食”,选对“工具”,盯着训练过程,最后反复打磨,直到能用。