llm

AI大模型5 小时前
程序员·llm·agent
小白 & 程序员速看!快速入行大模型应用开发的完整实战指南,建议收藏本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在智泊AI。在人工智能技术飞速迭代的当下,大语言模型(如ChatGPT、Claude、文心一言等)早已跳出科研实验室的范畴,成为普通开发者触手可及的技术工具。随着AI浪潮的席卷,越来越多职场人渴望借势转型,尤其是初次接触AI领域的新手,常常在知乎、CSDN、掘金等技术社区频繁提问:“怎样才能快速踏入大模型应用开发领域?”
阿正的梦工坊5 小时前
人工智能·算法·大模型·llm
DreamGym:通过经验合成实现代理学习的可扩展化今天,我们来聊聊一篇刚刚发布的论文:《Scaling Agent Learning via Experience Synthesis》(通过经验合成实现代理学习的扩展)。这篇论文由Meta Superintelligence Labs和FAIR团队主导,发表于2025年11月7日(arXiv:2511.03773v2)。如果你已经熟悉PPO(Proximal Policy Optimization)和GRPO(Group Relative Policy Optimization)等RL算法,这篇论文会特别
山顶夕景5 小时前
大模型·llm·ai编程
【LLM应用】Codex & Codex CLI使用Codex Cli、对标 Claude Code 适合:喜欢命令行、自动化脚本、批量处理任务。 特点:轻量、快速、可集成 CI/CD。 ✅ 在您的 IDE 中尝试 支持 VS Code、Cursor、Windsurf 等。 特点:图形界面友好,适合日常开发、边写边问。
yaocheng的ai分身15 小时前
llm
AI现状报告——基于OpenRouter的100万亿Token实证研究转载2025年12月过去一年标志着大型语言模型(LLM)发展和实际应用的转折点。随着2024年12月5日首个广泛采用的推理模型_o1_的发布,该领域从单次模式生成转向多步骤审议推理,加速了部署、实验和新应用类别的出现。随着这一转变的快速展开,我们对这些模型在实际中如何使用的实证理解滞后了。在这项工作中,我们利用OpenRouter平台(一个跨各种LLM的AI推理提供商)分析了超过100万亿token的真实世界LLM交互,涵盖任务、地理和时间维度。在我们的实证研究中,我们观察到开源模型的广泛采用、创意角色扮
Wilber的技术分享17 小时前
人工智能·笔记·langchain·llm·问答系统·rag·知识库检索
【大模型实战笔记 7】RAG技术:从原理到实战——基于Streamlit的智能文档问答系统【注:代码附于文章末尾,代码简单容易入手】RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合了检索系统与生成模型的混合型AI技术。其核心思想是:在大型语言模型(LLM)生成答案之前,先从外部知识库中检索相关文档片段,将这些信息作为上下文与用户查询一起输入给模型,从而生成更准确、更可信的答案。
CoderJia程序员甲17 小时前
ai·开源·llm·github·ai教程
GitHub 热榜项目 - 日榜(2025-12-6)生成于:2025-12-6共发现热门项目: 15 个榜单类型:日榜本期GitHub热榜显示AI与高性能基础设施项目持续领跑,开发者正积极构建实用的生产力工具。AI领域尤为突出,如能将自然语言转换为图表设计的next-ai-draw-io和微软开源的VibeVoice,凸显AI正深度融入开发工作流;500个AI智能体项目集更展示出AI在垂直行业的落地趋势。技术架构上,Rust生态表现抢眼,rustfs以2.3倍MinIO的性能革新对象存储,而Bun则凭借全栈工具链加速JavaScript开发。同时,开编码助
七夜zippoe17 小时前
前端·javascript·react.js·llm·agent·react
基于ReAct框架的智能体构建实战 - 从原理到企业级应用智能体(Agent)正在重塑AI应用范式,而ReAct框架则是构建可靠智能体的核心方法论。本文将带你从零构建生产级智能体系统,解决"幻觉"和"不可控"两大痛点。
阿正的梦工坊19 小时前
人工智能·机器学习·大模型·llm
τ-bench:重塑Agent评估的工具-代理-用户交互基准今天,我们来聊聊一篇arXiv预印本论文:《τ-bench: A Benchmark for Tool-Agent-User Interaction in Real-World Domains》(arXiv:2406.12045v1)。这篇由Shunyu Yao等Sierra研究者撰写的论文,针对当前Agent基准的痛点——缺乏真实人类交互和领域规则遵循测试——提出一个创新基准τ-bench。作为Agent大模型研究者,我们常常纠结于如何评估模型在动态、多模态交互中的鲁棒性?这篇论文的亮点在于其模块化框架
CoderJia程序员甲1 天前
ai·开源·llm·github·ai教程
GitHub 热榜项目 - 日榜(2025-12-3)生成于:2025-12-3共发现热门项目: 18 个榜单类型:日榜本期GitHub趋势显示AI应用开发热度持续攀升,焦点集中在智能体构建与优化工具。谷歌推出的adk-go为开发者提供了灵活可控的Go语言AI智能体开发框架,而LightRAG和Memori等项目则致力于提升RAG效率与LLM记忆能力,实战性强。同时,TrendRadar和微软call-center-ai展示了AI在舆情分析、自动化交互等场景的落地潜力。开发者正通过具体工具解决模型部署、性能调优及多平台集成问题,体现出代码驱动、轻量化部署的技
胡玉洋1 天前
ai·ai作画·llm·aigc·ai编程·ai写作
跨时空便民服务站孙悟空蹲在服务站门口的青石板上,手里转着一根乌铁禅杖,这杖原是五台山的镇寺之宝,重九千八百斤,换算成现代单位就是4900公斤,别瞅它沉,老孙耍起来跟挥折扇似的。他正瞅着猪八戒追一只开屏的孔雀,嘴里骂骂咧咧。
韩曙亮1 天前
人工智能·ai·langchain·llm·大语言模型·prompts·agents
【AI 大模型】LangChain 框架 ① ( LangChain 简介 | LangChain 模块 | LangChain 文档 )LangChain 是一款专为 构建 基于 大语言模型 ( LLM ) 的 应用程序 而 设计的 开源框架 ;
MobotStone1 天前
后端·算法·llm
一文看懂AI智能体架构:工程师依赖的8种LLM,到底怎么分工?最近在玩生成式AI的朋友肯定都发现了:不是所有的大语言模型都干同一件事。有的擅长聊天,有的擅长思考,有的能动手操作,有的能看懂图片,甚至有些在你手机里默默运行而不会耗尽电池。
16324015411 天前
llm
回顾-OLMo3[1]-->“ 一句话概括论文核心+技术亮点总结”备注:回顾看过的论文,对目前看过的OLMo系列进行整理在此总结。(注:笔者水平有限,若有描述不当之处,欢迎大家留言。后期会继续更新LLM系列,文生图系列,VLM系列,agent系列等。如果看完有收获,可以【点赞】【收藏】【加粉】)
大模型教程1 天前
程序员·llm·agent
构建自己的Agent——最佳开源 RAG 框架选型指南本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在智泊AI。话不多说,今天,为大家介绍几款适合普通人使用的RAG平台,让你也能轻松打造专属AI知识库!直接上菜:
大模型教程1 天前
程序员·llm·agent
小猫都能懂的大模型原理 1 - 深度学习基础本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在智泊AI。本文旨在用简单易懂的语言解释大语言模型的基本原理,不会详细描述和解释其中的复杂数学和算法细节,希望各位小猫能有所收获 🐱
重铸码农荣光2 天前
前端·架构·llm
AI First + Mobile First:用大模型重构下一代应用开发范式在技术演进的浪潮中,我们正站在一个关键拐点上:AI 不再只是“辅助工具”,而是成为应用的核心驱动力。与此同时,移动设备早已超越 PC,成为用户与数字世界交互的第一入口。如何将 AI First 与 Mobile First 的理念深度融合,打造真正智能、高效、普惠的新一代应用?本文将从实践出发,结合真实代码案例,探讨一条可落地的技术路径。
AI大模型2 天前
程序员·llm·agent
大模型从入门到实践,最被读者认可的几本书就在这里!本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在智泊AI。大模型技术发展迅速,信息更新节奏远超个人的学习速度。对于想入门、想深入,或已经开始用 AI 做事的人,更需要一条清晰、可靠的学习路径。
AI大模型2 天前
程序员·llm·agent
AI大模型·白皮书 | AI 智能体手册-谷歌本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在智泊AI。本手册《AI智能体手册》由Google Cloud发布,旨在展示如何利用AI智能体提升企业效率与创新能力。手册强调,AI智能体并非传统自动化工具或聊天机器人,而是能够执行复杂工作流、理解多源信息并代表员工完成任务的高级智能系统。预计到2028年,33%的企业软件将集成智能体AI,显著推动工作模式的智能化转型。
tiger1192 天前
人工智能·llm·推理·moe·decode·deepseek·prefill
DeepSeek V3.1 的推理解析之前仔细学习过大模型的推理解析,但只是针对通用的早期大模型,并没有针对目前流行的MoE的在模型的推理进行解析。比如:DeepSeek。也就是针对通用的早期Transformer架构进行了学习。
组合缺一2 天前
java·人工智能·学习·ai·llm·solon
Solon AI 开发学习16 - generate - 生成模型(图、音、视)生成模型(GenerateModel) 与 聊天模型(ChatModel)用途区别很大。GenerateModel 只能一次性生成内容,不能对话。比如: