技术栈
llm
栀秋666
2 小时前
前端
·
llm
·
openai
从零开始调用大模型:使用 OpenAI SDK 实现歌词生成,手把手实战指南
在 AIGC 浪潮席卷全球的今天,大语言模型(LLM) 已不再是科研实验室里的“黑科技”,而是每一个开发者都能轻松调用的强大工具。
夏日白云
4 小时前
图像处理
·
机器学习
·
pdf
·
llm
·
大语言模型
·
rag
·
文档解析
《PDF解析工程实录》第 12 章|别让模型贴着墙走:为什么加一圈空白,效果反而更好?
点此进入系列专栏先说结论:对于相当多的图像模型,在输入图像四周主动加一圈 Padding(空白边),往往能提升边界区域的识别效果。
CoderJia程序员甲
7 小时前
开源
·
大模型
·
llm
·
github
·
ai教程
GitHub 热榜项目 - 日榜(2025-12-31)
生成于:2025-12-31共发现热门项目: 15 个榜单类型:日榜本期GitHub趋势显示,AI应用开发与工具链整合已成主流热点。项目聚焦于大语言模型的实际部署与能力增强,如pg-aiguide通过MCP服务器优化PostgreSQL代码生成,chatterbox提供开源SOTA级TTS方案。开发者积极构建AI智能体与RAG应用,awesome-llm-apps和anthropics/skills等仓库集结了大量可复现案例,而vllm则持续优化LLM推理性能。同时,private-gpt和TrendRa
冬奇Lab
8 小时前
llm
·
ai编程
·
cursor
【Cursor进阶实战·03】四大模式完全指南:Agent/Plan/Debug/Ask的正确打开方式
周末改个功能,给Cursor描述需求后,它疯狂修改了10个文件,结果项目跑不起来了。回滚代码重来,这次小心翼翼地问了个简单问题,它却只讲理论不写代码。
Mintopia
11 小时前
人工智能
·
llm
·
aigc
⚙️ AI冲击下的职场新物种:超级个体
现在的AI浪潮,与蒸汽机、互联网革命最大的不同,在于它不是“体力替代”,而是“认知替代”。过去:现在:
爱听歌的周童鞋
12 小时前
llm
·
policy gradient
·
grpo
·
cs336
·
baselines
·
advantage funcs
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 17: Alignment - RL 2
学习斯坦福的 CS336 课程,本篇文章记录课程第十七讲:对齐 - RL(下),记录下个人学习笔记,仅供自己参考😄
牛奶咖啡.854
1 天前
语言模型
·
llm
·
llama
·
rl
·
ppo
基于Llama-Factory/Qwen2.5-1.5b自定义数据集LoRA微调实战【PPO/RLHF/训练/评估】
目标是整合主流高校效训练微调技术,如增量预训练、多模态指令监督微调、奖励模型训练、PPO训练、DPO训练、KTO训练、ORPO训练
人工干智能
1 天前
llm
LLM大模型的付费管理流程(以OpenAI 为例)
本文以OpenAI 为例,说明LLM大模型的付费管理流程OpenAI的付费管理核心是以API Key为唯一身份标识,在云服务端完成全链路管控:客户端仅需携带API Key发起请求,无需感知计费细节;云服务端是付费管理的核心枢纽,负责校验付费状态、计量资源消耗、结算费用、管控使用限额;大模型端仅上报算力/资源消耗数据,不直接参与计费规则决策。以下从完整流程视角拆解付费管理的每一个环节,结合前文(OpenAI 的核心架构范式)三层架构的交互逻辑说明:
智泊AI
1 天前
llm
大语言模型之AI Agent:Multi-Agent架构
一、引言在 Agent 系统的构建过程中,随着系统演进,其复杂度往往持续攀升,进而显著增加管理与扩展的难度。典型挑战包括:
Mintopia
1 天前
人工智能
·
llm
·
aigc
量子计算会彻底改变 AI 的运算方式吗?一场关于"量子幽灵"与"硅基大脑"的深夜对话 🎭💻
深夜的实验室里,经典计算机的风扇嗡嗡作响,像一位疲惫的老管家在叹息。此时的你,或许正训练着第127个epoch的神经网络,看着loss曲线像蜗牛一样爬行,心里默念:"这世上一定存在一条计算捷径!"
mubei-123
1 天前
人工智能
·
llm
·
rag
·
检索增强生成
Self-RAG:通过自我反思学习检索、生成和批判
在使用RAG辅助LLM完成知识问答任务时,无论检索是否必要或者段落是否相关,不加选择地检索和合并固定数量的检索段落,都会降低LM的通用性,或者可能生成无益的反应。
hzp666
1 天前
人工智能
·
深度学习
·
神经网络
·
llm
·
aigc
·
dnn
·
反向传播
招牌红烧肉版-深度神经网络
本文以 “开餐厅学做招牌菜” 的完整故事,来比喻深度神经网络的整个工作原理,包括:输入层、隐藏层、输出层、反向传播、权重、梯度、学习率等概念。
AI大模型
1 天前
langchain
·
llm
·
agent
免费自学 AI?这 10 个 GitHub 宝藏项目就够了!建议收藏
本文较长,建议点赞收藏。更多AI大模型应用开发学习视频及资料,在这里。如果你也想入门 AI,但不知道该从哪里开始——别担心,这几乎是每个开发者都会经历的阶段。
PenguinLeee
1 天前
llm
·
大语言模型
·
推理
LLM推理或者思考的一些本质性问题
原文为Denny Zhou(Google Deepmind负责人)在Stanford为CS25课程做的一个报告。这篇博客是其笔记。
人工干智能
1 天前
服务器
·
python
·
llm
调用client.beta.threads.runs.create后交由OpenAI云服务器端的处理
前文“Run如何撮合需求、能力与流程”中,调用client.beta.threads.runs.create后,任务提交给了OpenAI云服务器端。本文讨论OpenAI云服务器端的处理流程:任务入队、等待调度、状态逐步转换,到最终完成并写入结果并返回给客户端。
夏日白云
1 天前
pdf
·
llm
·
大语言模型
·
rag
·
文档解析
《PDF解析工程实录》第 11 章|图像路线的工程现实:DPI、分辨率和内存炸裂
点此进入系列专栏如果你在 PDF 解析里走过图像路线,大概率都经历过某个时刻:一开始我也以为问题出在模型上。
mubei-123
1 天前
人工智能
·
llm
·
rag
·
检索增强生成
万字RAG综述:大语言模型的检索增强生成
大型语言模型(LLM)展示了令人印象深刻的能力,但也遇到了幻觉、过时的知识以及不透明、无法追踪的推理过程等挑战。
风雨中的小七
1 天前
人工智能
·
llm
解密Prompt系列67. 智能体的经济学:从架构选型到工具预算
导读:2025年是智能体爆发的一年。然而,随着模型能力的提升,工业界开始反思:盲目增加智能体、盲目增加工具调用次数真的能“大力出奇迹”吗?本文串联两篇Google论文,从宏观的架构选择到微观工具预算感知,探讨如何科学构建Agent系统。
彼岸花开了吗
1 天前
人工智能
·
python
·
llm
构建AI智能体:六十九、Bootstrap采样在大模型评估中的应用:从置信区间到模型稳定性
在我们选择使用一个模型时,我们经常需要评估模型的性能。通常,我们会将数据集分为训练集和测试集,用测试集来评估模型的泛化能力。然而,单次划分的测试集可能不能完全代表模型在未知数据上的表现,特别是当数据集较小的时候。Bootstrap采样是一种强大的统计方法,可以通过重采样来估计统计量的分布,从而更稳健地评估模型性能,其基本思想是通过从原始数据集中随机抽取n个样本(允许重复抽取)形成一个新的数据集,称为Bootstrap样本,然后,我们可以基于这些Bootstrap样本计算统计量(如均值、标准差等)的分布。
一个处女座的程序猿
1 天前
llm
·
prompt
·
fabric
LLMs之Prompt:Fabric的简介、安装和使用方法、案例应用之详细攻略
LLMs之Prompt:Fabric的简介、安装和使用方法、案例应用之详细攻略目录Fabric的简介1、特点