技术栈
llm
阿正的梦工坊
1 小时前
人工智能
·
深度学习
·
机器学习
·
大模型
·
llm
二次预训练与微调的区别
在大型语言模型(LLM)的开发和应用中,二次预训练(也称为继续预训练、增量预训练或领域自适应预训练,Domain-Adaptive Pretraining,简称DAPT)和微调(Fine-Tuning)是两种常见的模型适配方法。它们都基于已有的预训练基座模型(如Llama、Qwen或GPT系列),但目的、数据需求、训练目标和适用场景有显著区别。本文将详细解释二者的差异,帮助读者理解何时选择哪种方法。
赵长辉
4 小时前
python
·
学习
·
llm
·
agi
AGI-rag学习:ChromaDB使用1,txt类型文档【20251016课复习】
记录学习llm过程中的学习代码 下面的代码是学习如何使用chromaDB的例子,文档是txt类型
骚戴
13 小时前
人工智能
·
大模型
·
llm
·
api
·
ai gateway
2025 n1n.ai 全栈国产大模型接入列表与实测报告
摘要:误以为 n1n.ai 只支持 GPT-4?本文更新 n1n.ai 对国产 AI 大模型(DeepSeek, 通义千问, 智谱 GLM, Yi)的全面支持情况。附详细的 LLM API 兼容性列表与延迟实测,助您一站式管理全球 AI 大模型 资产。
技术小甜甜
17 小时前
ai
·
自动化
·
llm
·
agent
·
ollama
·
’人工智能
·
aider
[AI 工程实践] 远程调用 Ollama 报错解析:如何解决“本地文件找不到”的误区
在使用 Ollama 进行局域网远程调用部署的过程中,一些开发者可能遇到过类似的错误提示:“找不到本地文件”或其他本地路径相关的异常。明明客户端的环境变量已经正确设置为远端 IP,直接通过 IP 请求也能获取到 JSON 响应,为什么程序却仍然报错?
骚戴
1 天前
人工智能
·
大模型
·
llm
·
api
·
ai gateway
2025 AI 生态全景:AnythingLLM、OpenRouter、LiteLLM 与 n1n.ai 深度对比
摘要:面对 AI 生态的爆发,如何选择合适的 LLM API 基础设施?本文深度横评 AnythingLLM、OpenRouter、LiteLLM 与 n1n.ai 四大主流工具。从个人 AI 开发到企业级 AI 大模型 部署,剖析各平台在 AI API 聚合及成本控制上的优劣,助你构建高效的 AI 大模型 技术栈。
viperrrrrrrrrr7
1 天前
llm
·
rag
·
mmrag
多模态RAG
🍋🍋AI学习🍋🍋🔥系列专栏: 👑哲学语录: 用力所能及,改变世界。 💖如果觉得博主的文章还不错的话,请点赞👍+收藏⭐️+留言📝支持一下博主哦🤞
Tadas-Gao
1 天前
人工智能
·
架构
·
系统架构
·
大模型
·
llm
AI是否存在“系统一”与“系统二”?——从认知科学到深度学习架构的跨学科解读
在丹尼尔·卡尼曼的经典著作《思考,快与慢》中,人类认知被划分为两个系统:系统一(快思考):自动化、直觉式、快速、并行处理、低能耗、易受情绪影响
CoderJia程序员甲
1 天前
git
·
ai
·
开源
·
llm
·
github
GitHub 热榜项目 - 日榜(2025-12-30)
生成于:2025-12-30共发现热门项目: 13 个榜单类型:日榜本期GitHub热榜显示AI应用开发正席卷开源领域,项目高度聚焦解决信息过载与效率痛点。热点项目如TrendRadar借助MCP实现多平台舆情智能分析,SurfSense与awesome-llm-apps则展示了RAG与智能体在跨平台知识管理中的爆发力,而RealtimeSTT和chatterbox凸显了实时语音技术的成熟。整体趋势表明,开发者正积极构建开箱即用的AI工具链,通过低代码部署和多样化集成,将大模型能力切实转化为可复用的业务解
程序员水自流
2 天前
java
·
人工智能
·
llm
【AI大模型第9集】Function Calling,让AI大模型连接外部世界
Function Calling 是 OpenAI 最先引入的一项技术,允许开发者将大语言模型(如 GPT-4)与外部函数或工具集成。通过 Function Calling,模型可以理解用户请求并生成调用外部函数所需的参数,从而实现更复杂、更动态的任务处理。下面我们一起来详细了解 Function Calling 技术吧。
栀秋666
2 天前
前端
·
llm
·
openai
从零开始调用大模型:使用 OpenAI SDK 实现歌词生成,手把手实战指南
在 AIGC 浪潮席卷全球的今天,大语言模型(LLM) 已不再是科研实验室里的“黑科技”,而是每一个开发者都能轻松调用的强大工具。
夏日白云
2 天前
图像处理
·
机器学习
·
pdf
·
llm
·
大语言模型
·
rag
·
文档解析
《PDF解析工程实录》第 12 章|别让模型贴着墙走:为什么加一圈空白,效果反而更好?
点此进入系列专栏先说结论:对于相当多的图像模型,在输入图像四周主动加一圈 Padding(空白边),往往能提升边界区域的识别效果。
CoderJia程序员甲
2 天前
开源
·
大模型
·
llm
·
github
·
ai教程
GitHub 热榜项目 - 日榜(2025-12-31)
生成于:2025-12-31共发现热门项目: 15 个榜单类型:日榜本期GitHub趋势显示,AI应用开发与工具链整合已成主流热点。项目聚焦于大语言模型的实际部署与能力增强,如pg-aiguide通过MCP服务器优化PostgreSQL代码生成,chatterbox提供开源SOTA级TTS方案。开发者积极构建AI智能体与RAG应用,awesome-llm-apps和anthropics/skills等仓库集结了大量可复现案例,而vllm则持续优化LLM推理性能。同时,private-gpt和TrendRa
冬奇Lab
2 天前
llm
·
ai编程
·
cursor
【Cursor进阶实战·03】四大模式完全指南:Agent/Plan/Debug/Ask的正确打开方式
周末改个功能,给Cursor描述需求后,它疯狂修改了10个文件,结果项目跑不起来了。回滚代码重来,这次小心翼翼地问了个简单问题,它却只讲理论不写代码。
Mintopia
2 天前
人工智能
·
llm
·
aigc
⚙️ AI冲击下的职场新物种:超级个体
现在的AI浪潮,与蒸汽机、互联网革命最大的不同,在于它不是“体力替代”,而是“认知替代”。过去:现在:
爱听歌的周童鞋
2 天前
llm
·
policy gradient
·
grpo
·
cs336
·
baselines
·
advantage funcs
斯坦福大学 | CS336 | 从零开始构建语言模型 | Spring 2025 | 笔记 | Lecture 17: Alignment - RL 2
学习斯坦福的 CS336 课程,本篇文章记录课程第十七讲:对齐 - RL(下),记录下个人学习笔记,仅供自己参考😄
牛奶咖啡.854
3 天前
语言模型
·
llm
·
llama
·
rl
·
ppo
基于Llama-Factory/Qwen2.5-1.5b自定义数据集LoRA微调实战【PPO/RLHF/训练/评估】
目标是整合主流高校效训练微调技术,如增量预训练、多模态指令监督微调、奖励模型训练、PPO训练、DPO训练、KTO训练、ORPO训练
人工干智能
3 天前
llm
LLM大模型的付费管理流程(以OpenAI 为例)
本文以OpenAI 为例,说明LLM大模型的付费管理流程OpenAI的付费管理核心是以API Key为唯一身份标识,在云服务端完成全链路管控:客户端仅需携带API Key发起请求,无需感知计费细节;云服务端是付费管理的核心枢纽,负责校验付费状态、计量资源消耗、结算费用、管控使用限额;大模型端仅上报算力/资源消耗数据,不直接参与计费规则决策。以下从完整流程视角拆解付费管理的每一个环节,结合前文(OpenAI 的核心架构范式)三层架构的交互逻辑说明:
智泊AI
3 天前
llm
大语言模型之AI Agent:Multi-Agent架构
一、引言在 Agent 系统的构建过程中,随着系统演进,其复杂度往往持续攀升,进而显著增加管理与扩展的难度。典型挑战包括:
Mintopia
3 天前
人工智能
·
llm
·
aigc
量子计算会彻底改变 AI 的运算方式吗?一场关于"量子幽灵"与"硅基大脑"的深夜对话 🎭💻
深夜的实验室里,经典计算机的风扇嗡嗡作响,像一位疲惫的老管家在叹息。此时的你,或许正训练着第127个epoch的神经网络,看着loss曲线像蜗牛一样爬行,心里默念:"这世上一定存在一条计算捷径!"
mubei-123
3 天前
人工智能
·
llm
·
rag
·
检索增强生成
Self-RAG:通过自我反思学习检索、生成和批判
在使用RAG辅助LLM完成知识问答任务时,无论检索是否必要或者段落是否相关,不加选择地检索和合并固定数量的检索段落,都会降低LM的通用性,或者可能生成无益的反应。