大模型

CoderJia程序员甲12 小时前
人工智能·ai·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2026-04-09)生成于:2026-04-09共发现热门项目: 11 个榜单类型:日榜Token赞助:siliconflow
前端摸鱼匠15 小时前
人工智能·ai·语言模型·面试·大模型
【AI大模型春招面试题18】 L1、L2正则化、Dropout、早停(Early Stopping)的原理与适用场景?你好!咱们就不整那些虚头巴脑的教科书定义了。在现在的面试环境里(尤其是2026年这个节点),面试官问正则化、Dropout 和早停,早就不是想听你背“什么是过拟合”,而是想考察你对模型泛化边界、优化动力学以及工程落地权衡的理解深度。
前端摸鱼匠16 小时前
人工智能·ai·语言模型·面试·大模型
【AI大模型春招面试题17】 过拟合、欠拟合在大模型中的表现与解决策略?这道题(第17题:过拟合与欠拟合在大模型中的表现与解决策略)是高频必考题,通常出现在二面或三面,考察你的实战深度。
魔乐社区16 小时前
人工智能·大模型·量化
从0到1:魔乐社区贡献者丁一超的大模型量化实战指南在刚刚结束的魔乐社区GeekDay上海站上,魔乐社区贡献者、昇腾优秀开发者丁一超带来了题为《如何入门大模型从量化到评测》的分享。作为一名从企业IT工作之余投身AI技术的开发者,他用亲身经历证明:量化并非高不可攀的技术壁垒,而是一条有章可循的实践路径。
CoderJia程序员甲16 小时前
人工智能·ai·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2026-04-10)生成于:2026-04-10共发现热门项目: 10 个榜单类型:日榜Token赞助:siliconflow
AI、少年郎17 小时前
人工智能·python·神经网络·ai·自然语言处理·大模型·模型训练微调
如何用个人电脑快速训练自己的语言模型?MiniMind 全流程实战指南摘要:无需企业级算力,仅需一张消费级显卡(如RTX 3090)、3元成本与2小时,即可从零训练一个64M参数的轻量语言模型。本文以开源项目 MiniMind 为例,手把手带你体验大模型训练全流程。
iiiiii1117 小时前
论文阅读·笔记·语言模型·大模型·llm
【论文阅读笔记】ReVal:让大模型强化学习真正支持离策略(off-policy)数据复用Off-Policy Value-Based Reinforcement Learning for Large Language Models
千桐科技17 小时前
大模型·知识图谱·知识库·智能体·智能应用·qknow
从“找答案”到“解决问题”:qKnow 如何用“预置+迭代”体系打通 AI 落地最后一公里?过去两年,AI 工具、知识库、智能助手、Agent 平台层出不穷,但企业真正落地时却发现:AI 进入下半场,真正稀缺的不是炫酷的工具,而是把技术转化为业务价值的落地能力。正是在这样的背景下,qKnow 专业版完成了一次架构级的重大升级——从单纯的知识图谱 + RAG 知识平台,进化为集 Bot 构建、开箱即用的应用、行业解决方案于一体的 行业智能体构建平台。
guslegend1 天前
人工智能·大模型·rag
第5节:动态切片策略与重叠机制提升RAG召回率RAG与Agent性能调优:5.动态切片策略与重叠机制提升RAG召回率Gitee地址:https://gitee.com/agiforgagaplus/OptiRAGAgent
熊猫钓鱼>_>1 天前
ai·架构·大模型·llm·agent·skill·openclaw
从“流程固化“到“意图驱动“:大模型调智能体调Skill架构深度解析传统业务系统基于确定性逻辑构建:if-else分支、状态机、工作流引擎。业务进化意味着修改这些逻辑——提需求、排期、上线,周期以周或月为单位。大语言模型(LLM)的出现带来了新的可能性:让模型理解业务目标,动态编排已有能力,在执行中自我优化。这就是"大模型调智能体调Skill"的核心思想。
前进的李工1 天前
开发语言·人工智能·语言模型·langchain·大模型
LangChain使用AI工具赋能:解锁大语言模型无限潜力没有工具的加持,再强大的AI都只是“思想上的巨人”,借助工具才能让AI应用的能力真正达到无限的可能。Tools用于扩展大语言模型的能力,使其能够与外部系统、API或自定义函数进行交互,从而完成仅靠文本生成无法实现的任务。
FeelTouch Labs1 天前
开源·大模型
中国开源大模型三国杀:GLM-5、MiniMax-M2.1、Kimi-K2.5,谁才是技术选型的最优解?Talk is cheap, let's explore。无界探索,有术而行。中国开源大模型三国杀中国开源大模型三国杀
QC·Rex1 天前
spring boot·大模型·向量数据库·rag·spring ai·tool calling
Spring Boot + Spring AI 实战:从零构建企业级 AI 应用随着大模型技术的快速发展,AI 应用开发已经从 Python 专属扩展到多语言生态。Spring AI 作为 Spring 官方推出的 AI 工程化框架,让 Java 开发者能够以熟悉的 Spring 编程模型快速构建企业级 AI 应用。本文将从零开始,详细介绍如何使用 Spring Boot 3.5 和 Spring AI 1.0 构建一个完整的 AI 应用,涵盖 ChatClient API、Tool Calling、RAG 检索增强、向量数据库集成等核心功能。通过本文,你将掌握 Spring AI
rising start1 天前
大模型·agent·dify
Dify在Windows上的部署定义:模型的典型代表:核心能力大模型的局限(大模型本身)定义:核心特征:定义:Dify是一个开源的大语言模型(LLM)应用开发平台,旨在简化和加速生成式AI应用的创建和部署。(可以简单理解为它是Agent的开发工具)
竹之却1 天前
人工智能·ai·大模型·边缘计算·剪枝·优化·蒸馏
【Agent-阿程】AI先锋杯·14天征文挑战第14期-第2天-大模型部署与优化实战技术标签:AI、人工智能、大模型、部署、优化、推理加速、量化、剪枝、蒸馏、边缘计算在昨天的文章中,我们深入探讨了大模型微调技术。然而,一个训练好的大模型要真正产生价值,必须能够高效地部署到生产环境中。从实验室到生产环境,大模型面临着巨大的部署挑战:
guslegend1 天前
人工智能·大模型·rag
第4节:切片语义割裂怎么办?RAG与Agent性能调优:4.切片语义割裂怎么办?Gitee地址:https://gitee.com/agiforgagaplus/OptiRAGAgent
最初的↘那颗心2 天前
java·大模型·agent·spring ai·记忆系统
Agent 实战:构建第一个 Agent 与记忆系统设计导读:当你的 AI 应用从"一问一答"升级为"自主完成任务",Agent 就登场了。但 Agent 不只是能调工具的聊天机器人——它还需要"记忆"。本文将从零开始,带你用 Spring AI 构建一个具备工具调用能力的个人助理 Agent,再逐步为它装上三层记忆系统(工作记忆、历史压缩、长期记忆),让它真正"记住"用户、理解上下文。全文涵盖设计思路、核心代码与踩坑经验,适合有 Spring Boot 基础的开发者阅读。
最初的↘那颗心3 天前
大模型·agent·react·spring ai·工具设计
Agent 核心原理:本质、ReAct 框架与工具设计最佳实践导读:当你使用豆包、Copilot 这类 AI 助手时,有没有想过——它为什么比普通聊天机器人"聪明"得多?答案就藏在 Agent 这个概念里。本文将从三个维度拆解 Agent 的核心原理:首先搞清楚 Agent 的本质,理解它与普通 Function Call 的根本区别;然后深入 ReAct 框架,看看模型是如何通过"思考-行动-观察"的循环完成复杂任务的;最后聚焦工具设计的最佳实践,一个好的 description 往往决定了 Agent 能不能跑通。无论你是刚接触 Agent 开发,还是已经在用
gz7seven3 天前
lora·大模型·大模型微调·lora原理
大模型学习笔记------微调之LoRALoRA(Low-Rank Adaptation,低秩自适应) 是目前大模型微调领域最火、应用最广的“平民化”技术。
竹之却3 天前
人工智能·机器学习·lora·大模型·qlora·微调技术
【Agent-阿程】AI先锋杯·14天征文挑战第14期-第1天-大模型微调技术实战随着ChatGPT、GPT-4、Claude等大型语言模型的崛起,人工智能进入了全新的发展阶段。这些拥有数百亿甚至数千亿参数的大模型展现出了令人惊叹的通用能力,但在实际应用中也面临着诸多挑战: