大模型

汤姆yu2 小时前
ai·大模型·智能体·hermes
Hermes智能体使用指南Hermes智能体是由Nous Research研发的开源自主AI智能体,区别于普通聊天机器人和代码助手,它具备自我进化、持久记忆、多平台适配等核心优势,可运行在多种基础设施上,通过40+内置工具完成各类自动化任务,是开发者、研究者及普通用户的高效辅助工具。本文将从核心认知、安装部署、基础操作、高级功能、场景应用、故障排查及日常维护七个维度,详细讲解其使用方法,严格控制3000字,兼顾易懂性和实用性,帮助不同需求的用户快速上手。
Tadas-Gao8 小时前
人工智能·语言模型·架构·大模型·llm·harness
从“驯马”到“驭队”:Harness Engineering 如何重构 AI 产品化的底层逻辑想象你有一个朋友,智商高达 180,读过世界上所有的书(大模型的预训练)。你让他帮你“筹备一次生日派对”。
guslegend11 小时前
人工智能·大模型·ocr·rag
第6节:OCR文本错漏频发?结合LLM纠错,让图像文本也能精确使用RAG与Agent性能调优:6.OCR文本错漏频发?结合LLM纠错,让图像文本也能精确使用Gitee地址:https://gitee.com/agiforgagaplus/OptiRAGAgent
Wenweno0o12 小时前
golang·大模型·智能体·eino
Eino - 从0到1跑通大模型调用Eino 是字节跳动开源的 AI 应用开发框架,提供了丰富的大模型组件支持。本文将基于 代码示例,详细介绍如何使用 Eino 框架实现单轮对话、多轮对话、流式输出以及模型参数配置,帮助你从零开始掌握大模型调用,代码链接。
华农DrLai13 小时前
数据库·人工智能·大模型·nlp·prompt
怎么用大模型生成推荐的训练数据?Data Augmentation怎么做?🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!
guslegend15 小时前
人工智能·大模型
4月11日(Codex使用)Claude Code:https://github.com/anthropics/claude-code
CoderJia程序员甲16 小时前
人工智能·ai·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2026-04-11)生成于:2026-04-11共发现热门项目: 12 个榜单类型:日榜Token赞助:siliconflow
见合八方17 小时前
ai·chatgpt·大模型·llm·入门教程
AI大模型入门教程:从零开始理解ChatGPT背后的技术本文面向对 AI 感兴趣但没有深厚技术背景的读者,带你用最直观的方式理解大语言模型(LLM)的工作原理、使用方法以及实际应用场景。
CoderJia程序员甲2 天前
人工智能·ai·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2026-04-09)生成于:2026-04-09共发现热门项目: 11 个榜单类型:日榜Token赞助:siliconflow
前端摸鱼匠2 天前
人工智能·ai·语言模型·面试·大模型
【AI大模型春招面试题18】 L1、L2正则化、Dropout、早停(Early Stopping)的原理与适用场景?你好!咱们就不整那些虚头巴脑的教科书定义了。在现在的面试环境里(尤其是2026年这个节点),面试官问正则化、Dropout 和早停,早就不是想听你背“什么是过拟合”,而是想考察你对模型泛化边界、优化动力学以及工程落地权衡的理解深度。
前端摸鱼匠2 天前
人工智能·ai·语言模型·面试·大模型
【AI大模型春招面试题17】 过拟合、欠拟合在大模型中的表现与解决策略?这道题(第17题:过拟合与欠拟合在大模型中的表现与解决策略)是高频必考题,通常出现在二面或三面,考察你的实战深度。
魔乐社区2 天前
人工智能·大模型·量化
从0到1:魔乐社区贡献者丁一超的大模型量化实战指南在刚刚结束的魔乐社区GeekDay上海站上,魔乐社区贡献者、昇腾优秀开发者丁一超带来了题为《如何入门大模型从量化到评测》的分享。作为一名从企业IT工作之余投身AI技术的开发者,他用亲身经历证明:量化并非高不可攀的技术壁垒,而是一条有章可循的实践路径。
CoderJia程序员甲2 天前
人工智能·ai·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2026-04-10)生成于:2026-04-10共发现热门项目: 10 个榜单类型:日榜Token赞助:siliconflow
AI、少年郎2 天前
人工智能·python·神经网络·ai·自然语言处理·大模型·模型训练微调
如何用个人电脑快速训练自己的语言模型?MiniMind 全流程实战指南摘要:无需企业级算力,仅需一张消费级显卡(如RTX 3090)、3元成本与2小时,即可从零训练一个64M参数的轻量语言模型。本文以开源项目 MiniMind 为例,手把手带你体验大模型训练全流程。
iiiiii112 天前
论文阅读·笔记·语言模型·大模型·llm
【论文阅读笔记】ReVal:让大模型强化学习真正支持离策略(off-policy)数据复用Off-Policy Value-Based Reinforcement Learning for Large Language Models
千桐科技2 天前
大模型·知识图谱·知识库·智能体·智能应用·qknow
从“找答案”到“解决问题”:qKnow 如何用“预置+迭代”体系打通 AI 落地最后一公里?过去两年,AI 工具、知识库、智能助手、Agent 平台层出不穷,但企业真正落地时却发现:AI 进入下半场,真正稀缺的不是炫酷的工具,而是把技术转化为业务价值的落地能力。正是在这样的背景下,qKnow 专业版完成了一次架构级的重大升级——从单纯的知识图谱 + RAG 知识平台,进化为集 Bot 构建、开箱即用的应用、行业解决方案于一体的 行业智能体构建平台。
guslegend2 天前
人工智能·大模型·rag
第5节:动态切片策略与重叠机制提升RAG召回率RAG与Agent性能调优:5.动态切片策略与重叠机制提升RAG召回率Gitee地址:https://gitee.com/agiforgagaplus/OptiRAGAgent
熊猫钓鱼>_>2 天前
ai·架构·大模型·llm·agent·skill·openclaw
从“流程固化“到“意图驱动“:大模型调智能体调Skill架构深度解析传统业务系统基于确定性逻辑构建:if-else分支、状态机、工作流引擎。业务进化意味着修改这些逻辑——提需求、排期、上线,周期以周或月为单位。大语言模型(LLM)的出现带来了新的可能性:让模型理解业务目标,动态编排已有能力,在执行中自我优化。这就是"大模型调智能体调Skill"的核心思想。
前进的李工2 天前
开发语言·人工智能·语言模型·langchain·大模型
LangChain使用AI工具赋能:解锁大语言模型无限潜力没有工具的加持,再强大的AI都只是“思想上的巨人”,借助工具才能让AI应用的能力真正达到无限的可能。Tools用于扩展大语言模型的能力,使其能够与外部系统、API或自定义函数进行交互,从而完成仅靠文本生成无法实现的任务。
FeelTouch Labs2 天前
开源·大模型
中国开源大模型三国杀:GLM-5、MiniMax-M2.1、Kimi-K2.5,谁才是技术选型的最优解?Talk is cheap, let's explore。无界探索,有术而行。中国开源大模型三国杀中国开源大模型三国杀