大模型

赛博鲁迅2 小时前
gpt·大模型·ai编程·agi·gemini·coze
coze 工作流使用中转API 教程1.创建一个新的项目2.建立一个新的工作流3.添加http请求4.填写内容 url填http://api.88api.chat/v1/chat/completions
yyoc972 小时前
大模型·微调·llama·ollama
Mac基于LLaMA Factory微调模型导入Ollama踩坑记录遇到问题1:ERROR: Package 'llamafactory' requires a different Python: 3.9.6 not in '>=3.11.0'。然后升级到python最高版本3.14解决(不建议选最新版本,后面使用数据集遇到新的问题) 问题2:
Tadas-Gao3 小时前
架构·系统架构·大模型·llm
大模型实战装备全解析:从本地微调到移动算力的笔记本电脑选择指南面对屏幕上加载到一半就因显存不足而中断的模型训练任务,计算机专业研究生李涛再次感受到硬件瓶颈带来的无奈。他环顾实验室里那几台沉重的塔式工作站,思考着一个问题:如果有一台笔记本能像工作站一样完成模型训练,又能在图书馆和教室之间自由移动,那该多好。
CoderJia程序员甲3 小时前
人工智能·ai·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2026-02-12)生成于:2026-02-12共发现热门项目: 7 个榜单类型:日榜本期GitHub热榜凸显AI工程化与智能体开发已成为核心趋势,多个高星项目聚焦于此。Google的langextract展示了用LLM从非结构化文本提取信息的实用库,GitHub的gh-aw和Claude代码插件推动智能体工作流落地,而chrome-devtools-mcp则为编码智能体提供强大工具。同时,ai-engineering-hub的教程与免费LLM API资源列表降低了技术门槛,助力开发者快速构建可复现的AI应用。整个趋势表明,
J_bean5 小时前
爬虫·ai·大模型
AI 智能爬虫实战构建基于 AI 大模型的智能爬虫。AI 智能爬虫的主要优势在于自主获取数据和抗干扰性强。传统的爬虫依赖固定的 CSS 选择器或 XPath 等,一旦网页改版,代码就会失效。而基于 AI 的爬虫则是让模型去“读”网页,像人一样找到目标数据在哪里,而不是依赖固定的数据获取和解析代码。
人工智能培训19 小时前
人工智能·深度学习·大模型·逻辑回归·具身智能·大模型应用工程师
具身智能体的长期任务规划与记忆机制
李萨如19 小时前
人工智能·大模型·阅读软件
AiReader:一个不联网的 AI 阅读助手,让你的算力为你服务每次你把一篇论文扔进在线翻译工具,每次你让 AI 帮你解读一份合同——你的文档都被上传到了某家公司的服务器上。
zhangfeng113320 小时前
人工智能·语言模型·开源·大模型
DeepSeek-R1-Qwen-32B bpe算法 ,分词器配置 LlamaTokenizerFast这是一个 DeepSeek 模型的 tokenizer 配置文件(tokenizer_config.json)。让我为你解析其中的关键配置:
大江东去浪淘尽千古风流人物1 天前
机器人·大模型·概率论·端侧部署·巨身智能
【VLN】VLN Paradigm Alg:Reinforcement learning 强化学习及其细节(4)强化学习(RL) 研究的是智能体如何通过与环境交互,以最大化累积奖励为目标来学习策略。 监督学习则是通过标注数据,以最小化损失函数为目标来学习模型。 • RL is about how an agent learn a policy through interaction with the environment by maximizing the rewards • Supervised Learning is about learning a model through labeled data by
python零基础入门小白1 天前
人工智能·学习·大模型·知识图谱·产品经理·ai大模型·大模型学习
2025年Agent概念落地,2026年智能体生产力基础设施:如何规模化部署Agent?收藏这份学习指南!本文探讨了Agent智能体在2025年概念的扎根和开源生态的爆发,以及模型在真实工作能力上的进步和专用化趋势。文章重点分析了企业从一次性Agent实验转向大规模运行所面临的关键问题,并提出了企业级Agent栈的五大层(上下文、模型、编排、安全、交互)及核心闭环,强调开放架构的重要性,避免陷入单体平台的局限。
superCleanCoder1 天前
人工智能·大模型
模型介绍和选择这是一份 OpenCode Zen推荐的模型列表,涵盖了目前主流的大语言模型提供商。我将它们分为几类,并详细介绍其特点、适用场景以及如何选择。
咔咔学姐kk1 天前
服务器·前端·数据库·人工智能·大模型·就业·大模型学习
必收藏!Agentic RAG全面拆解(小白/程序员入门大模型必备)检索增强生成(Retrieval-Augmented Generation,简称RAG) 作为大模型落地应用的核心支撑技术,其核心逻辑的本质的是为大语言模型“外挂”独立知识源,补充实时、专业且精准的上下文信息。这种方式不仅能大幅提升模型生成内容的准确性与时效性,更能从根源上抑制大模型常见的“幻觉问题”——也就是LLM在缺乏事实依据时,依然自信编造虚假信息的现象,这也是小白入门大模型、程序员落地大模型项目时最需要规避的痛点之一。
python零基础入门小白1 天前
人工智能·学习·chatgpt·大模型·产品经理·ai大模型·大模型学习
大模型幻觉:小白程序员必看!收藏这份2025年突破性检测与抑制技术指南大模型幻觉是制约LLM产业落地的核心瓶颈,本文系统剖析了幻觉的本质、分类及生成机理,梳理了2025年突破性检测与抑制技术,并构建全生命周期防控框架。从预训练、微调到推理部署,详细阐述了各阶段幻觉产生的诱因,提出了基于内部激活监测、多维度特征融合等先进检测方法,以及知识蒸馏、中间层干预等抑制策略。最后,结合医疗、法律等高敏感领域实践,提出了定制化解决方案,为读者提供了理论与实践参考。
gz7seven2 天前
人工智能·大模型·数据清洗·质量过滤
大模型学习笔记------数据清洗(质量过滤)这类模型适用于处理海量原始数据(如 Common Crawl),其核心优势是速度极快、计算成本低。fastText (Facebook) 用途:最主流的质量过滤模型。常用于识别语种、过滤低质量文本(如广告、乱码)。 案例:FineWeb、Ultra-FineWeb 等知名数据集均使用 fastText 训练质量分类器。 原理:基于简单的 n-gram 和线性分类,能够以每秒处理数十万文档的速度运行。
MoyiTech2 天前
深度学习·大模型·多模态·kimi·k2.5
③模型架构-Kimi K2.5 技术报告解读模型主要包含三个部分:MoonViT-3D、MLP投影器、Kimi-K2。没错,刚发现Kimi-K2其实是单模态的,这里面使用的是Kimi-K2的模型架构而非其训练参数。
Eastmount2 天前
人工智能·大模型·iflycode·ai coding·桌面应用程序开发
《AI Coding入门与实战》开源课程分享:第5课 基于iFlyCode的桌面应用程序开发(AI大学堂)在大模型技术快速演进的背景下,软件开发正经历从“代码书写驱动”向“智能语义驱动”的范式转型。AI Coding 作为这一转型的核心形态,依托大语言模型的理解、生成与推理能力,使开发者能够通过自然语言表达需求,由 AI 协同完成代码设计、实现与优化。这种新模式正在显著降低编程门槛、提升开发效率,并推动软件工程进入智能协作时代。
咔咔学姐kk2 天前
java·开发语言·人工智能·大模型·ai大模型·智能体·大模型学习
收藏备用|AI智能体协作协议详解(小白&程序员入门必看)在之前的内容中,我们已经初步拆解了AI智能体的基础定义与核心概念,帮大家建立了对智能体的初步认知,适合刚入门大模型、想深耕智能体领域的小白和程序员参考。
来两个炸鸡腿2 天前
人工智能·学习·大模型·智能体
【Datawhale组队学习202602】Hello-Agents task01 初识智能体智能体 Agent,任何能够通过传感器 sensors感知其所处环境 environment,并自主通过执行器 actuators采取行动 action以达成特定目标的实体。
小草cys2 天前
大模型·vs code·claude code
Claude Code for VSCode 最简安装Claude Code for VSCode 的安装与基础使用 开始,逐步讲清楚扩展的核心功能和使用方式;然后重点讲解国内用户和企业环境中最常见、也是最容易踩坑的部分——如何配置“AI 中转”,包括不同登录与接入方案的区别、settings.json 的正确写法,以及常见问题的排查方法,帮助你在 VS Code 中稳定、顺畅地使用 Claude Code 完成真实开发任务。
Ekehlaft2 天前
大数据·人工智能·ai·大模型·aipy
比Agent更强大,这个国产智能体让 AI 成为你的超级助手提到智能助手,近期市场上出现了Claude Code、OpenClaw和OpenAI推出的Codex APP等产品,均标榜为职场人士的高效工作助手。这些工具虽然各具特色,但在实际应用中还是存在一定的问题。