大模型

Ro Jace1 小时前
大模型
国内环境下claude code安装、配置及skills使用助力科研专注解决国内网络限制,手把手带你把 Claude Code 打造成科研超级助手Anthropic 推出的终端级 AI 编程智能体,能理解整个项目、自动规划任务、直接操作文件/执行命令、完成多步编码,是真正能“动手干活”的 AI 助手。
大江东去浪淘尽千古风流人物4 小时前
机器人·大模型·概率论·端侧部署·巨身智能
【VLM】从“评测哲学”和“技术本质”两个层面拆解 robochallenge 任务设计https://robochallenge.cn/home https://robochallenge.cn/leaderboard
SunnyRivers16 小时前
大模型·模型·模型选择
使用不同的 AI 模型本教程面向初学者,将教你如何使用来自不同 AI 服务商的模型,比较它们的优势,并根据实际需求选择最合适的模型。在深入学习 LangChain 之前,理解各类模型的特点至关重要——因为 LangChain 能让你在这些模型之间无缝切换。
梧桐1681 天前
人工智能·langchain·大模型·text2sql
基于 LangChain 的Text2SQL 智能体开发实践在日常工作中,大量非技术岗位(如运营、市场、业务)人员经常需要从数据库中获取数据支持决策,但SQL编程门槛成为了关键障碍。为解决这一痛点,我们基于LangChain框架开发了一款“Text2SQL智能体”,实现了“用户口语化查询→智能解析→SQL生成→数据查询→口语化结果返回”的全流程自动化。本文将详细分享该智能体的技术架构、核心模块实现与前端交互设计,附完整技术细节与实践经验。
鸿乃江边鸟1 天前
大模型·opencode·oh my opencode
oh-my-opencode 实践--用户授权登陆Spring Boot项目这里我们用opencode(oh my opencode)实践写一个简单的Spring boot的项目,涉及到WEB界面进行登陆校验,这里我们直接Ultrawork 模式
赛博鲁迅1 天前
gpt·大模型·ai编程·agi·gemini·coze
coze 工作流使用中转API 教程1.创建一个新的项目2.建立一个新的工作流3.添加http请求4.填写内容 url填http://api.88api.chat/v1/chat/completions
yyoc971 天前
大模型·微调·llama·ollama
Mac基于LLaMA Factory微调模型导入Ollama踩坑记录遇到问题1:ERROR: Package 'llamafactory' requires a different Python: 3.9.6 not in '>=3.11.0'。然后升级到python最高版本3.14解决(不建议选最新版本,后面使用数据集遇到新的问题) 问题2:
Tadas-Gao1 天前
架构·系统架构·大模型·llm
大模型实战装备全解析:从本地微调到移动算力的笔记本电脑选择指南面对屏幕上加载到一半就因显存不足而中断的模型训练任务,计算机专业研究生李涛再次感受到硬件瓶颈带来的无奈。他环顾实验室里那几台沉重的塔式工作站,思考着一个问题:如果有一台笔记本能像工作站一样完成模型训练,又能在图书馆和教室之间自由移动,那该多好。
CoderJia程序员甲1 天前
人工智能·ai·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2026-02-12)生成于:2026-02-12共发现热门项目: 7 个榜单类型:日榜本期GitHub热榜凸显AI工程化与智能体开发已成为核心趋势,多个高星项目聚焦于此。Google的langextract展示了用LLM从非结构化文本提取信息的实用库,GitHub的gh-aw和Claude代码插件推动智能体工作流落地,而chrome-devtools-mcp则为编码智能体提供强大工具。同时,ai-engineering-hub的教程与免费LLM API资源列表降低了技术门槛,助力开发者快速构建可复现的AI应用。整个趋势表明,
J_bean1 天前
爬虫·ai·大模型
AI 智能爬虫实战构建基于 AI 大模型的智能爬虫。AI 智能爬虫的主要优势在于自主获取数据和抗干扰性强。传统的爬虫依赖固定的 CSS 选择器或 XPath 等,一旦网页改版,代码就会失效。而基于 AI 的爬虫则是让模型去“读”网页,像人一样找到目标数据在哪里,而不是依赖固定的数据获取和解析代码。
人工智能培训2 天前
人工智能·深度学习·大模型·逻辑回归·具身智能·大模型应用工程师
具身智能体的长期任务规划与记忆机制
李萨如2 天前
人工智能·大模型·阅读软件
AiReader:一个不联网的 AI 阅读助手,让你的算力为你服务每次你把一篇论文扔进在线翻译工具,每次你让 AI 帮你解读一份合同——你的文档都被上传到了某家公司的服务器上。
zhangfeng11332 天前
人工智能·语言模型·开源·大模型
DeepSeek-R1-Qwen-32B bpe算法 ,分词器配置 LlamaTokenizerFast这是一个 DeepSeek 模型的 tokenizer 配置文件(tokenizer_config.json)。让我为你解析其中的关键配置:
大江东去浪淘尽千古风流人物2 天前
机器人·大模型·概率论·端侧部署·巨身智能
【VLN】VLN Paradigm Alg:Reinforcement learning 强化学习及其细节(4)强化学习(RL) 研究的是智能体如何通过与环境交互,以最大化累积奖励为目标来学习策略。 监督学习则是通过标注数据,以最小化损失函数为目标来学习模型。 • RL is about how an agent learn a policy through interaction with the environment by maximizing the rewards • Supervised Learning is about learning a model through labeled data by
python零基础入门小白2 天前
人工智能·学习·大模型·知识图谱·产品经理·ai大模型·大模型学习
2025年Agent概念落地,2026年智能体生产力基础设施:如何规模化部署Agent?收藏这份学习指南!本文探讨了Agent智能体在2025年概念的扎根和开源生态的爆发,以及模型在真实工作能力上的进步和专用化趋势。文章重点分析了企业从一次性Agent实验转向大规模运行所面临的关键问题,并提出了企业级Agent栈的五大层(上下文、模型、编排、安全、交互)及核心闭环,强调开放架构的重要性,避免陷入单体平台的局限。
superCleanCoder2 天前
人工智能·大模型
模型介绍和选择这是一份 OpenCode Zen推荐的模型列表,涵盖了目前主流的大语言模型提供商。我将它们分为几类,并详细介绍其特点、适用场景以及如何选择。
咔咔学姐kk2 天前
服务器·前端·数据库·人工智能·大模型·就业·大模型学习
必收藏!Agentic RAG全面拆解(小白/程序员入门大模型必备)检索增强生成(Retrieval-Augmented Generation,简称RAG) 作为大模型落地应用的核心支撑技术,其核心逻辑的本质的是为大语言模型“外挂”独立知识源,补充实时、专业且精准的上下文信息。这种方式不仅能大幅提升模型生成内容的准确性与时效性,更能从根源上抑制大模型常见的“幻觉问题”——也就是LLM在缺乏事实依据时,依然自信编造虚假信息的现象,这也是小白入门大模型、程序员落地大模型项目时最需要规避的痛点之一。
python零基础入门小白2 天前
人工智能·学习·chatgpt·大模型·产品经理·ai大模型·大模型学习
大模型幻觉:小白程序员必看!收藏这份2025年突破性检测与抑制技术指南大模型幻觉是制约LLM产业落地的核心瓶颈,本文系统剖析了幻觉的本质、分类及生成机理,梳理了2025年突破性检测与抑制技术,并构建全生命周期防控框架。从预训练、微调到推理部署,详细阐述了各阶段幻觉产生的诱因,提出了基于内部激活监测、多维度特征融合等先进检测方法,以及知识蒸馏、中间层干预等抑制策略。最后,结合医疗、法律等高敏感领域实践,提出了定制化解决方案,为读者提供了理论与实践参考。
gz7seven3 天前
人工智能·大模型·数据清洗·质量过滤
大模型学习笔记------数据清洗(质量过滤)这类模型适用于处理海量原始数据(如 Common Crawl),其核心优势是速度极快、计算成本低。fastText (Facebook) 用途:最主流的质量过滤模型。常用于识别语种、过滤低质量文本(如广告、乱码)。 案例:FineWeb、Ultra-FineWeb 等知名数据集均使用 fastText 训练质量分类器。 原理:基于简单的 n-gram 和线性分类,能够以每秒处理数十万文档的速度运行。