大模型

CV-deeplearning2 小时前
gpt·大模型·transformer·李沐·论文精读·ai学习路线
李沐论文精读合集:67 篇深度学习经典论文逐段精读,从 AlexNet 到 Sora,B 站播放百万级的 AI 自学圣经💡 学深度学习读不懂论文?跟着李沐逐段精读!从 AlexNet 到 Sora,从 Transformer 到 GPT-4,67 篇经典论文逐段拆解,每篇 40-90 分钟深度讲解,B 站百万播放量的论文精读项目。涵盖 CNN 架构演进、Transformer 全家桶、生成模型、分布式训练、大语言模型、多模态等 8 大方向,配套《研究的艺术》4 讲教你做科研。全网最系统的 AI 论文学习路线,没有之一。
DogDaoDao2 小时前
深度学习·大模型·github·音频·语音模型·tss·文本生成语音
【GitHub】VoxCPM2 实战全解析:原理、部署与效果对比简介: VoxCPM2 是 OpenBMB 团队开源的 2B 参数多语言 TTS 模型,支持 30+ 语言、情感控制、声音克隆,音质达到 48kHz。本文从实际使用和源码两个维度拆解它——不堆术语,只讲清楚它是什么、为什么好用、以及怎么把它跑起来。
AImatters4 小时前
机器人·大模型·具身智能·atomix·原力灵机
原力灵机并购Atomix:让机器人在真实业务中长出数据飞轮过去一年,具身智能行业形成了一个基本共识:没有百万小时级别的大规模真机数据,就很难训练出真正能进入物理世界的机器人模型。
Tbisnic5 小时前
人工智能·python·ai·大模型·react·cot·提示词工程
AI大模型学习 第十天:让程序“指挥”大模型 —— 从对话到工具调用学会用 Python 程序调用大模型 API,而不是手动复制粘贴。掌握“流式输出”,让模型像真人聊天一样逐字显示答案。
阿提说说6 小时前
python·大模型·agent
我的 NVIDIA 考试攻略前段时间,我在CSDN消息里收到了NVIDIA的消息,点进去看了一下,觉得对我当下的状态挺有用的,并且NVIDIA的GPU技术也是目前主流。
刘大猫.7 小时前
人工智能·科技·机器学习·ai·chatgpt·机器人·大模型
宇树科技回应联合英伟达开发“H2+”人形机器人,预计今年下半年正式亮相英伟达(NVIDIA)首席执行官黄仁勋日前宣布,已与本土具身智能企业宇树科技达成合作,联合推出新一代人形机器人参考设计“H2+”。
蜂蜜黄油呀土豆7 小时前
python·ai·大模型·react·js
Agent 循环:观察、思考、行动(ReAct 入门)LLM 本身只是一个"自动补全器":你输入一段字符串,它输出一段字符串。它读不了文件、跑不了查询、开不了浏览器、也无法核实事实。一旦信息过时或错误,模型会一脸自信地说错话然后停下。
在水一缸9 小时前
人工智能·搜索引擎·大模型·信息检索·ai搜索·perplexity·searchgpt
AI 搜索新纪元:Perplexity 与 SearchGPT 如何颠覆传统搜索在互联网发展的早期,我们习惯了“搜索-点击-阅读”的三步走模式。那时的搜索引擎是通往互联网海洋的灯塔,它们只负责指引方向,而探索的任务则完全留给用户。然而,随着信息爆炸式增长,这种模式开始显露出疲态。用户不再满足于在成百上千个蓝色链接中筛选信息,尤其是在面对复杂问题时,传统搜索引擎往往只能提供碎片化的线索。
龙骑士baby1 天前
ai·大模型·llm·prompt·skill
重建 AI 认知第 4 篇:Skill——提示词的系统化封装摘要: 你跟 AI 的每一次对话,都是在临时培训一个新员工——教会了,下次又得重来。Skill 就是把"培训手册"固定下来,让 AI 每次上岗都知道按你的方法来。它不只是省时间,更关键的是它的结构会逼你把"说不清楚的要求"一条条补齐。这篇讲清楚 Skill 是什么、为什么它比 Prompt 多了一层价值,以及怎么开始拥有自己的 Skill。
wuhui21001 天前
大模型·comfyui
ComfyUI 快速文生图模型生成目标:最快速度部署 ComfyUI + Lumina2 Turbo 模型,支持通过 z_image.json 工作流一键生成图片。
HyperAI超神经1 天前
人工智能·3d·大模型·多模态·空间推理·3d感知·3d理解
深度估计准确率冲上0.9,Meta提出VLM³,论证视觉模型天生会学3D,以Qwen3-VL-4B为基础实现多任务的统一建模三维空间感知是自动驾驶、机器人、三维重建等领域的核心基础能力,其目标是从二维图像中恢复真实世界的空间结构、尺度信息与几何关系。与图像分类、目标检测等二维视觉任务相比,三维感知不仅要求语义理解能力,还需要精确的空间推理与几何建模,因此长期以来被视为计算机视觉领域最具挑战性的研究方向之一。
xixixi777771 天前
大数据·人工智能·深度学习·ai·大模型·光模块·智能体
空天地通信、高速光模块、AI 智能体攻击、同态加密芯片四大事件解读:AI 算力底座攻防与全域通信同步升级标签:卫星互联网、800G 光模块、AI 算力网络、LLM 智能体攻击、Marimo 漏洞、长安链同态加密芯片、空天地一体化、数据隐私安全 阅读时长:11 分钟
DogDaoDao1 天前
程序员·大模型·github·ai编程·ai agent·智能体·hermers agent
【GitHub】Hermes Agent 深度技术分析副标题:唯一内置学习循环的开源 AI Agent 框架——它不只是执行任务,而是「越用越聪明」作者:码流怪侠 | 日期:2026 年 6 月
汤姆yu1 天前
人工智能·信息安全·大模型
AI全生命周期七大安全模块落地指南结合 AI 全生命周期(数据、训练、模型、部署、应用、运维、供应链),分七大模块整理可落地的具体手段,兼顾技术、管理、合规、运维,区分通用方案与专项防护,条理清晰、可直接落地执行。
战族狼魂1 天前
人工智能·python·chatgpt·大模型
AI 全栈开发实战训练路线(企业级)下面这份路线,不再是“学几个 AI 工具”。而是:目标:从:成长为:最终你会具备:并最终完成:目标:建立 AI 工程开发的基础能力。
AI原来如此1 天前
人工智能·ai·chatgpt·大模型·编程
Claude与ChatGPT激战正酣,国内AI中转站却突破2000家这周AI圈挺热闹。国外OpenAI升级了GPT-5.5并宣布旧模型退役,Anthropic则用Claude Opus 4.8在代码能力上实现反超。国内,一个更接地气的数字悄然浮现:AI模型“中转站”平台数量已突破2000家。两个事件看似无关,却指向同一个方向——AI的竞争正从“技术军备”转向“生态卡位”。
镜舟科技1 天前
starrocks·大模型·prompt·ai agent·数据基础设施·上下文工程
从 Prompt 到 Context Engineering:如何用 StarRocks 构建 AI Agent 的实时上下文引擎?全球 Lakehouse 架构的部署正在加速普及。然而,一个更深层的范式转变正在悄然发生:企业数据基础设施的服务对象,正在从人向 AI 迁移。
张彦峰ZYF1 天前
人工智能·大模型·agent·langgraph·tool calling
LangGraph Tool Calling 入门:从 @tool 到完整调用链目录一、LLM 有大脑,但没有手脚二、为什么需要 Tool Calling?(一)连接「会思考的 LLM」和「能执行的工具」
像风一样自由20201 天前
android·人工智能·语言模型·大模型
量化压缩实战:INT8 / INT4 / AWQ / GPTQ 全面对比《大模型知识与部署》系列 · No.12 / 35 适合人群:AI 工程师、后端开发 阅读时间:约 28 分钟
嘛也学不会1 天前
人工智能·大模型·agent·压缩上下文·compact
Compact时,大模型干了什么?当你在Claude Code中敲下/compact的那一刻,大模型究竟做了什么?为什么压缩后还能"记得"之前的事?