人工智能

鲨莎分不晴几秒前
人工智能·深度学习·学习
独立学习 (IQL):大道至简还是掩耳盗铃摘要: 当我们需要控制多个智能体时,最直观的想法是什么?——“既然我会训练一个 DQN,那我有 10 个智能体,就训练 10 个 DQN 好了。” 这就是 独立学习 (Independent Learning) 的核心思想。它简单粗暴,完全忽略队友的存在,把其他智能体视为环境的一部分。本文将深入探讨 IQL 的工作原理,剖析其致命弱点环境非平稳性 (Non-Stationarity),并解释为什么在 QMIX 等高级算法横行的今天,IQL 依然是一个强劲的对手。
audyxiao0011 分钟前
人工智能·机器学习·自动驾驶·大语言模型·多模态·gemini
如何用Gemini“上车”自动驾驶?通过视觉问答完成自动驾驶任务本推文介绍了一篇来自Waymo(谷歌旗下自动驾驶公司)的自动驾驶前沿研究论文《EMMA: End-to-End Multimodal Model for Autonomous Driving》。该论文发表于《Transactions on Machine Learning Research》,简称为TMLR。该期刊是机器学习顶刊《Journal of Machine Learning Research》的兄弟期刊。该研究针对传统模块化架构的接口僵化以及传统端到端模型的泛化能力不足问题,提出了一种基于多模态
free-elcmacom2 分钟前
人工智能·python·深度学习·音视频
深度学习<2>从“看单帧”到“懂故事”:视频模型的帧链推理,藏着机器读懂时间的秘密先问大家一个直观的问题:当你刷到一条“猫咪跳上沙发”的短视频时,你是怎么判断“这是一个连贯动作”,而不是“一堆猫咪在不同位置的照片拼接”的?答案很简单——你自动把前后画面的关系串起来了。而机器要做到这一点,靠的就是咱们今天的主角:帧链推理。
wxdlfkj3 分钟前
人工智能·算法·机器学习
从算法溯源到硬件极限:解决微小球面小角度拟合与中心定位的技术路径在现代高精密制造,尤其是光电子装配与精密半导体检测中,对于曲率半径较小(小半径)且物理通光孔径有限的球面元件(Small Segment Angle Surfaces)的几何量测与定心定焦,始终是一个工艺难点。小角度球面拟合固有的数值不稳定性,使得微米级的数据噪声在进行最小二乘法(LMS)计算时会被非线性放大,导致拟合出的曲率中心(Zone Center)显著偏移。本文将基于最新的误差传递理论研究,剖深其数学机理,并论证在高阶滤波算法之外,如何通过具备亚微米级精度的硬件——特别是泓川科技(HC)LTC系列
高洁014 分钟前
人工智能·python·算法·机器学习·django
基于Tensorflow库的RNN模型预测实战基于Tensorflow库的RNN模型预测实战 Tensorflow库简介 循环神经网络简介#人工智能#具身智能#VLA#大模型#AI#LLM#Transformer 架构#AI技术前沿#Agent大模型
鲨莎分不晴8 分钟前
人工智能·学习
从 10 到 1000:大规模多智能体的可扩展性 (Mean Field & GNN)摘要: 在多智能体强化学习(MARL)中,随着智能体数量 NNN 的增加,状态空间和联合动作空间呈指数级爆炸。当 NNN 达到成百上千时,传统的中心化方法(如 QMIX)会因输入维度过大而失效,独立学习(IQL)则会因环境极度非平稳而崩溃。如何训练大规模集群?本文将介绍两大核心武器:平均场强化学习 (MFRL)——利用物理学思想将 NNN 个对手简化为一个“平均作用”;以及 基于图的 RL (Graph-based RL)——利用 GNN 捕捉局部拓扑结构,实现对邻居的高效建模。
may_一一9 分钟前
人工智能·opencv·计算机视觉
cv(opencv-python)手动安装下载地址https://pypi.tuna.tsinghua.edu.cn/simple/opencv-python/
安徽正LU o561-6o623o711 分钟前
人工智能
露-鼠兔解剖台 鼠兔二用解剖台 无干扰恒温加热鼠台 无干扰恒温加热兔台镶嵌式组装结构,可实现各组件的稳固衔接,保障实验过程中的结构稳定性;温度调控系统支持精准参数设置,能有效规避实验动物烫伤风险。操作台配置扣式捆绑组件,搭配可调节式头部固定装置,既能够对兔头进行稳定限位,又可维持颈部血管的适度舒张状态。安徽,正华生物,露
工藤学编程11 分钟前
人工智能
零基础学AI大模型之RunnableBranch1、零基础学AI大模型之读懂AI大模型 2、零基础学AI大模型之从0到1调用大模型API 3、零基础学AI大模型之SpringAI 4、零基础学AI大模型之AI大模型常见概念 5、零基础学AI大模型之大模型私有化部署全指南 6、零基础学AI大模型之AI大模型可视化界面 7、零基础学AI大模型之LangChain 8、零基础学AI大模型之LangChain六大核心模块与大模型IO交互链路 9、零基础学AI大模型之Prompt提示词工程 10、零基础学AI大模型之LangChain-PromptTemplat
全栈小513 分钟前
人工智能·tbox·智能体协同·百宝箱
【AI应用】Tbox神仙用法,一句话描述创作效果还不错的应用,随机菜单生成开发,一起来看看是如何通过多智能体协同开发百宝箱平台是一款可以提供一站式 AI 原生应用的开发平台,您无需具有任何代码基础,只需通过自然语言即可三步完成应用的创建与发布。百宝箱平台不仅可以帮助您轻松创建各类智能体,一键发布到支付宝小程序,释放无限可能,来开启您的 AI 应用创作之旅吧!
字节数据平台14 分钟前
人工智能
火山引擎发布“企业认知引擎”,驱动企业从“数据驱动”迈向“认知驱动”12月18日,2025火山引擎Force原动力大会·冬在上海举办,在当天下午的Data +AI论坛上,火山引擎数智平台提出企业数智化从“数据驱动”迈向“认知驱动”新阶段,并推出了通过多模态数据湖、数据智能体服务和高质量数据集在内的打造“企业认知引擎”的「Data +AI」方案服务。
Java后端的Ai之路14 分钟前
人工智能·机器学习·oof预测
【分析式AI】-OOF预测学习指南📚 专业术语定义 💬 大白话拆解 🌰 生活案例类比OOF预测(Out-of-Fold Prediction,直译“折叠外预测”)是机器学习集成学习(Ensemble Learning)和交叉验证(Cross Validation)场景下的核心技术,特指在K折交叉验证(K-Fold Cross Validation)过程中生成的预测结果。
roman_日积跬步-终至千里15 分钟前
人工智能·学习·transformer
【人工智能导论】09-学习-注意力机制与Transformer:用注意力机制动态关注,用Transformer并行计算,用GPT理解生成语言⏱️ 预计阅读时间:40-50分钟 🎯 学习目标:学会怎么让模型动态关注输入并理解生成语言,怎么用注意力机制动态关注输入,怎么用Transformer并行计算,怎么用GPT理解和生成语言
大、男人15 分钟前
人工智能·python·mcp·fastmcp
FastMCP高级特性之Message Handling前面讲到,服务端可以发送消息。对于发送的消息,可以使用自定义消息处理器处理 MCP 消息、请求和通知。
b***251116 分钟前
大数据·人工智能
汽车圆柱电池气动点焊机:串并联组合自动化焊接的核心驱动力在新能源汽车产业高速发展的背景下,汽车圆柱电池作为核心动力源,其制造工艺的精密性与可靠性直接决定了整车的性能与安全性。其中,气动点焊机作为电池模组串并联组合的关键设备,通过自动化焊接技术实现了生产效率与产品质量的双重突破,成为推动行业技术升级的核心力量。
kkk1234416 分钟前
人工智能·深度学习·机器学习
2025 大模型的发展从Karpathy的视角来看经典的模型获取范式(对数据和算力的强依赖,典型地通过预训练-- 监督微调-- RLHF三个步骤, 2020-2025年初)–>由于数据无法达到像算力的增长水平,所以寻找新的模型能力提升变得尤为关键
骚戴16 分钟前
人工智能·语言模型·自然语言处理·大模型·llm·api
在科研与项目开发中:如何高效调用大语言模型(LLM)API2023年被誉为生成式AI的元年,而2024年则是大模型应用落地的爆发期。无论是学术界的科研工作者,还是工业界的项目开发者,大家的起跑线似乎都是一样的:一行简单的 import openai,接着是 client.chat.completions.create(...),短短几行代码,从屏幕上跃出的文字仿佛魔法一般,宣告着智能时代的到来。
czijin17 分钟前
论文阅读·人工智能·语言模型
【论文阅读】LoRA: Low-Rank Adaptation of Large Language Models该论文来自微软团队,LoRA微调现已成为大模型常用的高效微调方法之一。预训练-微调范式是当前使用最广的范式,能够提升模型在下游任务上的表现。但是当模型参数规模变大,全量微调需要消耗大量资源和时间,就变得不太可行。因此出现了许多高效微调(peft, parameter efficient fine-tuning)的方法,例如谷歌团队提出的Adapter Tuning、斯坦福团队提出的Prefix-Tuning、清华团队提出的P-Tuning v2等。但他们各自都有一些缺点:
oliveray18 分钟前
人工智能·目标检测·语义分割·openvino
基于 OpenVINO 优化的 GroundingDINO + EfficientSAM 视频分割追踪本文介绍了一个文本驱动的视频目标分割与追踪系统,通过自然语言描述即可在视频中定位、分割和追踪任意目标。系统结合了 GroundingDINO(开放词汇目标检测)、EfficientSAM(高效分割)和光流追踪技术,并使用 OpenVINO + NNCF 进行推理加速,最终实现了 8.4 倍的性能提升(从 0.34 FPS 提升到 2.84 FPS)
说私域22 分钟前
人工智能·小程序
链动2+1模式、AI智能名片与S2B2C商城小程序在直播营销中的规范化应用研究摘要:本文聚焦直播营销领域,探讨链动2+1模式、AI智能名片与S2B2C商城小程序在其中的规范化应用。通过对IMBT理论框架(创意和IP、媒介、福利、技术)的延伸,分析这些创新元素如何助力直播营销实现创意设计、媒介整合、福利激励与技术赋能的协同发展,为企业提供一套系统、规范的直播营销策略。 关键词:直播营销;链动2+1模式;AI智能名片;S2B2C商城小程序;IMBT理论