人工智能

Panesle几秒前
人工智能·算法·音视频·文生视频
HunyuanCustom:文生视频框架论文速读本文提出了 HunyuanCustom,这是一个基于多模态驱动的定制化视频生成框架。该框架旨在解决现有视频生成模型在身份一致性(identity consistency)和输入模态多样性方面的不足。HunyuanCustom 支持图像、音频、视频和文本等多种条件输入,能够生成具有特定主题身份的视频,广泛应用于虚拟人广告、虚拟试穿、唱歌头像和视频编辑等领域。
强化学习与机器人控制仿真3 分钟前
开发语言·人工智能·python·stm32·深度学习·机器人·自动驾驶
Newton GPU 机器人仿真器入门教程(零)— NVIDIA、DeepMind、Disney 联合推出目录系列文章目录前言一、快速入门1.1 实时渲染1.2 USD 渲染1.3 示例:创建一个粒子链二、重要概念
买了一束花18 分钟前
人工智能·算法·matlab
MATLAB导出和导入Excel文件表格数据并处理我们以高斯函数为例子,高斯函数在数学和工程领域有着广泛的应用,它的一般形式为:其中是均值,决定了函数的中心位置; 是标准差,决定了函数的宽度。
老任与码25 分钟前
java·人工智能·spring ai
Spring AI(3)——Chat Memory大型语言模型(LLM)是无状态的,这意味着它们不保留关于以前互动的信息。为了解决这个问题,Spring AI提供了Chat Memory(聊天记忆)功能。通过Chat Memory,用户可以实现在与LLM的多次交互中存储和检索信息。
银河以北呀1 小时前
人工智能·语言模型·论文笔记
通过推测搜索加速大型语言模型推理 (SpecSearch) 论文总结基于树搜索的推理方法(如思维树Tree-of-Thoughts)通过探索多个中间推理步骤,显著增强了大型语言模型(LLMs)的推理能力。然而,这些方法需要生成大量推理思考,导致推理延迟增加了几个数量级,严重限制了LLM在实时应用中的适用性。这种延迟主要源于思考生成环节,占据了超过91%的总推理时间,构成了效率的主要瓶颈。面对这些挑战,研究者们致力于开发一种能够在保持推理质量的同时显著加速基于树搜索的LLM推理过程的新框架。
妄想成为master1 小时前
人工智能·深度学习·神经网络
快速入门深度学习系列(2)----损失函数、逻辑回归、向量化针对深度学习入门新手目标不明确 知识体系杂乱的问题 拟开启快速入门深度学习系列文章的创作旨在帮助大家快速的入门深度学习
武乐乐~1 小时前
人工智能·yolo·目标检测
YOLO-World:基于YOLOv8的开放词汇目标检测本文介绍一篇来自腾讯的开放词汇检测工作,发表自CVPR2024,论文链接,开源地址。GroundingDINO在开放词汇检测任务中大放异彩,因此本文希望在轻量化的YOLOv8上也搞一个轻量化的开放词汇检测算法。最终效果吧,是模型又快而且精度基本持平。
打小就很皮...2 小时前
人工智能·语音识别
使用 React 实现语音识别并转换功能在现代 Web 开发中,语音识别技术的应用越来越广泛。它为用户提供了更加便捷、自然的交互方式,例如语音输入、语音指令等。本文将介绍如何使用 React 实现一个简单的语音识别并转换的功能。
老朋友此林2 小时前
人工智能·python·nlp
MiniMind:3块钱成本 + 2小时!训练自己的0.02B的大模型。minimind源码解读、MOE架构大家好,我是此林。目录1. 前言2. minimind模型源码解读1. MiniMind Config部分
LitchiCheng2 小时前
人工智能·机器学习·机器人
复刻低成本机械臂 SO-ARM100 单关节控制(附代码)视频讲解:复刻低成本机械臂 SO-ARM100 单关节控制(附代码)代码仓库:GitHub - LitchiCheng/SO-ARM100: Some Test code on SO-ARM100
微学AI2 小时前
人工智能·架构·机器人·a2a
大模型的应用中A2A(Agent2Agent)架构的部署过程,A2A架构实现不同机器人之间的高效通信与协作大家好,我是微学AI,今天给大家介绍一下大模型的应用中A2A(Agent2Agent)架构的部署过程,A2A架构实现不同机器人之间的高效通信与协作。
AI视觉网奇2 小时前
人工智能
MoE 学习笔记MoE 是一种将多个子模型(专家)结合的技术,用于提升大语言模型Q(LLMs)性能。它主要由稀疏 MOE 层和门控网络(路由)组成。稀疏 MOE 层替代传统 Transformer 中的前馈神经网络(FFN)层,包含多个独立的专家网络,每个专家都是一个 FFN。门控网络负责决定输入的 token 被发送到哪个或哪些专家进行处理,其决策过程基于学习的参数,并与网络其他部分一起进行预训练。
多巴胺与内啡肽.3 小时前
人工智能·opencv·计算机视觉
Opencv进阶操作:图像拼接在数字图像处理领域,图像拼接(Image Stitching)是一项将多张重叠图像无缝合成广角视图的关键技术。这项技术被广泛应用于全景照片生成、卫星地图制作、医学影像分析等领域。本文将使用OpenCV库,结合Python示例代码,深入解析图像拼接的核心实现流程。
小草cys4 小时前
人工智能·深度学习·yolo
查看YOLO版本的三种方法查看YOLO版本的三种方法:一、通过命令行直接查询 使用Python交互式查询:二、检查PyTorch环境兼容性
白熊1884 小时前
人工智能·opencv·计算机视觉
【计算机视觉】OpenCV实战项目:ETcTI_smart_parking智能停车系统深度解析ETcTI_smart_parking是一个基于ETC(电子不停车收费)与车牌识别技术的智能停车管理系统,旨在通过物联网、计算机视觉和分布式架构实现停车场的全流程无人化运营。项目整合了ETC自动扣费、车牌实时识别、车位动态分配和远程运维监控等核心功能,其技术特点包括:
消失在人海中5 小时前
数据库·人工智能·数据分析
数据分析基础:需要掌握的入门知识数据分析基础:你需要掌握的入门知识数据分析是一项令人着迷的技能,它不仅仅关乎处理数字,更是将复杂的数据转化为有意义的洞察,推动决策并创造价值。作为一名数据分析的从业者,我常常被问及如何入门这个领域,特别是对于那些刚开始接触数据分析的人来说,掌握哪些基础知识是关键。这篇文章将结合我的经验和个人见解,为你详细解析数据分析入门所需的核心知识。
西红柿土豆丶5 小时前
人工智能·python·深度学习·flask·bootstrap
基于Flask、Bootstrap及深度学习的水库智能监测分析平台本项目是基于Flask框架构建的水库智能监测分析平台,集水库数据管理、实时监测预警、可视化分析和智能预测功能于一体。 预测水位的预警级别:蓝色预警没有超过正常水位且接近正常水位1米内、橙色预警超过正常水位1米以内、红色预警超过1米以上。
zylyyyyyy5 小时前
人工智能·深度学习·信息与通信·polar码·译码
DEEPPOLAR:通过深度学习发明非线性大核极坐标码(2)目录2.问题的提出和背景2.1 信道编码2.2.极化码极坐标编码极坐标解码大内核Polar代码原文:《DEEPPOLAR: Inventing Nonlinear Large-Kernel Polar Codes via Deep Learning》
phoenix@Capricornus5 小时前
人工智能·深度学习·matlab
MATLAB Deep Learning ToolboxDeep Learning Toolbox Version 23.2 (R2023b) 01-Aug-2023
国货崛起5 小时前
人工智能·机器学习·自动驾驶
刘强东杀入自动驾驶!京东注册“Joyrobotaxi”商标又一个互联网大佬杀入汽车赛道!这一次,是京东的刘强东。5月6日,京东集团旗下公司一口气申请注册了多个名为"Joyrobotaxi"的商标,国际分类涵盖运输工具、科学仪器等核心领域。这一动作被业界普遍解读为:京东要正式布局自动驾驶出租车了!