端到端

韩曙亮5 天前
人工智能·自动驾驶·e2e·autoware·端到端·基于规则技术架构·端到端技术架构
【自动驾驶】Autoware 架构 ① ( 自动驾驶的两种核心技术架构 | 基于规则技术架构 | 端到端技术架构 )自动驾驶的两种核心技术架构 :端到端技术架构 , 一端是 " 传感器原始数据 " , 另一端是 " 车辆控制指令 " ;
沛沛老爹5 天前
工作流·rag·端到端·lightrag·知识注入·查询响应
LightRAG 系列 7:核心技术解析——整合检索与生成模块,完整走通 LightRAG 的端到端工作流图片来源网络,侵权联系删。LightRAG系列文章 ● LightRAG系列1:为什么 Web 开发者需要关注 RAG?
小猫挖掘机(绝版)10 天前
linux·ubuntu·自动驾驶·无人机·端到端
在Ubuntu 20.04 部署DiffPhysDrone并在Airsim仿真完整流程DiffPhyDrone是上海交大实验室发布在2025年Nature子刊上的端到端自主导航方案。使用12×16超低分辨率深度图作为输入,使用仅3层CNN的超小神经网络实现端到端自主飞行,可部署于150元廉价嵌入式计算平台。目前已开源,可在本地部署。下面我将介绍本地部署的流程,注意下面的内容是CUDA 12.8和CUDA 11.8混杂介绍的,请你根据你的显卡版本,选择调整相应指令,安装一种CUDA版本即可,建议50系列选择12.8,其余选择11.8。
阿提说说11 天前
端到端·gtp-omni
mini-omni demo测试部署服务端启动碰到的问题修改litgpt/config.py修改inference.py客户端启动碰到的问题
m0_6501082415 天前
人工智能·自动驾驶·端到端·实时性·动量感知机制·闭环性能·长时域预测
Don’t Shake the Wheel: 端到端自动驾驶中的动量感知规划(MomAD)在端到端自动驾驶领域,多模态规划易受单帧感知局限,存在时间不一致、遮挡敏感等问题。北京交通大学与地平线机器人等团队提出 MomAD 框架,引入轨迹与感知动量,通过 TTM 模块(豪斯多夫距离选轨迹)、MPI 模块(融合历史查询)及鲁棒去噪,结合 Turning-nuScenes 数据集与 TPC 指标,显著提升规划稳定性,降低碰撞率。
nju_spy1 个月前
人工智能·深度学习·动态规划·端到端·库存管理·两阶段pto·多周期补货问题
论文阅读 - 深度学习端到端解决库存管理问题 - 有限时间范围内的多周期补货问题(Management Science)https://pubsonline.informs.org/doi/10.1287/mnsc.2022.4564
xwz小王子2 个月前
机器人·端到端
ImaginationPolicy:迈向通用、精确、可靠的机器人操作端到端策略一、核心背景与问题提出机器人端到端操作策略为实体智能体理解和交互世界提供了巨大潜力。与传统模块化流水线不同,端到端学习能缓解模块间信息损失、孤立优化目标导致的特征错位等关键局限,但现有端到端神经网络(包括基于大视觉-语言-动作(VLA)模型的方法),在大规模实际部署中性能仍显不足——尤其是在可靠性、精度上,甚至逊色于工程化成熟的传统模块化流水线,且在面对未见过的物体或不同机器人平台时,泛化能力短板更突出。为填补“泛化潜力”与“实际性能需求”的差距,本研究提出一种以“可用性(affordance)”为核心的
oscar9994 个月前
e2e·端到端
端到端测试:复杂系统的终极体检术当你的应用像多米诺骨牌一样牵一发而动全身,如何确保用户一路畅通无阻?想象一下:你精心开发的电商应用,用户登录顺利,商品浏览流畅,却在最后支付时卡壳——原因是支付网关接口悄悄变了。在现代分布式系统和复杂架构的背景下,一个环节的故障足以让整个业务流程瘫痪。
木亦汐丫7 个月前
语音识别·asr·端到端·流式·nar非自回归·分块注意力·mask-ctc
【ASR】基于分块非自回归模型的流式端到端语音识别论文地址:https://arxiv.org/abs/2107.09428非自回归 (NAR) 模型在语音处理中越来越受到关注。 凭借最新的基于注意力的自动语音识别 (ASR) 结构,与自回归 (AR) 模型相比,NAR 可以在仅精度略有下降的情况下实现有前景的实时因子 (RTF) 提升。 然而,识别推理需要等待完整语音话语的完成,这限制了其在低延迟场景中的应用。 为了解决这个问题,我们提出了一种新颖的端到端流式 NAR 语音识别系统,该系统结合了分块注意力和带有掩码预测 (Mask-CTC) NAR 的
一点.点8 个月前
论文阅读·大模型·自动驾驶·端到端
Sce2DriveX: 用于场景-到-驾驶学习的通用 MLLM 框架——论文阅读《Sce2DriveX: A Generalized MLLM Framework for Scene-to-Drive Learning》2025年2月发表,来自中科院软件所和中科院大学的论文。
一点.点8 个月前
论文阅读·大模型·自动驾驶·端到端
VLM-E2E:通过多模态驾驶员注意融合增强端到端自动驾驶——论文阅读《VLM-E2E Enhancing End-to-End Autonomous Driving with Multimodal Driver Attention Fusion》2025年2月发表,来自香港科大广州分校、理想汽车和厦门大学的论文。
shichaog8 个月前
spark·语音合成·tts·端到端
语音合成之一TTS技术发展史综述文本转语音(Text-to-Speech,TTS)技术是一种将书面文本自动转换为人类语音的技术。它是一门交叉学科,融合了语言学、声学、计算机科学和电子工程等多个领域的知识。TTS技术通过计算机合成逼真的语音,使得用户能够通过听觉获取信息,极大地扩展了人机交互的方式。从早期的机械发声装置到如今高度智能化的语音合成系统,TTS技术已经渗透到我们日常生活的方方面面,例如智能语音助手(亚马逊Alexa、豆包、苹果Siri等)、屏幕阅读器(为视力障碍人士和阅读障碍者)、教育软件、媒体与娱乐(播客、有声读物、视频/游
星落秋风五丈原9 个月前
人工智能·自动驾驶·汽车·端到端·vla
Nvidia GTC AI 会议:理想汽车【VLA:迈向自动驾驶物理智能体的关键一步】Nvidia GTC AI 会议上,理想汽车介绍了内部VLA相关算法,理想在智驾新技术上的新技术探索其实比较领先,以下整理了这次介绍的相关技术点
不知道是谁210 个月前
人工智能·机器学习·自动驾驶·端到端
问deepseek自动驾驶 模块化or端到端?(总结的时候,要强调不是非此即彼,而是互补和融合的可能性,这样用户能有一个更全面的理解,不会被二元对立误导。)
、达西先生10 个月前
强化学习·端到端·rl
强化学习笔记6——异同策略、AC、等其他模型总结举例QLearning为什么是异策略? 生成动作时e的概率从Q表选,1-e概况随机。 更新策略时,贪心策略选择Q_max作为动作。
、达西先生1 年前
深度学习·学习·自动驾驶·端到端·云平台训练
Uniad复现学习在优云智算compshare平台部署训练,加速训练。关于UCloud(优刻得)旗下的compshare算力共享平台 UCloud(优刻得)是中国知名的中立云计算服务商,科创板上市,中国云计算第一股。 UCloud(优刻得)旗下的Compshare算力共享平台具有以下优点:
开MINI的工科男1 年前
人工智能·自动驾驶·端到端·预测与决策·多模态预测
【笔记】自动驾驶预测与决策规划_Part7_数据驱动的预测方法本文主要记录课程《自动驾驶预测与决策技术》的学习过程,难免会有很多纰漏,感谢指正。 课程链接:https://www.shenlanxueyuan.com/my/course/700 相关笔记链接: Part1_自动驾驶决策规划简介 Part2_基于模型的预测方法 Part3_路径与轨迹规划 Part4_时空联合规划 Part5_决策过程 Part6_不确定性感知的决策过程
深蓝学院1 年前
机器学习·自动驾驶·端到端
自动驾驶的“三维进化” :跨越平面的OmniDrive如何在3D空间实现端到端的决策规划?本篇文章由原paper一作Shihao Wang(王仕豪)全权翻译分享,王仕豪为北京理工大学硕士毕业生,主要从事计算机视觉和自动驾驶相关工作。他提出了StreamPETR,Far3D和OmniDrive等方法,并在nuScenes的检测和跟踪榜单上多次获得第一名。
大鹅同志1 年前
人工智能·机器学习·自动驾驶·综述·端到端
端到端自动驾驶系列(一):自动驾驶综述解析End-to-end-Autonomous-DrivingAbstract—The autonomous driving community has witnessed a rapid growth in approaches that embrace an end-to-end algorithm framework, utilizing raw sensor input to generate vehicle motion plans, instead of concentrating on indi
一颗小树x2 年前
端到端·6d位姿估计·gdr-net·几何引导·直接回归
【6D位姿估计】GDR-Net 单目几何引导的直接回归模型本文介绍6D位姿估计的直接回归方法GDR-Net,它从单个RGB图像中确定物体在三维空间中的位置和方向。