自动驾驶强化学习的价值对齐:奖励函数设计的艺术与科学人工智能·机器学习·自动驾驶·自动驾驶奖励函数·奖励函数黑客防范·智能驾驶价值对齐
【论文速递】2025年第30周(Jul-20-26)(Robotics/Embodied AI/LLM)人工智能·深度学习·ai·机器人·论文·robotics·具身智能
大模型-高效优化技术全景解析:微调 量化 剪枝 梯度裁剪与蒸馏 下人工智能·python·深度学习·神经网络·知识图谱
MovieNet(A holistic dataset for movie understanding) :面向电影理解的多模态综合数据集与工具链数据仓库·人工智能·目标检测·计算机视觉·数据挖掘