每日一个开源项目(第146篇):openpilot - 开源自动驾驶辅助系统,曾在 Consumer Reports 评测中超过特斯拉 Autopilot

引言

"openpilot 是一个机器人操作系统。目前,它为 325+ 款汽车升级了驾驶辅助系统。"

这是"每日一个开源项目"系列的第146篇文章 。今天的主角是 openpilot------comma.ai 开源的半自动驾驶软件,GitHub 上最受关注的自动驾驶开源项目之一。

2020 年,Consumer Reports 发布了一篇驾驶辅助系统评测。排名第一的不是特斯拉 Autopilot,不是凯迪拉克 Super Cruise,而是运行在一个需要自己插上的第三方硬件设备上的开源软件------openpilot。

2024 年 4 月,一辆 2017 年的普通丰田普锐斯,装上 comma 3X 硬件,以 98.4% 的自动驾驶率完成了美国横穿之旅,耗时 43 小时 18 分钟,比特斯拉 Model S 此前的记录快了将近 12 小时。

这不是一个 demo 项目。它有 62.8k Stars,跑在 10,000+ 用户的真实汽车上,累计行驶里程超过 1 亿英里。

你将学到什么

  • openpilot 的技术架构:为什么选择端到端神经网络而非传统的感知+规划分离
  • panda 安全架构:如何在开源项目里做到 ISO 26262 级别的安全
  • 最新 0.11 的 World Model:在模拟世界里训练真实世界的驾驶策略
  • George Hotz 和 comma.ai 的发展历程
  • openpilot vs 特斯拉 Autopilot 的对比
  • 如何参与贡献(包括 comma.ai 的 bounty 计划)

前置知识

  • 了解自动驾驶辅助系统(ADAS)的基本概念
  • 对神经网络有基本了解
  • 对汽车电子系统(CAN 总线)有基本了解更好,但不是必须

项目背景

项目简介

openpilot 是一个开源的半自动驾驶软件,使用端到端神经网络直接从摄像头图像预测行驶轨迹------不做单独的感知模块和规划模块,而是一个统一的网络从像素到转向角。

它通过 comma four 硬件设备连接汽车的 CAN 总线,接管原厂驾驶辅助系统的功能,提供比原厂更好的车道居中、自适应巡航控制和驾驶员监控。

作者/公司

  • 创始人: George Hotz(geohot)------第一个解锁 iPhone 的黑客、第一个破解 PS3 加密的人
  • 公司: comma.ai(2015 年 9 月创立)
  • 开源时间: 2016 年 11 月 30 日
  • License: MIT

项目数据

  • ⭐ GitHub Stars: 62,800+
  • 🍴 Forks: 11,100+
  • 🚗 支持车型: 325+
  • 📍 累计行驶里程: 1 亿英里以上
  • 👥 活跃用户: 10,000+

核心功能

openpilot 做什么

安装 comma four 设备并连接到支持的汽车后:

自动车道居中(ALC):接管原厂车道保持辅助,用神经网络的方式控制转向,在高速公路上保持在车道中间行驶。

自适应巡航控制(ACC):检测前方车辆,自动控制加速和制动,保持安全跟车距离。整合 OpenStreetMap,在弯道自动减速。

变道辅助:打转向灯后辅助执行变道,包含盲区感知。

驾驶员监控:通过车内摄像头检测驾驶员注意力,约 6 秒分心后发出警报,不再像很多原厂系统那样要求定期转动方向盘。

保留原厂功能:自动紧急制动(AEB)、盲点警告、自动远光灯等安全功能保持原厂不变。

支持的品牌和车型

主要支持:丰田、现代、本田、福特,以及 GM、斯巴鲁、日产等品牌,共 325+ 款具体车型。完整列表见 CARS.md

所需硬件

  • comma four 设备:$999,三摄像头(360° 视角),Qualcomm Snapdragon 845 处理器,4G LTE + WiFi,OLED 显示屏
  • 车辆线束:连接 comma four 和汽车 CAN 总线的专用连接线

技术架构深度解析

端到端神经网络

openpilot 最重要的技术选择是端到端架构:直接从摄像头图像输入,输出转向角、速度等控制指令,中间没有单独的感知层和规划层。

css 复制代码
传统 ADAS 架构:
摄像头 → [感知模块] → [物体检测] → [路径规划] → [控制指令]
每个模块独立设计,误差逐级累积

openpilot 端到端架构:
摄像头 → [统一神经网络] → 控制指令
一个模型,端到端训练,从像素到方向盘

端到端的优势:不需要手工设计特征;能处理模糊的车道线、各国不同的道路标记、各种天气条件,因为模型从真实驾驶数据里学到了这些情况的处理方式。

最新 0.11:World Model 驾驶策略

openpilot 0.11 发布了代号 WMI(🍉)的全新驾驶模型,核心创新是在学习到的模拟世界里训练驾驶策略------这是真实机器人领域里第一次把这个方法实际部署给用户。

两阶段训练

arduino 复制代码
阶段一:训练 World Model
  输入:fleet 收集的无标注驾驶数据(视频)
  训练:2B 参数的扩散 Transformer
  结果:一个能预测"下一帧画面"的世界模拟器
  (相当于让神经网络在脑子里建了一个驾驶世界模型)

阶段二:训练驾驶策略
  环境:在 World Model 里交互(不是在真实世界)
  训练:小型驾驶策略网络与 World Model 交互
  结果:一个在模拟世界里学会了驾驶的策略

World Model 的关键技术参数:

  • ViT 编码器(5000 万参数)+ 解码器(1 亿参数)
  • 扩散 Transformer:20 亿参数,在 250 万分钟视频上训练
  • 推理速度:12.2 帧/秒/GPU

panda:安全架构

openpilot 给汽车发送控制指令,这意味着安全是核心问题。安全关键代码全部在独立的 panda 模块里:

  • 用 C 语言写(Python 更快开发但有 GC 暂停和运行时风险)
  • 遵循 ISO 26262 功能安全标准
  • 安全规则强制执行:转向力矩限制、速度限制、紧急接管逻辑
  • panda 运行在 comma four 硬件里的独立处理器上,与主 openpilot 软件完全隔离

这种设计意味着:即使 openpilot 主软件有 bug 或被攻击,panda 的硬件安全层仍然有效。

测试体系

arduino 复制代码
软件仿真测试(每次提交)
  └── 模拟驾驶场景,回归测试

硬件仿真测试(内部 Jenkins)
  └── 在实际 comma 硬件上运行软件

物理回放测试(持续运行)
  └── "一个测试柜,里面有 10 台 comma 设备
       持续回放真实路线,检测行为变化"

这个测试层次设计是开源汽车软件里相对罕见的完整度。


历史里程碑

时间 事件
2015 年 9 月 George Hotz 创立 comma.ai
2016 年 在 Acura ILX 上展示原型,收到加州 DMV 停止令
2016 年 11 月 开源 openpilot
2020 年 Consumer Reports 评测超过特斯拉 Autopilot,排名第一
2021 年 发布 comma three,价格降至 $2,199
2023 年 发布 comma 3X,价格降至 $1,250
2024 年 4 月 43 小时 18 分钟横穿美国,98.4% 自动驾驶率,破纪录
2025 年 发布 comma four,$999,三摄像头
2026 年 openpilot 0.11,World Model 驾驶策略

Consumer Reports 2020 排名的含义

Consumer Reports 的评测标准:车道居中精度、安全性、易用性、防滥用设计。openpilot 拿到第一不是靠硬件优势,而是靠软件的算法质量------这是一个插上第三方设备、运行开源软件的系统超越了特斯拉、凯迪拉克、福特原厂的驾驶辅助。


项目生态

社区 Fork

GitHub 上有超过 11,000 个 Fork。社区维护了一系列扩展功能的版本:

  • 红绿灯检测
  • 停车场导航
  • pre-Autopilot 特斯拉支持
  • 自定义驾驶行为参数

贡献激励

comma.ai 维护一个 bounty 系统,为添加新车型支持、修复 bug 的外部贡献者提供现金奖励。这是开源汽车软件里不多见的商业激励机制。

tinygrad

comma.ai 同时维护 tinygrad------一个极简主义的深度学习框架,作为 openpilot 的神经网络推理后端。openpilot 的训练和推理代码都在向 tinygrad 迁移。


项目地址与资源


重要声明

MIT 协议附带以下声明:

"本软件是 α 质量的研究用途软件。这不是一个产品。"

openpilot 是辅助驾驶系统,不是完全自动驾驶。使用时驾驶员必须始终保持警觉,随时准备接管控制。


总结

openpilot 是开源世界里少数真正运行在安全关键场景中的大型项目之一。62.8k Stars 背后是 10,000+ 用户的真实行驶里程,不是 Notebook 里的实验数据。

技术路线上,端到端神经网络的选择在 2016 年是激进的,现在正在成为行业主流------特斯拉 FSD 也转向了端到端。openpilot 可以说是这条路线最早的大规模验证之一。

0.11 的 World Model 驱动的训练方法(在学习到的模拟世界里训练策略)代表了一个方向:不依赖手工设计的模拟器,用真实数据训练出的世界模型来生成训练环境。这在学术界讨论已久,openpilot 把它部署到了实际用户的汽车上。

George Hotz 在一个传统上高度封闭、需要十亿美元以上投入才能玩的领域,用开源+商业硬件的路径走出了另一条线。这本身就值得研究。


探索 PrimeSkills ------ 精选 AI Agent 与技能的市场,每一个都经过真实企业工作流验证,去掉浮夸,留下真正有用的。

欢迎访问我的个人主页,发现更多有价值的见解和有趣的产品。

相关推荐
吴佳浩3 小时前
AI 工程师知识地图:模型格式、框架、部署工具一次讲明白
人工智能·aigc·ai编程
IT_陈寒3 小时前
Java的Date类又坑了我一次,改用时间戳真香
前端·人工智能·后端
码农胖大海3 小时前
AI额度不够用的解决方案
人工智能
后端小肥肠4 小时前
小红书虚拟商品怎么做?我先用 Skill 跑通了壁纸品类
人工智能·aigc·agent
feiyu_gao4 小时前
从零搭建个人 AI 工作台:一个管理者的 3 个月实验
人工智能·aigc·团队管理
她的男孩4 小时前
后台接口加密别只会 HTTPS,ForgeAdmin 的 RSA + SM4/AES 源码拆解
后端·面试·开源
程序员cxuan5 小时前
一句话,让你用上 GPT-5.6
人工智能·后端·程序员
机器之心5 小时前
AI圈刚开始谈Loop Engineering,两位95后博士已经盯上了人类闭环数据
人工智能·openai