从机器翻译到智驾:规则派的黄昏与数据革命的终局

2005年,美国国家标准与技术研究院的机器翻译测评现场,空气凝固了。

语言学家们盯着屏幕,满脸错愕。谷歌刚上线的统计翻译系统,把阿拉伯语新闻译成英语时,流畅度竟然超过了他们守了三十年的SysTran规则系统。有个研究人员当场拍了桌子:"这根本不是翻译,是拿语料堆出来的巧合!"

可后来的十年里,这个"巧合"把所有手写规则的系统扫进了历史垃圾堆。

这一幕,正在自动驾驶领域重演。


一、规则派是怎么输掉翻译战争的?

让我们把时间拨回到规则派的鼎盛时期。

SysTran的语言学家们手写了十几万条语法规则,连"一石二鸟"这种习语都要单独标注------不能逐字翻译,必须特殊处理。他们以为,只要规则足够多,机器就能理解人类语言。

结果呢?

2000年,有个用户把中文"心有余而力不足"输进去,系统硬译成了:"心脏有剩余力量,但肌肉不够。"

全场笑翻。

更经典的案例还在后面。那句中文谚语"酒是好的,肉变质了"------原文想说的是"心有余而力不足",规则派系统却逐字处理,翻出了这句驴唇不对马嘴的"杰作"。

问题出在哪?规则根本覆盖不了自然语言的模糊性和例外。

你写一万条规则,总会有第一万零一个例外。你标注了"一石二鸟",下个月就会遇到"一箭双雕"。语言是活的,规则是死的,死的东西装不下活的世界。

谷歌当时走了一步险棋。

他们扔掉所有手写规则,拿加拿大议会二十年的双语会议记录当教材。统计模型不理解什么是虚拟语气,也不知道成语的典故,它只是做一件事:数哪个英文词经常和哪个中文词成对出现,哪个短语的语序调整概率最高。

2005年的测评里,统计翻译把"和平共处五项原则"译成了"Five Principles of Peaceful Coexistence"。

而SysTran抠着词典翻出来的是:"Five Rules for Living Together Peacefully"。

前者准确、规范、一眼就能看懂。后者......"一起生活的五条规则"?这翻的是居委会告示吗?

语言学家骂统计翻译是"概率拼凑",是"没有灵魂的翻译"。可用户不管这些。能看懂的翻译就是好翻译。谷歌翻译的用户量在几年内翻了上百倍,SysTran则在2016年彻底停止了规则库更新。

规则派的黄昏,不是因为规则错了,而是因为人类终于承认:我们制定的规则,装不下世界的复杂。


二、智驾战场:同样的剧本,不同的演员

现在,这场战争正在自动驾驶领域重演。

国内智驾厂商至今没看懂的是,特斯拉FSD从来不是靠堆硬件或画地图取胜的。它走的是AlphaGo Zero的路:先学习人类驾驶数据,跨过临界点后就扔掉拐杖,在虚拟世界里亿万次模拟极端场景,进化出人类想都想不到的行驶逻辑。

而不少ADS方案,还在抱着高精地图和人工规则不放。

你以为把全国300个城市的道路数据扫进系统就是"全场景覆盖"?这种换个国家、换个星球就失效的能力,从根上就是死路一条。

就像我们之前聊的:就算你跑遍地球所有城市,到了月球没有提前画好的地图,你连动都动不了。而FSD改改参数就能适应火星的陨石坑------这种通用智能的降维打击,根本不是堆地图能抗衡的。

更具体地说,规则派智驾的困境和翻译规则派一模一样:

你写死一条"礼让行人"的规则,遇到闯红灯的电动车就会瞬间失效。你标注了所有"红绿灯识别"的逻辑,遇到临时施工的移动信号灯就傻眼了。你给全国300个城市画了高精地图,遇到城中村那条地图上不存在的小巷子就直接趴窝。

FSD怎么做?它不写这些规则。

它把几百万英里的真实路况喂给模型,让它自己学会识别:鬼探头的前兆是什么样的?大货车的视觉盲区在哪里?雨天路面的隐形冰面怎么判断?城中村乱穿的行人有什么行为模式?

这些场景,规则派工程师写到死也写不完。但数据驱动的模型,在虚拟世界里跑亿万次迭代后,自己就学会了。

就像AlphaGo一开始学人类棋谱,后来自己跟自己下,下出了人类从没见过的棋路。FSD在虚拟世界里跑出来的驾驶逻辑,早就超出了交规手册的范畴。


三、骑虎难下的规则派

厂商不是不知道这条路错了。

问题是,骑虎难下了。

前期砸几百亿建地图团队、养规则工程师,沉没成本把自己捆死在旧轨道上。就像当年的柯达,明明握着数码相机的转型钥匙,却不敢拧门------因为怕砸了胶卷的饭碗。

现在的智驾厂商也一样:怕停掉高精地图就亏掉前期投入,怕放弃规则系统就无法通过监管审核,怕转向数据驱动就把自己最擅长的领域拱手让人。

连比亚迪发智驾大会,都要靠"一年兜底政策"来壮胆。

可兜底能兜住什么?城中村的乱穿行人,早高峰的加塞车流,施工路段的混乱路况------这些极端场景恰恰是FSD在虚拟世界练了千万次的基本功,却是规则派工程师连夜加班也补不完的漏洞。

更讽刺的是厂商对FSD的诋毁。

骂得越凶,越说明心里慌。

就像当年聂卫平骂AlphaGo"骗钱",输了才承认AI重新定义了围棋;现在骂FSD"不适应中国路况"的人,等亲眼看到它在凯旋门环岛、澳大利亚钩形转弯里跑顺了,就会知道自己守的"中国特供规则"有多可笑。

韩国棋手申真谞靠AI训练,赢了中国棋手十几连胜。我们还在用人教人的老办法。智驾领域也是一样,人家跟着AI进化,我们守着旧规则,迟早被拉开再也追不上的差距。


四、跳出规则陷阱的AI,正在所有领域证明自己

这不仅仅是翻译和智驾的故事。

Anthropic的AI,几小时就挖出了人类27年没找到的系统漏洞。

谷歌的AI,破解了数学家卡了几十年的难题。

DeepMind的AlphaFold,解决了生物学五十年未解的蛋白质折叠问题。

它们做对了同一件事:跳出人类思维的规则陷阱。

规则是什么?是人类为了简化世界而制定的拐杖。因为人脑处理不了那么多维度的信息,所以我们发明了规则来降低认知负担。

但AI不需要拐杖。

它能同时处理上百万个维度的信息,能看见人类看不见的模式,能想到人类想不出的解法。给它数据和算力,它能直接摸到世界的本质规律。

那些还在给智驾系统补规则的团队,就像当年给SysTran加习语词条的语言学家------加得越快,离真正的智能就越远。


五、临界点之后,连当对手的资格都没有

技术史上,这种反转从来不是第一次。

手动挡当年喊着"有驾驶感""真正的驾驶乐趣",现在销量占比不到3%。

新能源车被骂"不安全""续航焦虑""充电不便",现在国内占比快到60%,燃油车血崩清仓。

智驾的结局只会更彻底。

因为FSD一旦跨过自主进化的临界点,人类司机的操作习惯在它眼里就是低效错误。就像AlphaGo Zero不用任何人类棋谱,自己跟自己下三天,就能赢过学习人类棋谱的初代AlphaGo。

到那时候,不是AI辅助人开车,是AI带着人重新理解什么叫安全驾驶。

规则派连碰瓷的资格都没有。

2016年谷歌神经翻译系统上线那天,SysTran彻底停止了规则库更新。那些坚守了三十年的语言学家,连一声告别都没来得及说。

现在智驾的规则派还在挣扎,说没有人类把关的AI会闯祸。可他们忘了,当年也有人说没有语言学家把关的机器翻译会毁灭跨文化交流。

结果是,今天全世界几十亿人每天都在用谷歌翻译、DeepL、ChatGPT,没有人再提SysTran。

等FSD的事故率降到人类司机的百分之一,那些抠着交规指责它"不按规则开车"的人,就会被时代甩在身后。


写在最后

规则派的黄昏,不是因为规则错了。

规则在特定时期是有效的。没有规则,早期的机器翻译寸步难行;没有高精地图,早期的自动驾驶无从谈起。

问题是,技术的迭代不会停在"够用"的地方。

数据驱动的革命,早就在翻译领域证明了:扔掉拐杖,才能学会走路。它又在安全领域、数学领域、生物学领域证明了自己。

现在,轮到自动驾驶交出答卷了。

那些还在抱着规则不放的人,不妨问问自己:你是想当SysTran,还是想当谷歌翻译?

历史的答案,从来都很清楚。