码农的AI翻身之旅(一)
你好,我叫Token------AI世界里最忙的搬砖工

大家好。
我叫 Token。
别看我名字洋气,其实我就是个打零工的。
AI世界里,所有人都认识ChatGPT,认识DeepSeek,认识Claude,认识Gemini......
可是,没有几个人认识我。
然而,没有我,他们一句话都说不出来。
我的出生
某一天。
一个程序员打开了ChatGPT。
他说:
帮我写一个Spring Boot项目。
于是,我出生了。
准确来说,不是我一个。
而是一大群兄弟。
因为AI眼里,根本没有一句话。
它看到的是:
帮
我
写
一个
Spring
Boot
项目
甚至更细。
像:
Spr
ing
Boot
都会被拆开。
有时候,一个英文单词。
有时候,一个汉字。
有时候,甚至只是半个单词。
这,就是Token。
AI不会看文字。
它只认识我们。
我的工作
每天。
全球几百亿个Token在工作。
一个Prompt。
可能有几十个Token。
一篇文章。
几千个Token。
一本小说。
几十万个Token。
程序员经常问:
"为什么GPT收费越来越贵?"
其实。
不是按字收费。
而是按我们收费。
因为每来一个Token。
AI都得思考一次。
我们越多。
老板GPU就越累。
老板的钱包就越疼。
我的老板
我们的老板叫Transformer。
他管理着几百亿个参数。
每天。
我们排着队。
一个一个进去。
没有插队。
没有VIP。
没有绿色通道。
每个人都会经历同样的一套流程。
先编码。
再计算。
最后交给下一层。
老板有几十层。
有的大老板。
甚至有上百层。
于是。
我每天上下班。
要跑几十层楼。
累得不行。
我的身份证
老板最怕什么?
最怕不知道谁在前面。
因为:
我 爱 中国
和:
中国 爱 我
Token完全一样。
顺序却变了。
意思天差地别。
于是。
老板给我们每个人发了一张身份证。
名字叫:
Position Embedding(位置编码)
从此。
我是第一个。
还是第五个。
老板一眼就知道了。
我的同事
老板手下还有一个部门。
名字很长。
叫:
Self-Attention。
大家都叫它:
注意力部门。
这个部门最大的特点就是:
八卦。
非常八卦。
我刚进去。
它就问:
"你认识前面的Token吗?"
"认识。"
"后面的呢?"
"也认识。"
"和Spring是什么关系?"
"Boot是不是你的搭档?"
......
最后。
它根据我们的关系。
画出了一张巨大的关系网。
老板看完。
终于知道:
Spring和Boot应该在一起。
Java和JVM关系很近。
而:
苹果。
有时候是水果。
有时候是公司。
具体是谁。
要看它旁边站着谁。
我们为什么越来越聪明?
很多人觉得。
AI知道很多知识。
其实。
老板没有背书。
也没有数据库。
老板只是见过太多Token。
互联网。
论文。
小说。
代码。
新闻。
全部拆成了Token。
老板天天看。
天天看。
天天看。
终于。
他发现了规律。
比如:
看到
arduino
public class
后面。
大概率会出现类名。
看到:
sql
SELECT
后面。
大概率会出现字段。
看到:
css
Once upon a time
后面。
大概率是童话。
老板不会思考。
老板只是:
预测下一个Token。
仅此而已。
可是......
后来。
老板越来越大。
参数越来越多。
GPU越来越贵。
上下文越来越长。
于是。
新的故事开始了。
有人开始给老板外挂记忆。
有人开始教老板使用工具。
有人开始让老板自己思考。
有人甚至让老板组成一个团队。
从这一天开始。
AI。
不再只是一个聊天机器人。
它开始拥有:
眼睛。
耳朵。
记忆。
双手。
甚至......
开始拥有同事。
而我的故事。
也只是刚刚开始。
下一集预告
《你好,我叫Prompt------其实不是你在问AI,而是你在编程。》