想要做AI应用,首先的理解AI的基本概念,本文将主要记录一些AI名词的概念理解
LLM
是什么?
这个大家应该都用过了,我的理解就是他是增强版的百度或者谷歌搜索引擎吧,以前百度谷歌搜索引擎只能去根据现有知识库搜索与你问题最接近的答案,而LLM更像是一个可以思考的工具,他可以自己创作答案。
可以干什么?
比如你塞给他一段代码,他会自己去阅读代码,并且给出你优化建议或者指出你这段代码的bug在哪里,这在以前,搜索引擎是做不到的,现在AI可以做的事情很多,我就不一一列举了,https://ai-bot.cn/可以看下这个网站里面的,这些都是在大模型的基础上做的AI应用。
现在AI有哪些问题
大家都说未来是AI的时代,也有人说AI只是泡沫,到现在1+1都可能会算错,发展AI还不如发展人脑
确实,现在AI还有很多的问题,主要表现在以下几个方面:
1、你跟他对话,聊着聊着就忘记了,比如你前面已经说了你是个男的,后面你问他我百米通过训练最快能跑多少秒,他会列举如果你是男的,能跑多少,如果你是女的,又能跑多少,这只是个举例,他不像人脑有长期记忆,经常性出现混乱和想象。
2、她喜欢幻想,有时候你没有给到足够的定义和规则,或者他已经忘记了你几分钟前说的东西,他就会开始幻想。另外一个原因就是,他就算是不知道或者说缺少实质性证据的时候,也会强行补充,导致他幻想,或者就是你给的指令太模糊了,他喜欢幻想或者说胡编乱造
token
是什么?
token 是模型读写文本的"最小单位"之一,说白了就是你发送给LLM的指令长度和他返回的内容长度,很多平台按 token 计费,token 越多,生成越慢英文,大概 3-4 个字符≈1 token(很粗略),中文:通常 1-2 个汉字≈1 token(也不绝对),长度限制,就是模型一次最多处理 N 个 token(上下文窗口)
上下文窗口
你可以把它当作模型的"一次性可用工作台大小"。
你发给模型的:system + user + 历史对话 + 你塞的资料,再加上模型要输出的内容,这些加在一起,不能超过窗口上限,超过会发生什么?不同平台表现不同,但常见是:截断最早的内容(导致忘记一些东西)或者报错/拒绝或者 输出被强行变短(你看到回答不完整)