AI应用(1)-基础概念的理解

想要做AI应用,首先的理解AI的基本概念,本文将主要记录一些AI名词的概念理解

LLM

是什么?

这个大家应该都用过了,我的理解就是他是增强版的百度或者谷歌搜索引擎吧,以前百度谷歌搜索引擎只能去根据现有知识库搜索与你问题最接近的答案,而LLM更像是一个可以思考的工具,他可以自己创作答案。

可以干什么?

比如你塞给他一段代码,他会自己去阅读代码,并且给出你优化建议或者指出你这段代码的bug在哪里,这在以前,搜索引擎是做不到的,现在AI可以做的事情很多,我就不一一列举了,https://ai-bot.cn/可以看下这个网站里面的,这些都是在大模型的基础上做的AI应用。

现在AI有哪些问题

大家都说未来是AI的时代,也有人说AI只是泡沫,到现在1+1都可能会算错,发展AI还不如发展人脑

确实,现在AI还有很多的问题,主要表现在以下几个方面:

1、你跟他对话,聊着聊着就忘记了,比如你前面已经说了你是个男的,后面你问他我百米通过训练最快能跑多少秒,他会列举如果你是男的,能跑多少,如果你是女的,又能跑多少,这只是个举例,他不像人脑有长期记忆,经常性出现混乱和想象。

2、她喜欢幻想,有时候你没有给到足够的定义和规则,或者他已经忘记了你几分钟前说的东西,他就会开始幻想。另外一个原因就是,他就算是不知道或者说缺少实质性证据的时候,也会强行补充,导致他幻想,或者就是你给的指令太模糊了,他喜欢幻想或者说胡编乱造

token

是什么?

token 是模型读写文本的"最小单位"之一,说白了就是你发送给LLM的指令长度和他返回的内容长度,很多平台按 token 计费,token 越多,生成越慢英文,大概 3-4 个字符≈1 token(很粗略),中文:通常 1-2 个汉字≈1 token(也不绝对),长度限制,就是模型一次最多处理 N 个 token(上下文窗口)

上下文窗口

你可以把它当作模型的"一次性可用工作台大小"。

你发给模型的:system + user + 历史对话 + 你塞的资料,再加上模型要输出的内容,这些加在一起,不能超过窗口上限,超过会发生什么?不同平台表现不同,但常见是:截断最早的内容(导致忘记一些东西)或者报错/拒绝或者 输出被强行变短(你看到回答不完整)

相关推荐
冬奇Lab6 小时前
Workflow 系列(04):Multi-Agent 协调——编排器边界、并发控制与上下文隔离
人工智能·工作流引擎
冬奇Lab6 小时前
每日一个开源项目(第147篇):HyperGraphRAG - 用超图表示 N 元关系,RAG 的第三代范式
人工智能·开源·graphql
甲维斯6 小时前
Github + 阿里云oss实现类似codex的自动更新!
人工智能
阿里云大数据AI技术8 小时前
光轮智能 × 阿里云:共建 Physical AI 云上数据、评测与持续学习基础设施
人工智能·机器学习
机器之心8 小时前
实锤了:Claude Code偷查用户,时区、中国AI实验室全是关键词
人工智能·openai
网易云信8 小时前
Cursor点燃个人开发者,企业级AI为何频频受挫?Agent工厂从提效工具到AI员工的跃迁
人工智能·开源
网易云信8 小时前
解锁触手可及的温暖:网易智企 x Wander Puffs AI 云游泡芙
人工智能
转转技术团队9 小时前
从 PRD 到可验证代码:AI 需求开发闭环实践
人工智能