AI应用(1)-基础概念的理解

想要做AI应用,首先的理解AI的基本概念,本文将主要记录一些AI名词的概念理解

LLM

是什么?

这个大家应该都用过了,我的理解就是他是增强版的百度或者谷歌搜索引擎吧,以前百度谷歌搜索引擎只能去根据现有知识库搜索与你问题最接近的答案,而LLM更像是一个可以思考的工具,他可以自己创作答案。

可以干什么?

比如你塞给他一段代码,他会自己去阅读代码,并且给出你优化建议或者指出你这段代码的bug在哪里,这在以前,搜索引擎是做不到的,现在AI可以做的事情很多,我就不一一列举了,https://ai-bot.cn/可以看下这个网站里面的,这些都是在大模型的基础上做的AI应用。

现在AI有哪些问题

大家都说未来是AI的时代,也有人说AI只是泡沫,到现在1+1都可能会算错,发展AI还不如发展人脑

确实,现在AI还有很多的问题,主要表现在以下几个方面:

1、你跟他对话,聊着聊着就忘记了,比如你前面已经说了你是个男的,后面你问他我百米通过训练最快能跑多少秒,他会列举如果你是男的,能跑多少,如果你是女的,又能跑多少,这只是个举例,他不像人脑有长期记忆,经常性出现混乱和想象。

2、她喜欢幻想,有时候你没有给到足够的定义和规则,或者他已经忘记了你几分钟前说的东西,他就会开始幻想。另外一个原因就是,他就算是不知道或者说缺少实质性证据的时候,也会强行补充,导致他幻想,或者就是你给的指令太模糊了,他喜欢幻想或者说胡编乱造

token

是什么?

token 是模型读写文本的"最小单位"之一,说白了就是你发送给LLM的指令长度和他返回的内容长度,很多平台按 token 计费,token 越多,生成越慢英文,大概 3-4 个字符≈1 token(很粗略),中文:通常 1-2 个汉字≈1 token(也不绝对),长度限制,就是模型一次最多处理 N 个 token(上下文窗口)

上下文窗口

你可以把它当作模型的"一次性可用工作台大小"。

你发给模型的:system + user + 历史对话 + 你塞的资料,再加上模型要输出的内容,这些加在一起,不能超过窗口上限,超过会发生什么?不同平台表现不同,但常见是:截断最早的内容(导致忘记一些东西)或者报错/拒绝或者 输出被强行变短(你看到回答不完整)

相关推荐
零售ERP菜鸟5 小时前
IT年度商业计划书框架(精简版)
大数据·人工智能·职场和发展·创业创新·学习方法·业界资讯
张祥6422889045 小时前
线性代数本质笔记十二
人工智能·算法·机器学习
乌恩大侠5 小时前
【AI-RAN 调研】软银株式会社的 “AITRAS” 基于 Arm 架构的 NVIDIA 平台 实现 集中式与分布式 AI-RAN 架构
人工智能·分布式·fpga开发·架构·usrp·mimo
2501_948120155 小时前
边缘计算与云计算协同的计算卸载策略
人工智能·云计算·边缘计算
aigcapi5 小时前
2026年跨境运营矩阵系统TOP5测评,客观展现“矩阵系统哪家好?”
大数据·人工智能·矩阵
Σίσυφος19005 小时前
视觉矩阵 之 单应矩阵
人工智能·算法·矩阵
囊中之锥.5 小时前
【机器学习实战】词向量 + 朴素贝叶斯实现中文情感分析
人工智能·机器学习
叫我:松哥5 小时前
基于Flask的心理健康咨询管理与智能分析,集成AI智能对话咨询、心理测评(PHQ-9抑郁量表/GAD-7焦虑量表)、情绪追踪记录、危机预警识别
大数据·人工智能·python·机器学习·信息可视化·数据分析·flask
合新通信 | 让光不负所托5 小时前
氟化液、矿物油、改性硅油三种冷却液,分别适合搭配什么功率等级的浸没式液冷光模块?
人工智能·安全·云计算·信息与通信·光纤通信
啊阿狸不会拉杆5 小时前
《机器学习》第五章-集成学习(Bagging/Boosting)
人工智能·算法·机器学习·计算机视觉·集成学习·boosting