人工智能(Artificial Intelligence AI),字面意思理解就是由人制造的具有人类思想和智慧的智能机器。从图灵测试的角度来说,一个人在不知情的情况下与一个机器交流,而这个人通过交流,无法判断出和他交流的是一个机器,那么这个机器就可以称为拥有了人的智能。这就是有名的图灵测试 。
而这两年,人工智能的快速发展,特别是openai推出现象级产品---chatGPT之后,人工智能迅速得到了关注,那么关于人工智能的很多知识点,很多人都不明不白。
人工智能的流派
首先,只要能拥有人类智慧的机器,就可以称为人工智能。那么,既然是机器,那么怎么才能做到拥有人的智慧呢?
所以这时就需要有一种实现方式,能够让机器拥有人的智能。
所以,这时人工智能就有了几个流派,联结主义,符号主义和行为主义;
符号主义认为人工智能源于数理逻辑,旨在用数学和物理学中的逻辑符号来表达思维的形成,产生像人一样的推理和决策。符号主义强调思维过程的逻辑性,侧重于推理和解决问题的思路。
联结主义又称仿生学派或生理学派,其主要原理为神经网络及神经网络间的连接机制与学习算法。它通过模拟生物神经系统来实现学习和适应。联结主义认为知识和技能的获取是通过对大量数据进行学习来实现的。
行为主义又称进化主义或控制论学派,其主要原理为控制论及感知-动作型控制系统。行为主义强调对行为和反馈的研究,通过训练和奖惩机制来实现人工智能的学习。
而目前人工智能的发展,主要以联结主义,也就是仿生学派,使用模仿人类大脑的神经网络模型,通过大量的学习,来实现人工智能。
名词解释
目前,主流的人工智能模型都是基于神经网络来实现的,这类模型的特点是需要打两个的学习与训练,就像小孩子学习一样,慢慢的具有人类的智慧。chatGPT就是基于神经神经网络建立的模型。
神经网络
神经网络就是以生物学为基础的,模仿人类大脑神经元的方式,通过学习实现人工智能的一种方法。
机器学习
前面说了,实现人工智能的方式是通过模仿人类神经元,来通过学习获得人工智能;所以,机器学习就是让机器学会学习的一种方式;而更进一步的方式是------深度学习。而其都是通过神经网络的形式来实现的。
cnn/rnn /transformer
cnn(卷积神经网络)
rnn(循环神经网络)
transformer(自注意力机制神经网络)
以上三种都是用来实现神经网络的一种架构;也就是说怎么来构建神经网络的一种方式。
LLM(large language model)
大语言模型,也就是我们常说的大模型,用来实现通用模型的一种方式,
GPT/GLM
GPT和GLM是两种不同的机器学习模型,GPT是生成式预训练模型,GLM是生成式对抗网络模型;是大模型的两种不同实现方式。
NLP
自然语言处理,机器学习中比较重要的一环就是让机器理解人类说的话,也就是自然语言;因为人类语言的复杂性,所以这是既是一个重要的东西,又是一个很难的东西。比如,现在chatGPT是以英语为主,而国内的大模型是以中文为主。
AGI(通用大模型)
AGI又叫通用大模型,也就是说这个模型可以像一个万能的人类专家一样,适用于任何领域,不论是写文章,搞科研,还是谈情说爱,都可以解决。也就是说他更像一个人,这是人工智能研究的方向;与之对应的是垂直领域的大模型,比如金融领域,医疗领域,数学领域,文化领域等大模型。
AIGC(AI 生成内容)
使用人工智能来实现内容的生产与输出,而取代之前的pgc(专业生成内容)和ugc(用户生成内容),是一种新的生产内容的形式,其具有更高的效率和更高的速度。
最后, 基于神经网络实现的模型,需要大量的数据训练,也就是预训练的由来。而这些模型通过大量数据的训练和学习,慢慢变得就像一个真人一样,具有丰富的知识,能够处理更多更复杂的问题。
而且,在不同的场景下,可以通过微调的方式,来让其在不同场景下,具有更加强大的能力。
而我们使用的大模型,基本上都是一些大企业已经训练好的模型;我们可以通过其提供的sdk或api,来调用他们的能力。
对个人和小企业来说,只能使用这些大公司训练好的模型,或者自己训练一个小模型;毕竟,以目前市场上的大模型来看,比如openai训练一个千亿数据量的大模型,每次大概需要一百多万美元;而且一个好的模型的出现,可能需要经过大量的数据,以及多次训练。这个成本对个人和小微企业是不可接受的。
大模型的训练,不但需要大量的数据,还需要有足够的算力与数据处理能力;也就是说要拥有大数据与云计算的能力;并且还需要足够的显卡。才能完成大模型的训练。