向量与向量数据
什么是向量:向量是一个数学概念,是指既有大小,又有方向的量,比如坐标;与之相对的是标量,标量是只有大小、没有方向的量,比如温度、质量。向量发源于几何数学,几何数学可以有效的计算位置与位置之间的距离,这是大模型对信息与信息间关系强弱度计算的基础,大模型的本质是计算信息与信息在几何位置上的距离远近。
什么是向量数据:向量数据是将现实世界中的各类对象通过特定算法转换为向量形式后得到的数据。比如在一个平面上有A、B两个点,我们可以通过x、y轴来表示A、B两个点的位置,如A(3,5)、B(9,3),表示A在x轴的3与y轴的5交叉的地方,B在x轴的9与y轴的3交叉的地方,其中(3,5)、(9,3)就是向量数据。
什么是高维数据:前面举例的A、B两个点,我们是通过x、y轴两个信息来描述,每个信息我们称为一个维度,所以A、B点位数据是二维数据。维度我们可以理解为观察事物的角度,如果要更全面的观察一个事物,那么所需要观察的角度就越多,也就是观察的维度越多,多个维度的数据,我们称为高维数据,AI的算法会将信息向量化为几百维几千维几万维度的向量数据,如此多的维度需要大量的计算,所以AI需要强大的算力进行运算。
向量数据有什么用:向量数据是用来计算信息与信息间关系强弱的工具,每一次AI输入与输出的信息都可以拆分为大量小片段的信息,输入时要通过向量数据获取高关联度的信息,输出时要通过向量数据决定哪些信息该输出,按什么顺序输出,这些都是由信息与信息间的强弱关系决定的,本质是向量数据与向量数据间的距离,距离短说明关系紧密,距离长说明关系疏远。