大语言模型Large Language Model(LLM)

目录

1.大模型的发展历程

2.算力需求

3.大模型api调用


1.大模型的发展历程

维基百科的介绍:https://en.wikipedia.org/wiki/Large_language_model

发展情况

大语言模型的模型参数量一般在数百亿或数千亿个参数,开源大模型主要有Facebook的LLaMA,阿里的通义千问,微软AI研究院Phi-3,谷歌的BERT(2018)等,

2.算力需求

模型参数和显存需求:

模型参数使用2字节或者4字节进行存储;

如果每个模型参数使用2个字节进行存储,

10亿的模型参数,占用显存2GB;

如果冻结预加载的大模型参数,10亿参数的大模型占用显存2GB;

如果微调大模型的参数,10亿参数的模型至少需要显存16G;

对于LLaMA系列开源模型,2023/06发布的LLaMA 2,有不同版本的预训练模型,参数量分别是70亿/130/700亿;2024/04发布的Llama 3,参数量分别是80亿/700亿.

对于个人调试大模型参数,做如下估计:

如果采用微调大模型参数这种方案,以LLaMA的70亿参数为例,需要显存112G,基本不可能实现;

如果采用冻结预加载的大模型参数方案,以LLaMA的70亿参数为例,至少需要显存14G,同时需要设计网络架构,类似LLaMA-Reg:

3.大模型api调用

曾一度(至今),kimi AI助手十分火爆,kimi可以接受多种类型的文件作为输入,并根据提示词输出文件分析结果。通义千问也有类似的功能。如果待处理的文件数量较少,如十几个或者几十个,直接交互式处理足够了,然而,如果待处理的文件数量,如几百几千几万,甚至几十万几百万几亿等,借助交互式的LLM模型调用的调用方式就在操作层面不再可行,可以借助大模型提供的api接口,编程实现大量文件的处理。目前,kimi和QWen模型都支持模型api的调用,并且调用方式很简单,基于python很容易就能实现。类似kimi/QWen,会提供一定量的免费调用api的额度,如果需要处理的文件数量很多,达到几千几万,需要购买tokens,具体见相关网站介绍。在使用大模型工具时,需要注意模型参数的调整,提示词的编辑,关注到一定程度上大模型输出的随机性,尽可能规避随机性对处理结果的影响,尽可能保证处理结果的准确性。

相关推荐
测试_AI_一辰3 小时前
AI测试工程笔记 05:AI评测实践(从数据集到自动评测闭环)
人工智能·笔记·功能测试·自动化·ai编程
云境筑桃源哇4 小时前
海洋ALFA:主权与创新的交响,开启AI生态新纪元
人工智能
liliangcsdn4 小时前
LLM复杂数值的提取计算场景示例
人工智能·python
小和尚同志4 小时前
OpenCodeUI 让你随时随地 AI Coding
人工智能·aigc·ai编程
AI视觉网奇4 小时前
2d 数字人解决方案-待机动作
人工智能·计算机视觉
人工智能AI酱5 小时前
【AI深究】逻辑回归(Logistic Regression)全网最详细全流程详解与案例(附大量Python代码演示)| 数学原理、案例流程、代码演示及结果解读 | 决策边界、正则化、优缺点及工程建议
人工智能·python·算法·机器学习·ai·逻辑回归·正则化
爱喝可乐的老王5 小时前
机器学习监督学习模型--逻辑回归
人工智能·机器学习·逻辑回归
Ao0000005 小时前
机器学习——逻辑回归
人工智能·机器学习·逻辑回归
智算菩萨5 小时前
【How Far Are We From AGI】3 AGI的边界扩张——数字、物理与智能三重接口的技术实现与伦理困境
论文阅读·人工智能·深度学习·ai·agi
智算菩萨5 小时前
【How Far Are We From AGI】2 大模型的“灵魂“缺口:当感知、记忆与自我意识的迷雾尚未散去
人工智能·ai·agi·感知