大语言模型LLM应用篇

大模型席卷全球,彷佛得模型者得天下。对于IT行业来说,以后可能没有各种软件了,只有各种各样的智体(Agent)调用各种各样的API。在这种大势下,笔者也阅读了很多大模型相关的资料,和很多新手一样,开始脑子里都是一团乱麻,随着相关文章越读越多,再进行内容梳理,终于理清了一条清晰的脉络。笔者希望通过三篇文章总结(入门篇、原理篇和应用篇)将思路写下来,以便跟我一样的新手读者快速了解大模型的方方面面。在这里,笔者先强调一下,本系列文章的深度有限,只是个人对大模型知识脉络的梳理,同时也会借鉴一下同行的博客内容充实本文,文末将会注明参考来源。

本文着重介绍大语言模型本身的开发应用,而不是大模型在行业的应用,如果要了解在行业的应用,读者可以直接上字节跳动的Coze平台或者百度的千帆平台,上面已经有很多通过大模型实现的智能体Agent,也许有一款满足你的需求。

笔者认为大语言模型本身的开发应用可以分为三层:

  • 模型基础研发

    从0开始研发大模型或者基于现有开源模型打造自己的大模型,这种方式需要大量人才和资金,成本非常高。

  • 模型定制优化

    基于现有模型进行调整优化,打造满足自身需求的定制化大模型。该方式定制化程度比较高,成本投入相对较多。主要实现方式有三种:

    • 模型训练(Training)
    • 模型微调(FineTune)
    • 提示词工程(Prompt Engneering)
  • 模型应用开发

    针对用户需求,基于大模型开发各种AI应用。该方式投入成本比较少,实现速度快。目前开发AI应用有两个途径:

    • 基于大模型开发框架实现,该方式需要进行编码。常用框架有:LangChain、AutoGPT等;
    • 基于AI开发平台实现,该方式无需编码。国内主要平台有:字节跳动Coze、百度的千帆平台。

笔者针对上述内容绘制了一张开发应用分层图,如下:

上图中每一个开发应用方向都值得我们深入研究,就看读者对哪个方向最感兴趣了。

相关推荐
Power202466632 分钟前
NLP论文速读|LongReward:基于AI反馈来提升长上下文大语言模型
人工智能·深度学习·机器学习·自然语言处理·nlp
数据猎手小k35 分钟前
AIDOVECL数据集:包含超过15000张AI生成的车辆图像数据集,目的解决旨在解决眼水平分类和定位问题。
人工智能·分类·数据挖掘
好奇龙猫40 分钟前
【学习AI-相关路程-mnist手写数字分类-win-硬件:windows-自我学习AI-实验步骤-全连接神经网络(BPnetwork)-操作流程(3) 】
人工智能·算法
沉下心来学鲁班1 小时前
复现LLM:带你从零认识语言模型
人工智能·语言模型
数据猎手小k1 小时前
AndroidLab:一个系统化的Android代理框架,包含操作环境和可复现的基准测试,支持大型语言模型和多模态模型。
android·人工智能·机器学习·语言模型
YRr YRr1 小时前
深度学习:循环神经网络(RNN)详解
人工智能·rnn·深度学习
sp_fyf_20241 小时前
计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-11-01
人工智能·深度学习·神经网络·算法·机器学习·语言模型·数据挖掘
多吃轻食1 小时前
大模型微调技术 --> 脉络
人工智能·深度学习·神经网络·自然语言处理·embedding
charles_vaez2 小时前
开源模型应用落地-glm模型小试-glm-4-9b-chat-快速体验(一)
深度学习·语言模型·自然语言处理
北京搜维尔科技有限公司2 小时前
搜维尔科技:【应用】Xsens在荷兰车辆管理局人体工程学评估中的应用
人工智能·安全