大模型基础
大模型基础
通常指的是大规模语言模型。它们是近年来人工智能领域最核心的突破,也是你正在对话的"我"这类系统的技术基础。它主要指基于深度学习、通过海量数据训练、包含巨大参数量(通常在十亿级别以上)的通用神经网络模型。
人工智能(AI)的目标是让机器模仿或超越人类的智能。人工智能是一个庞大的学科,以下是几个最核心、最成熟的子领域:
1. 人工智能
人工智能是一个广泛涉及计算机科学、数据分析、统计学、机器工程、语言学、神经科学、哲学和心理学等多个学科的领域。
2. 机器学习
机器学习可以分为监督学习,无监督学习与强化学习
- 监督学习:给标注好的数据,学习映射关系。用于分类、回归。
- 无监督学习:给无标注数据,自己发现隐藏结构(如聚类、降维)。
- 强化学习:在环境中试错,通过奖励信号学习策略。如AlphaGo、自动驾驶决策。
3 深度学习
深度学习是机器学习的一个分支,主要使用神经网络模型(由多个隐藏层组成)对数据进行学习和表示。
4. 生产式人工智能 AIGC
生成式人工智能又是深度学习中快速增长的子集,它们使用了大模型提供支持,在大量原始、未标记的数据基础上对深度学习模型进行预训练,使得机器能够"理解"语言甚至图像,并能够根据需要自动生成内容。
大模型使用
把你平时的搜索框,变成一个能理解你意图、能处理文件、能帮你创作的智能助手。你不用管它怎么做到的,只要清晰地告诉它"你想要什么"就行了。
大模型训练
第一阶段:预训练
目的是让模型掌握语言的基本规律和世界知识。比如:教一个孩子认字、读书、理解世界,成本最高。
这个阶段的成果是基础模型:它已经有了极强的语言理解和生成能力,知识储备丰富,但它不会对话,也不知道如何遵循指令。它只是一个知识渊博但有点原始的文本续写机器。
第二阶段:监督微调 SFT
目的模仿人类的对话范例,教它如何与人进行"有用"的对话。在这个阶段我们会学习到专业知识,比如金融、法律等领域,我们的头脑会更专注于特定领域。对于大模型来说,在这个阶段它可以学习各种人类的对话语料,甚至是非常专业的垂直领域知识,在监督微调过程之后,它可以按照人类的意图去回答专业领域的问题。
这时候的模型已经可以按照人类的意图去完成基本的对话功能了,但是模型的回答有时候可能并不符合人类的偏好,它可能会输出一些涉黄、涉政、涉暴或者种族歧视等言论,这时候我们就需要对模型进行RLHF(基于人类反馈的强化学习)。
第三阶段:对齐微调 RLHF
经过前两步,模型已经能听懂人话并回答问题。但它可能还会输出有害的、有偏见的或虚假的信息。第三步就是要把它调教成一个有用、诚实、无害的好助手。
最主流的方法是 RLHF,它会针对同一问题进行多次回答,人类会对这些回答打分,大模型会在此阶段学习到如何输出分数最高的回答,使得回答更符合人类的偏好。
大模型特点与分类
大模型特点:
- 规模和参数量大:百亿到万亿参数,遵循规模法则;
- 适应性和灵活性强:一个模型通过提示完成多任务;
- 广泛数据集的预训练:在海量互联网数据上学习;
- 计算资源需求大:训练和推理都需大量GPU资源;
大模型分类:
一、大语言模型LLM
专注自然语言处理(NLP),基于Transformer架构和海量文本训练。能捕捉语法、语义与语境,用于生成、问答、翻译等任务。
二、多模态模型 (计算机视觉模型、音频处理模型)
能同时处理文本、图像、音频、视频等多种数据,并在不同模态间建立关联。核心能力是跨模态理解、推理与生成。
大模型的工作流
从原始需求到最终答案的一整套处理链条。根据使用场景的复杂程度。
分词话与词表映射
分词化(Tokenization)是自然语言处理(NLP)中的重要概念,它是将段落和句子分割成更小的分词(token)的过程。因为大模型不认识完整的句子,需要先把文本切割成更小的Token。
常见的分词粒度:
- 字符粒度:按单个字切分,是中文最直接的分词方法。例子:"我"、"爱"、"人"、"工"、"智"、"能"
- 词粒度:按完整单词切分,适用于英语。例子:"我"、"爱"、"人工智能"
- 子词粒度:常用组合成词,罕见字拆开。例子:"我"、"爱"、"人工"、"智能"
每一个token都会通过预先设置好的词表,映射为一个token id,这是token 的"身份证",一句话最终会被表示为一个元素为token id的列表,供计算机进行下一步处理。
大语言模型生成文本过程 是一个基于给定文本,迭代预测下一个token的自回归过程。
对我们来说,看似像在对大模型提问,但实际上是给了大模型一串提示文本,让它可以对后续的文本进行推理。 大模型的推理过程不是一步到位的,当大模型进行推理时,它会基于现有的token,根据概率最大原则预测出下一个最有可能的token,然后将该预测的token加入到输入序列中,并将更新后的输入序列继续输入大模型预测下一个token,这个过程叫做自回归。直到输出特殊token(如<EOS>, end of sentence,专门用来控制推理何时结束)或输出长度达到阈值。
大模型的应用
大模型的应用已经非常广泛,正在重塑各行各业。简单来说,其应用可分为核心能力应用(用模型本身的能力解决问题)和场景化解决方案。