DW动手学大模型应用全栈开发 - (1)大模型应用开发应知必会

系列文章目录

动手学大模型应用全栈开发 - (1)大模型应用开发应知必会

文章目录

系列文章目录
前言
一、浪潮信息源大模型开源体系
- [1.1 浪潮信息源大模型](#1.1 浪潮信息源大模型)
- [1.2 源1.0大模型](#1.2 源1.0大模型)
- [1.3 源2.0大模型](#1.3 源2.0大模型)
- [1.4 源2.0-M32大模型](#1.4 源2.0-M32大模型)
二、大模型时代挖掘模型能力的开发范式
- [2.1 Prompt工程：零样本能力激发](#2.1 Prompt工程：零样本能力激发)
- [2.2 Embedding增强检索：突破知识边界](#2.2 Embedding增强检索：突破知识边界)
- [2.3 参数高效微调（PEFT）：轻量化能力定制](#2.3 参数高效微调（PEFT）：轻量化能力定制)
[三、大模型应用开发必知必会](#三、大模型应用开发必知必会)
四、动手开发baseline
五、动手理解baseline
- 1.引入库
- 2.读入数据
总结

前言

Datawhale学习地址

一、浪潮信息源大模型开源体系

1.1 浪潮信息源大模型

截止到目前，浪潮信息已经发布了三个大模型：源1.0 ，源2.0 和源2.0-M32 ，其中源1.0 开放了模型API、高质量中文数据集和代码，源2.0 和源2.0-M32 采用全面开源策略，全系列模型参数和代码均可免费下载使用。

1.2 源1.0大模型

2021年9月，源1.0大模型发布，它采用76层的Transformer Decoder结构，使用5T数据训练，拥有2457亿参数量，超越OpenAI研发的GPT-3，成为全球最大规模的AI巨量模型，表现出了出色的中文理解与创作能力。

1.3 源2.0大模型

2023年11月，源2.0大模型发布，它使用10T数据训练，包括1026亿、518亿、21亿三款参数规模，在数理逻辑、代码生成等方面表现出色。
在算法方面，与传统Attention对输入的所有文字一视同仁不同，源2.0提出了局部注意力过滤增强机制（Localized Filtering-based Attention, LFA），它假设自然语言相邻词之间有更强的语义关联，因此针对局部依赖进行了建模，最后使得模型精度提高3.53%。

1.4 源2.0-M32大模型

2024年5月，源2.0-M32发布，它是一个混合专家（Mixture of Experts, MoE）大模型，使用2000B Tokens训练，包含400亿参数，37亿激活参数
源2.0-M32 包含32个专家，基于LFA+Attention Router的MoE模型结构。
源2.0-M32 在数理逻辑、代码生成、知识等方面精度对标Llama3-70B，推理算力降至1/19。

二、大模型时代挖掘模型能力的开发范式

在大模型时代，人工智能的应用边界持续扩展。如何充分释放大模型潜能，已成为开发者的核心课题。不同场景催生了三大关键技术策略：

2.1 Prompt工程：零样本能力激发

通过结构化提示（Prompt）直接引导模型输出。关键技术包括：
- 上下文学习（ICL）：将任务指令与示例嵌入提示，利用模型内生推理能力实现零样本任务适配。
- 思维链提示（CoT）：在提示中注入逻辑推理链，显著提升复杂问题的解析深度。

2.2 Embedding增强检索：突破知识边界

大模型在实际应用中面临三重制约：

知识时效局限：训练数据依赖历史公开资源，无法覆盖实时/非公开信息；
数据安全风险：企业敏感数据难以纳入训练集；
生成幻觉：概率生成机制易导致事实性错误。

解决方案：将外部知识转化为Embedding向量构建检索库，通过实时检索注入上下文，为模型提供精准外部知识源，有效抑制幻觉并保障数据安全。

2.3 参数高效微调（PEFT）：轻量化能力定制

当模型基础能力不足或需新增专业技能时：
- 指令微调（SFT）通过监督学习适配特定任务，但全参数微调计算成本过高；
- PEFT技术（如LoRA、Adapter）仅优化0.1%-5%的参数，即可达到全量微调90%以上的效果，实现算力与性能的平衡。

三、大模型应用开发必知必会

通常，一个完整的大模型应用包含一个客户端和一个服务端。

客户端接收到用户请求后，将请求输入到服务端，服务端经过计算得到输出后，返回给客户端回复用户的请求。

四、动手开发baseline

跟着教程一起开发大模型部署【搭建你的智能编程助手】
使用魔搭的免费Notebook实例
下载文件，安装依赖，启动。
加载模型
对话体验

五、动手理解baseline

1.引入库

代码如下（示例）：

python 复制代码

# 导入所需的库
from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
import streamlit as st

2.读入数据

代码如下（示例）：

c 复制代码

data = pd.read_csv(
    'https://labfile.oss.aliyuncs.com/courses/1283/adult.data.csv')
print(data.head())

该处使用的url网络请求的数据。

DW动手学大模型应用全栈开发 - (1)大模型应用开发应知必会

系列文章目录

文章目录

前言

一、浪潮信息源大模型开源体系

1.1 浪潮信息源大模型

1.2 源1.0大模型

1.3 源2.0大模型

1.4 源2.0-M32大模型

二、大模型时代挖掘模型能力的开发范式

2.1 Prompt工程：零样本能力激发

2.2 Embedding增强检索：突破知识边界

2.3 参数高效微调（PEFT）：轻量化能力定制

三、大模型应用开发 必知必会

四、动手开发baseline

五、动手理解baseline

1.引入库

2.读入数据

总结

三、大模型应用开发必知必会