大模型--OpenAI&创建阿里云百炼API Key

一、OpenAI

1.OpenAI是什么

简单来说,OpenAI 大模型 是由美国人工智能公司 OpenAI 开发的一系列大型语言模型(LLMs) 。你可以把它们想象成拥有巨大"知识储备"和"学习能力"的超级大脑,它们被训练用来理解和生成人类语言,并完成各种复杂的任务 。

2.核心技术:它是如何工作的?

这些模型的核心技术基础是 Transformer 架构 。这个架构让模型能够像人一样,在处理一个词的时候,关注到句子中所有其他词与它的关系,从而更准确地理解上下文。

一个关键的训练方法是 "自监督预训练",简单说,就是让模型在海量的互联网文本数据(如维基百科、书籍、网页等,总量超过5万亿个词元 )上,不断练习"预测下一个词是什么"。通过这个过程,模型自己就学会了语法、事实知识、推理脉络等 。

为了让模型的表现更符合人类的期望和价值观,OpenAI 还引入了一项名为 "基于人类反馈的强化学习"(RLHF) 的关键技术 。这个过程有点像训练一只聪明的小狗:

  1. 人类标注员会编写高质量的答案示例。

  2. 训练一个 "奖励模型" 来学习人类偏好什么样的答案。

  3. 主模型使用这个奖励模型作为反馈,通过强化学习不断优化自己的输出,使其更有用、更真实、更安全 。

3.主要模型家族:从 GPT-1 到 GPT-5

OpenAI 的模型在不断进化,你可以通过这个简表了解它们的发展脉络 :

模型系列 发布时间 核心特点与创新
GPT-1 2018 开创性的"预训练+微调"模式,奠定了后续发展的基础 。
GPT-2 2019 展示了无需专门训练就能解决任务的"零样本学习"能力 。
GPT-3 2020 参数量高达1750亿,展现出强大的"少样本学习"能力,是首个通过商业API提供的模型 。
GPT-3.5 2022 大规模应用RLHF技术,指令遵循能力大幅提升,是引爆全球热潮的 ChatGPT 的基座模型 。
GPT-4 2023 支持图像和文本输入的多模态模型,在许多专业测试中表现出人类水平 。
GPT-4o 2024 原生支持文本、音频、图像的实时交互,响应速度极快,向免费用户开放 。
o1 2024 专注于深度推理的模型,通过"思维链"来解决复杂的科学、编程问题 。
GPT-5 2025 一个能根据问题复杂度自动切换快速回复和深度思考模式的统一系统,被称作"博士级专家" 。
4. 能做什么?不仅仅是聊天

在你的代码里使用 ChatOpenAI,就是准备调用这些模型的能力。它们能做的事情非常广泛:

  • 智能客服与办公:开发能回答问题的聊天机器人,或自动处理电子表格、生成PPT报告 。

  • 编程与创作:作为编程助手(如GitHub Copilot),帮你自动补全代码、调试错误,或辅助生成文章、诗歌等创意内容 。

  • 内容分析与处理:分析长篇文档,总结财报,甚至解读上传的图片或图表 。

总的来说,"OpenAI大模型" 是一系列不断演进的、能力强大的AI模型。可以通过API(应用程序编程接口)的方式,在代码中调用它们,为应用程序添加智能 。

二、创建API Key

1.搜索阿里云百炼并点击
2.点击免费体验Qwen3.5
3.进入下面界面后,点击API参考,选择获取API Key,然后选择API Key(北京)
4.选择创建API Key,填写成功点击确定,即创建成功

三、实际运用

使用阿里云通义千问(DashScope) API的Python代码,它通过OpenAI兼容的方式调用通义千问模型。让我详细解析每一部分:

1.代码逐行解析
1)导入模块
python 复制代码
import os
from openai import OpenAI
  • import os:导入操作系统模块(虽然这里没有使用,但通常用于读取环境变量)

  • from openai import OpenAI:从OpenAI库导入客户端类,这里用的是OpenAI官方Python库,但指向阿里云的API

2)创建客户端
  • api_key:你的阿里云DashScope API密钥

    • 格式为 sk- 开头

    • ⚠️ 重要安全提示:直接在代码中硬编码API密钥不安全!建议使用环境变量

  • base_url:API端点地址

    • 这里是阿里云北京地域的OpenAI兼容模式地址

    • 允许你用OpenAI的SDK调用通义千问模型

3)创建对话补全
python 复制代码
completion = client.chat.completions.create(
    model="qwen-plus",
    messages=[{'role': 'user', 'content': '你是谁?'}]
)
  • model="qwen-plus":指定使用通义千问的"qwen-plus"模型

    • 通义千问有多种模型:qwen-turbo(快速)、qwen-plus(均衡)、qwen-max(最强)
  • messages:对话历史/消息列表

    • role: 'user' 表示用户消息

    • content: 用户输入的内容,这里是"你是谁?"

4)输出结果
python 复制代码
print(completion.choices[0].message.content)
  • completion.choices[0]:获取第一个返回结果(通常只有一个)

  • .message.content:获取AI助手的回复内容

  • 将AI的回答打印到控制台

2.OpenAI兼容模式

阿里云DashScope提供了OpenAI兼容的API接口,这意味着:

  • 你可以用标准的OpenAI Python库

  • 只需要修改base_url指向阿里云

  • 代码几乎不用改动,就能使用通义千问模型

3.为什么这样设计?
  1. 开发者友好:很多开发者熟悉OpenAI的API

  2. 迁移成本低:从OpenAI切换到阿里云只需改两三行代码

  3. 生态兼容:可以使用各种基于OpenAI的工具和框架

4.运行结果
相关推荐
m0_743297422 小时前
实战:用OpenCV和Python进行人脸识别
jvm·数据库·python
XW01059992 小时前
5-11字典合并
数据结构·python·算法
2401_851272992 小时前
Python多线程与多进程:如何选择?(GIL全局解释器锁详解)
jvm·数据库·python
Storynone2 小时前
【Day26】LeetCode:452. 用最少数量的箭引爆气球,435. 无重叠区间,763. 划分字母区间
python·算法·leetcode
进击的雷神2 小时前
并发线程安全、国际电话验证、多页面深度爬取、二级页面解析——法国FIP展爬虫四大技术难关攻克纪实
爬虫·python·安全
晓纪同学2 小时前
ROS2 -06-动作
java·数据库·python·算法·机器人·ros·ros2
qyzm2 小时前
Codeforces Round 927 (Div. 3)
数据结构·python·算法
2401_857865232 小时前
用Python破解简单的替换密码
jvm·数据库·python