AI大模型开发架构设计(16)——ChatGPT Code Interpreter应用场景和技术原理动手实践

文章目录

    • [ChatGPT Code Interpreter应用场景和技术原理动手实践](#ChatGPT Code Interpreter应用场景和技术原理动手实践)
      • [1 Code Interpreter 应用场景解析](#1 Code Interpreter 应用场景解析)
        • [Code Interpreter 是什么?](#Code Interpreter 是什么?)
        • [Code Interpreter 如何使用?](#Code Interpreter 如何使用?)
        • [Code Interpreter 应用场景](#Code Interpreter 应用场景)
        • [为什么需要Code Interpreter](#为什么需要Code Interpreter)
      • [2 Code Interpreter 技术架构深度剖析](#2 Code Interpreter 技术架构深度剖析)
        • [Code Interpreter 技术架构](#Code Interpreter 技术架构)
        • [LLM Lightweight AI Agent 技术架构](#LLM Lightweight AI Agent 技术架构)
        • [System Prompt VS 沙盒环境](#System Prompt VS 沙盒环境)
      • [3 基于 LangChain 实现一个 Code Interpreter](#3 基于 LangChain 实现一个 Code Interpreter)
        • [Code Interpreter API](#Code Interpreter API)
        • [Code Interpreter API 案例](#Code Interpreter API 案例)
        • [Code Interpreter API 技术架构](#Code Interpreter API 技术架构)
        • [Code Interperter API Deep In 技术原理](#Code Interperter API Deep In 技术原理)
        • [ReAct(Reasoning + Actioning)](#ReAct(Reasoning + Actioning))
      • [4 Interpreter 架构实践中的难点及解决方案](#4 Interpreter 架构实践中的难点及解决方案)

ChatGPT Code Interpreter应用场景和技术原理动手实践

1 Code Interpreter 应用场景解析

Code Interpreter 是什么?
  • 2023年7月9日,OpenAI 开放了 Plus 会员 Code Interpreter 体验资格,它被认为是 GPT-4.5 一次新的重大升级。
  • Code Interpreter 是"一个实验性的 ChatGPT 模型",它将 Python 代码写入 Jupyter Notebook,并在沙箱中执行,在该沙箱中:
    • 其他用户以及互联网隔离,无法上网(出于安全考虑)
    • 支持最多 100MB 文件上传/下载(仅支持100MB的目的主要还是出于商业考虑,技术上是可以支持更大文件上传下载的)
    • 预装了 343 个库(暂不支持其它预装库)
    • 持久会话(上下文支持10次)
  • Code Interpreter 新在哪里?
    • 新模型
      • gpt-4-code-interpreter
    • 代码执行沙箱
      • sandbox
Code Interpreter 如何使用?
  • 在设置中打开 Code Interpreter 的选项,然后在聊天窗口中选择 Code Interpreter 进行体验。
    • 用户可以上传最多 100MB 的文件
    • 对文件进行提问多轮对话

举个🌰

  • 用户:上传一个pdf,然后让GPT针对这篇文件做一个总结
  • GPT:写一段代码,然后去执行(Action),最后生成结果
Code Interpreter 应用场景
  • 视频处理
  • 图片处理
  • 数据分析
  • PDF处理
  • 其它
为什么需要Code Interpreter
  • 低代码完成数据分析
  • Code Interpreter 允许 AI 编写 Python 代码来解决大语音模型在数学和语言方面的固有弱点
  • Code Interpreter 可以对文件进行处理,通过代码运行,降低了幻觉和迷惑的概率
  • Code Interpreter 让 AI 的用途更加广泛
  • 用户不必"编程",因为 Code Interpreter 可以代替大部分/所有的工作

2 Code Interpreter 技术架构深度剖析

Code Interpreter 技术架构
  • LLM 大语言模型技术架构
  • Code Interpreter 技术架构
    • 表面:LLM + Python + Jupyter Notebook
    • 真相:AI Agent
      • LLM Agent
        • 大脑 + 四肢
        • 策略 + 行动

技术浪潮

LLM Lightweight AI Agent 技术架构
  • LLM 是无状态化的文本生成器
System Prompt VS 沙盒环境

3 基于 LangChain 实现一个 Code Interpreter

Code Interpreter API
Code Interpreter API 案例
  • 当询问"绘制2023年的比特币图表"时,它会使用雅虎财经下载实时数据,然后将其以图像形式展示给用户。
Code Interpreter API 技术架构
  • Code Interperter API 底层利用 LangChain 的 Agent 工具,帮助大模型使用 Code Interpreter,有 2 个核心组成:
    • 使用 LangChain 的最新的 OpenAIFunctionsAgent
    • Python 代码执行器采用的由 CodeBox 或者 本地提供的 Python 运行环境

Code Interperter API 底层利用 LangChain 的 Agent 工具,帮助大模型使用 Code Interpreter,有 2 个核心组成:

  • Tools初始化
    • 支持 ipython 运行环境
    • 输入 Code,输出执行结果
  • Agent初始化
    • 接受LLM,支持 ChatGPT、Azure等LLM
    • 传入 tools
    • 支持memory
    • 传入 System Prompt
Code Interperter API Deep In 技术原理
ReAct(Reasoning + Actioning)
  • Paper 提出,支持 Though-Action-Observation 进行 Prompt 工程
  • 该框架扩展 Chain-Of-Thought 到 Chain-Of-Thought-Action-Observation( 额外 intermediate Action 和 observation 步骤)

举个🌰

代码实现

4 Interpreter 架构实践中的难点及解决方案

如何保证数据安全
  • 采用私有化部署的 Azure 或者自己训练的 LLM
  • 采用自己搭建的运行环境
如何提升效果
  • 修改完善 System Prompt
  • 改用自己代码 Fine-tune 模型
  • 根据不同的数据报表类型,预定义一些分析思路
如何实现多轮问答
相关推荐
井底哇哇33 分钟前
ChatGPT是强人工智能吗?
人工智能·chatgpt
2401_897579657 小时前
ChatGPT接入苹果全家桶:开启智能新时代
前端·chatgpt
好评笔记12 小时前
AIGC视频扩散模型新星:Video 版本的SD模型
论文阅读·深度学习·机器学习·计算机视觉·面试·aigc·transformer
AIGC大时代14 小时前
方法建议ChatGPT提示词分享
人工智能·深度学习·chatgpt·aigc·ai写作
糯米导航14 小时前
ChatGPT Prompt 编写指南
人工智能·chatgpt·prompt
正在走向自律16 小时前
AI 写作(六):核心技术与多元应用(6/10)
人工智能·aigc·ai写作
小虚竹16 小时前
用AI辅导侄女大学物理的质点运动学问题
人工智能·chatgpt
寻道码路16 小时前
探秘 Docling:多格式文档解析转换大揭秘,赋能 AI 应用新生态
人工智能·aigc·ai编程
Daphnis_z20 小时前
大模型应用编排工具Dify之常用编排组件
人工智能·chatgpt·prompt
好评笔记1 天前
AIGC视频生成模型:Stability AI的SVD(Stable Video Diffusion)模型
论文阅读·人工智能·深度学习·机器学习·计算机视觉·面试·aigc