前言
Open Interpreter 是一个能让大型语言模型在你本地电脑上运行代码的工具。 简单来说:
它提供了一个类似于 ChatGPT 的自然语言界面,让你能通过代码与电脑互动。 你可以用它来:
- 创建和编辑各种类型的文件(照片、视频、PDF 等)。
- 控制 Chrome 浏览器进行研究。
- 分析数据集。
工作原理: Open Interpreter 为语言模型配备了一个函数,该函数可以在 Python、JavaScript 和 Shell 等各种语言中执行代码。 然后,它会将模型的消息、正在运行的代码和系统的输出流式传输到你的终端。
主要特点:
- 它在本地运行,无需担心网络限制或文件大小限制。
- 它通过自然语言界面简化了复杂的任务。
该项目目前已经收获了58.2kstars,GitHub地址:https://github.com/OpenInterpreter/open-interpreter
我在体验之后,觉得是一个很棒的项目,因此推荐给大家。它的思路很好,我之前想的是创建很多工具,然后根据用户的意图,选择工具调用,但是用户需求是多变的,创建的工具不可能全部涵盖到,但是通过open-interpreter这种方式,就可以应对用户多变的需求了。
实践
首先创建一个python虚拟环境,安装open-interpreter:
bash
pip install open-interpreter
虽然官方推荐使用gpt-40,但是为了在国内更多感兴趣的朋友能够方便体验,这里我以硅基流动提供的模型为例。现在硅基流动也有DeepSeek-R1并且邀请注册可得14元不过期额度,邀请链接:https://cloud.siliconflow.cn/i/Ia3zOSCU。
由于我硅基流动还有很多额度,接下来演示如何接入硅基流动的模型。
python
from interpreter import interpreter
interpreter.llm.model = "openai/deepseek-ai/DeepSeek-V3"
interpreter.llm.api_key = "sk-xxx"
interpreter.llm.api_base = "https://api.siliconflow.cn/v1"
interpreter.llm.context_window = 64000
# Start an interactive chat session
interpreter.chat()
第一个踩坑点,注意要加上openai表示是openai兼容的,不然报错如下:
现在我以一个简单的办公需求来演示open-interpreter的效果。
我在项目目录,放入了一个excel,该excel中的数据,如下所示:
现在根据这个excel随机提需求。
问题1:读取test.xlsx内容,商品A的累计销量是多少?
给出计划,命令行操作与运行代码需要你的同意。
模型假设列名是Product A,失败之后,请求获取列名。
答案是82正确!!
问题2:读取test.xlsx内容,以月份为横坐标,商品B为纵坐标,画一个折线图,需要能显示中文。
模型列出了计划。
模型给出代码。
绘图结果正确。
对比硅基流动平台不同模型的效果。
deepseek-ai/DeepSeek-V3:
meta-llama/Llama-3.3-70B-Instruct:
Qwen/Qwen2.5-72B-Instruct:
视频效果在AI工具推荐------open-interpreter
最后
open-interpreter这个项目非常有意思,可玩性非常高,感兴趣的朋友快去试试吧!!!
将它与自己的日常需求结合看看能不能提高自己的效率。