我写了一个AI图像视频生成工具,免费API+本地部署,分享给大家

事情是这样的

上个月刷到一条新闻,说有个叫Agnes AI的团队,把旗下文本、图片、视频三个模型的API全部免费开放了,无限期。

我当时的第一反应是:这玩意儿靠谱吗?

毕竟"免费"这俩字在AI圈子里,通常意味着:前几次免费 → 用着用着开始收费 → 收得还不便宜。但仔细看了一下,Agnes这次不是搞什么限时活动,是实打实地把API token全部免费了。免费第一周,图片模型就生成了超过200万张图。

说实话,我被触动了。

我平时经常需要做一些配图、封面图,有时候想做个短视频玩玩,但又不想花钱买那些动辄几十美金一个月的AI工具。Midjourney要钱,Runway要钱,Pika也要钱------虽然效果确实好,但对我这种非重度用户来说,每次为了几张图去充会员,总觉得肉疼。

于是我就想:既然API免费,那我能不能自己写个工具,把这些能力包起来,做成一个自己能随便用的东西?

然后就写了这个项目------Agnes Creator Studio

项目地址在这里,觉得有用的话帮忙点个Star⭐️: 👉 github.com/you-want/ag...

这工具能干啥

简单说,就是一个基于Gradio搭建的Web界面,背后调用Agnes AI的免费API,帮你生成图片和视频。

目前支持的功能有这些:

文生图:输入一段描述文字,AI直接给你生成一张图。支持1024×1024、1024×1792(抖音竖屏)、1792×1024(横屏)等多种尺寸。

图生图:上传一张你自己的图片,然后告诉AI你想转成什么风格。比如你拍了一张风景照,输入"油画风格,印象派",AI就给你出一张油画版的。重绘强度可以自己调,0.1到1.0,数值越高变化越大。

文生视频:输入文字描述,生成3到18秒的视频。分辨率支持1080p、720p、480p,帧率12到60 FPS可调。宽高比也覆盖了16:9、9:16、1:1、4:3、3:4。

图生视频:上传一张图片,生成动态视频。这个需要图片有公网URL------不过如果你把项目部署在服务器上,上传本地图片也能用。

多图视频/关键帧动画:上传多张图片,在它们之间生成平滑过渡的视频。这个做产品展示或者创意短片挺好用的。

还有历史记录功能,所有生成的内容自动保存,随时查看和下载。

怎么用

如果你想在自己电脑上跑起来,步骤很简单:

bash 复制代码
# 1. 克隆项目
git clone https://github.com/you-want/agnes-image-tool.git
cd agnes-image-tool

# 2. 安装依赖
pip install -r requirements.txt

# 3. 去 agnes-ai.com 免费拿个 API Key,然后设置环境变量
export AGNES_API_KEY="你的API密钥"

# 4. 启动
python app.py

然后浏览器打开 http://localhost:7860 就能用了。

不想本地跑的话,也可以用Docker一键部署,或者直接部署到Hugging Face Spaces上。

整个项目就五个核心文件:app.py(主界面)、api_client.py(API调用)、config.py(配置)、utils.py(工具函数)、styles.py(样式)。代码量不大,结构也清晰,想自己改改也很方便。

技术栈

后端是Python 3.10+,界面框架用的Gradio 6.0。Gradio这东西特别适合做AI工具的快速原型,几行代码就能搭出一个带界面的Demo。

API请求用Requests处理,图片用Base64编码传输。没什么花里胡哨的,主打一个简单能用。

一些真实的感受

写这个项目的过程,让我重新思考了一个问题:AI工具到底应该怎么做?

现在市面上的AI工具,基本上是两个极端。要么是功能极其强大但价格劝退,要么是免费但各种限制------每天只能用几次、有水印、不能商用、排队排到天荒地老。

Agnes这次免费开放API,其实提供了一个第三种可能性:开发者可以基于免费API自己造工具,用户不需要为每一个小需求付费。

对我自己来说,这个工具解决了一个很实际的痛点------我需要配图的时候,打开网页、输入描述、点一下生成,完事。不需要打开Midjourney Discord频道、不需要记复杂的参数、不需要等别人排队。

而且因为是本地部署,所有数据都在自己电脑上,隐私方面也放心。

说点实在的

这个项目肯定比不上那些大厂砸了几千万做的产品。界面不算华丽,功能也不算最全。

但它的核心价值在于:免费、能用、自己说了算。

如果你跟我一样,偶尔需要AI生成点图片视频,又不想为这点需求花冤枉钱,可以试试这个工具。

项目是MIT协议开源的,随便用、随便改、商用也行。有任何问题欢迎提Issue,会持续维护。

最后,如果觉得有用,去GitHub点个Star⭐️就是对我最大的鼓励。

👉 github.com/you-want/ag...

PS:Agnes的API目前确实是免费的,但未来会不会调整谁也说不准。趁现在能用,赶紧用起来吧。

相关推荐
神奇小汤圆1 小时前
LLM 记忆系统:从 Markdown 知识库到 Self-Governing Repo
人工智能
黑暗森林观察者2 小时前
Gemini 3.5 Flash 把"操作电脑"塞进了模型——AI从"能说"到"能动手"
人工智能·gemini
埃菲尔铁桶2 小时前
我和大模型一起做了个本地知识库——用户也是我和大模型
人工智能·ai编程
To_OC2 小时前
跑通一遍 Tool Call 后,我终于搞懂大模型是怎么调用工具的
人工智能·aigc·agent
Mintimate3 小时前
用 EdgeOne Makers 构建与托管 Agent:从 RAG 检索到智能助手
人工智能·agent
早点睡啊3 小时前
精读 LangChain 官方文档(二)Model 篇:把模型调用升级成工程化推理接口
人工智能·langchain
vivo互联网技术5 小时前
未来,什么才是 AI“正确的使用方式”
人工智能·ai编程
甲维斯5 小时前
豆包Seed2.1Pro编程能力测试!
人工智能·ai编程