【AIGC前沿】MiniMax海螺AI视频——图片/文本生成高质量视频

目录

1.MiniMax海螺AI视频简介

2.使用教程


1.MiniMax海螺AI视频简介

海螺视频,作为 MiniMax 旗下海螺 AI 平台精心打造的 AI 视频生成工具,致力于助力用户产出高品质视频内容。该工具依托 abab-video-1 模型,具备强大的文生视频功能。用户仅需输入关键词或简短语句,海螺视频就能据此创作出情节丰富的完整视频。此外,海螺视频运用 DiT 架构,能够精准模拟现实世界的物理规律,尤其在生成复杂场景与高动作场景时,展现出卓越的性能。

2.使用教程

点击如下链接,进入蓝耘元生代智算云平台主页

https://cloud.lanyun.net/#/registerPage?promoterCode=11f606c51e

点击主页上方栏的"MaaS平台"

然后点击左侧栏的"视觉模型"

可以看到可以免费体验一次I2V-01图片生成视频

点击如下红框处将图片上传

例如输入如下的图片

例如想让小狗动起来,可以在如下红框处输入相应的指令,然后点击立即生成 , 等待一段时间后,视频即可生成出来

视觉模型API

Video Generation(视频生成)

该API支持基于用户提供的prompt、首帧图片、主体参考图片,生成720p,25帧的动态视频。

该接口采用异步调用的方式完成视频生成:首先创建视频生成任务,对应接口会返回任务ID(task_id);接下来,在异步任务查询接口通过任务 ID (task_id),获取视频生成任务的状态,以及生成的视频的文件ID(file_id)。

API说明

完成视频生成及下载,使用到三个API:创建视频生成任务、查询视频生成任务状态文件管理。具体步骤如下:

1.使用创建视频生成任务接口,创建视频生成任务,并得到task_id;

2.使用查询视频生成任务状态接口,基于task_id查询视频生成任务状态;当状态为成功时,将获得对应的文件 ID(file_id);

3.使用文件管理接口(File API)基于步骤2查询接口返回的file_id进行视频生成结果的查看和下载。

创建视频生成任务API

POST https://maas-api.lanyun.net/v1/video_generation

请求示例(Python)

复制代码
import requests
import json

url = "https://maas-api.lanyun.net/v1/video_generation"

payload = json.dumps({
  "model": "I2V-01-Director",
  "prompt": "测试12312312313",
  "promptOptimizer": "true",
  "firstFrameImage": "data:image/jpeg;base64,{image_base64_data}"

})
headers = {
   'Authorization': 'Bearer sk-******************',
   'Content-Type': 'application/json'
}

response = requests.request("POST", url, headers=headers, data=payload)

print(response.text)

请求示例(Crul)

复制代码
curl --location --request POST 'https://maas-api.lanyun.net/v1/video_generation' \
--header 'Authorization: Bearer sk-*****************' \
--header 'Content-Type: application/json' \
--data-raw '{
    "model": "I2V-01",
    "prompt": "起风了",
    "promptOptimizer": true,
    "firstFrameImage": ""
}'

返回示例

复制代码
{
    "task_id": "174741320903036928",
    "base_resp": {
        "status_code": 0,
        "status_msg": "success"
    }
}
请求体(Request)参数
参数名称 类型 必填项 描述
Authorization string 必填 给定的API密钥
Content-Type application/json 必填 Content-type
model string 必填 调用的算法模型ID。可选项:T2V-01-Director、I2V-01-Director、S2V-01、I2V-01-live、I2V-01、T2V-01
prompt string 非必填 生成视频的描述。(注:最大支持2000字符)。
promptOptimizer boolean 非必填 默认取值为True,模型会自动优化传入的prompt,以提升生成质量。如果需要更精确的控制,可以将此参数设置为False,模型将更加严格地遵循指令。此时建议提供更精细的prompt,以获得最佳效果
firstFrameImage string 非必填 本参数当model选择为I2V-01I2V-01-DirectorI2V-01-live时,为必填参数。模型将以此参数中传入的图片为首帧画面来生成视频。支持传入图片的data:image/jpeg;base64,{data}格式的 Base64 编码字符串,或可通过公网访问的 URL。传入此参数时支持将prompt设置为空字符串或不传入prompt,模型将自主决定画面如何演变。 传入图片需要满足以下条件: - 格式为JPG/JPEG/PNG; - 长宽比大于2:5、小于5:2; - 短边像素大于300px; - 体积不大于20MB。
subjectReference array 非必填 本参数仅当model选择为S2V-01时可用。模型将依据此参数中上传的主体来生成视频。目前仅支持单主体参考(数组长度为 1)。
返回(Response)参数
task_id string 视频生成异步任务的任务id,生成结果需要通过使用此id在异步任务查询接口中获取。
base_resp 状态码及其详情。 base_resp.status_code 状态码及其分别含义如下: 0:请求成功; 1002:触发限流,请稍后再试; 1004:账号鉴权失败,请检查 API-Key 是否填写正确; 1008:账号余额不足; 1026:视频描述涉及敏感内容,请调整; 2013:传入参数异常,请检查入参是否按要求填写; 2049:无效的api key,请检查api key。 base_resp.status_msg 具体错误详情

其他说明: 当参数model选择为T2V-01-DirectorI2V-01-Director时,对prompt中的运镜控制,有更准确的响应。

  1. 支持插入运镜指令,实现运镜控制:运镜指令需以[ ]格式插入prompt中镜头应用处,标准运镜指令格式为[C1,C2,C3],其中C表示不同类型运镜,共支持15种枚举运镜方式,具体可参考下方详情。为保证运镜效果,建议组合运镜指令不超过3个。 1、支持15种运镜方式(枚举值) (1) 左右移:[左移]、[右移] (2)左右摇:[左摇]、[右摇] (3)推拉:[推进]、[拉远] (4)升降:[上升]、[下降] (5)上下摇:[上摇]、[下摇] (6)变焦:[变焦推近]、[变焦拉远] (7)晃动:[晃动] (8)跟随:[跟随] (9)固定:[固定] 2、支持单一及组合运镜 (1)单一运镜:例如[左摇],表示插入单一镜头; (2)多运镜同时生效:同一组内的镜头表示同时生效,如[左摇,右移],表示插入两个组合镜头,且同时生效; (3)多运镜先后生效:插入在前的镜头指令,先生效。如在prompt描述"xxx[左摇],xxx[右移] " 表示:视频生成时,先运行左摇镜头,后运行右移镜头;

  2. 支持通过自然语言描述,实现运镜控制;使用指令内运镜名称,会提升运镜响应准确性。

  3. 运镜指令与自然语言描述可同时生效。

    查询视频生成任务状态API

    GET https://maas-api.lanyun.net/v1/query/video_generation?taskId={task_id}

请求示例(Python)

复制代码
import requests
import json

api_key="sk-*************"
task_id="174847042751959040"

url = f"https://maas-api.lanyun.net/v1/query/video_generation?taskId={task_id}"

payload = {}
headers = {
  'authorization': f'Bearer {api_key}'
}

response = requests.request("GET", url, headers=headers, data=payload)

print(response.text)

请求示例(Crul)

复制代码
curl --location --request GET 'https://maas-api.lanyun.net/v1/query/video_generation?taskId=174741320903036928' \
--header 'Authorization: Bearer sk-**************'

返回示例

复制代码
{
    "taskId": "174741320903036928",
    "status": "Success",
    "videoWidth": null,
    "videoHeight": null,
    "videoDownLoadUrl": "https://oss.lanyun.net/private//cloud-maas/11564/16/2025-03-11/32206a67-5265-4db9-a0c8-081d38653943.mp4?X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=G54Tgw7wJRAKeBOej7Rz%2F20250311%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20250311T030018Z&X-Amz-Expires=86400&X-Amz-SignedHeaders=host&X-Amz-Signature=e3a77757c844412a6dfc24f1770b6a201041027eda8691f6493b28011927b539"
}
请求体(Request)参数
参数名称 类型 必填项 描述
Authorization string 必填 给定的API密钥
taskId string 必填 需要查询的任务ID。仅能查绚当前账号创建的任务。
返回(Response)参数
taskId string -- 需要查询的任务ID。仅能查绚当前账号创建的任务。
status string -- 任务状态,包括以下状态: Preparing-准备中 Queueing-队列中 Processing-生成中 Success-成功 Fail-失败
videoWidth -- -- 任务成功后,该字段将返回生成视频的横边像素数。
videoHeight -- -- 任务成功后,该字段将返回生成视频的竖边像素数。
videoDownLoadUrl -- -- 任务成功后,该字段将返回生成视频的临时下载地址。
相关推荐
Landy_Jay35 分钟前
深度学习:从零开始的DeepSeek-R1-Distill有监督微调训练实战(SFT)
人工智能·深度学习
淘小欣38 分钟前
10分钟打造专属AI助手:用ms-swift实现自我认知微调
开发语言·人工智能·ai·swift·模型微调
Y1nhl2 小时前
搜广推校招面经五十五
人工智能·python·深度学习·机器学习·广告算法·推荐算法·搜索算法
liufangshun5 小时前
【DeepSeekR1】怎样清除mssql的日志文件?
数据库·人工智能·sqlserver
深圳市快瞳科技有限公司5 小时前
AI鸟类识别技术革新生态监测:快瞳科技如何用“智慧之眼”守护自然?
人工智能·科技
ModelWhale5 小时前
和鲸科技受邀赴中国气象局气象干部培训学院湖南分院开展 DeepSeek 趋势下的人工智能技术应用专题培训
人工智能·科技
Fansv5875 小时前
深度学习框架PyTorch——从入门到精通(3)数据集和数据加载器
人工智能·pytorch·深度学习
Sunday_ding8 小时前
NLP 与常见的nlp应用
人工智能·自然语言处理
一ge科研小菜鸡8 小时前
当下主流 AI 模型对比:ChatGPT、DeepSeek、Grok 及其他前沿技术
人工智能
ai产品老杨8 小时前
全流程数字化管理的智慧物流开源了。
前端·javascript·vue.js·人工智能·安全