在亚马逊云科技上使用Luma AI Ray2视频模型生成炫酷视频 (下)

在过去不久的2025年1月16日,专注3D内容的模型供应商Luma AI推出了全新模型 - Luma Ray2,这是一款视频生成AI大模型,能够基于我们的文本指令生成逼真、连贯、炫酷的动态视频,拥有极强的视觉效果。Luma Ray2模型采用Luma AI最新的多模态架构进行训练,计算能力比Ray1提升了 10倍,每次调用能够生成时长5秒或9秒的高清视频,具备快速流畅的运镜、超真实的视频细节以及逻辑清晰的视频内容,支持540p和720p两种分辨率。

今天我们将介绍借助亚马逊云科技Amazon Bedrock上的Luma Ray2生成视频,在Bedrock上大家只需要通过简单的API调用,就可以为大家的生成式AI应用,集成添加高质量、逼真、可直接用于生产应用的视频内容。Luma Ray2可以深入理解人、动物和物体之间的交互,结合先进的自然语言理解和推理能力,创建连贯且符合物理规律的视频内容。

Ray2视频生成可以广泛应用于多样化的生活场景,如内容创作、娱乐、广告和媒体等,极大地简化从构思到完整视频的制作流程。大家可以通过该模型生成流畅、具有电影质感的运动画面,以契合大家希望通过镜头表达出的情绪,同时该模型可以自动快速切换不同的摄像机角度和风格,为建筑、时尚、影视、平面设计和音乐等领域提供创意性视频内容生成。

下面跟着小李哥一起来看看Luma发布的Ray2模型令人惊艳的视频生成效果~

在本系列的上篇中,我们介绍了如何在亚马逊云科技控制台上利用Amazon Bedrock配置参数、提示词生成视频的方案。在下篇中,我们将探索利用Ray2模型生成视频的更多场景,并介绍如何通过python代码调用Amazon Bedrock API生成视频。

利用Ray2模型生成视频的更多场景探索

以下是小李哥总结的其他利用Ray2模型生成视频的场景:

提示词1:一只迷你的小猫正在手指尖的表面上行走和探索

A miniature baby cat is walking and exploring on the surface of a fingertip


提示词2:一颗巨大的水球漂浮在背光的森林中

A massive orb of water floating in a backlit forest

提示词3:一个男人在吹奏萨克斯风(来源:@ziguratt)

A man plays saxophone

提示词4:蜜蜂授粉的微距特写

Macro closeup of a bee pollinating

如果大家想了解更多Ray2生成视频的场景和示例,大家可以到Luma Ray2官网页面查看。

如何通过Python SDK以API形式调用Luma Ray2模型生成视频?

我们在Amazon Bedrock控制台中就可以直接获取调用模型的API参数格式,我们选择**"View API request"** (查看 API 请求)获取对应的格式。大家还可以通过亚马逊云科技命令行界面(AWS CLI)和支持多语言的SDK访问该模型。Ray2模型ID为luma.ray-v2:0

通过AWS CLI生成

以下是通过AWS CLI命令行调用模型的示例:

bash 复制代码
aws bedrock-runtime start-async-invoke \
    --region us-west-2 \
    --model-id luma.ray-v2:0 \
    --model-input  "{ \"prompt\": \"a humpback whale swimming through space particles\", \"duration\":\"5s\", \"resolution\": \"540p\", \"aspect_ratio\":\"16:9\"}" \
    --output-data-config "{\"s3OutputDataConfig\": {\"s3Uri\": \"s3:\/\/testing-bucket-ais-region-us-west-2\/\"}}"

通过Python Boto3生成

大家还可以使用StartAsyncInvokeAPI操作,通过AWS SDK使用各种编程语言调用API生成视频,开发自己的生成式AI应用程序。

bash 复制代码
import boto3
import json

# 初始化 Amazon Bedrock 运行时客户端
client = boto3.client('bedrock-runtime', region_name='us-west-2')

# 设置模型 ID
model_id = 'luma.ray-v2:0'

# 定义模型输入
model_input = {
    "prompt": "a humpback whale swimming through space particles",
    "duration": "5s",
    "resolution": "540p",
    "aspect_ratio": "16:9"
}

# 定义输出数据配置
output_data_config = {
    "s3OutputDataConfig": {
        "s3Uri": "s3://testing-bucket-ais-region-us-west-2/"
    }
}

# 发起异步推理请求
response = client.start_async_invoke(
    modelId=model_id,
    modelInput=json.dumps(model_input),
    outputDataConfig=output_data_config
)

# 输出响应
print("异步推理请求已提交。")
print("请求ID:", response['id'])

备注:Luma Ray2视频模型现已正式在亚马逊云科技美国西部(俄勒冈)AWS 区域使用。

相关推荐
Work(沉淀版)1 小时前
DAY 40
人工智能·深度学习·机器学习
蓦然回首却已人去楼空2 小时前
Build a Large Language Model (From Scratch) 序章
人工智能·语言模型·自然语言处理
CM莫问2 小时前
<论文>(微软)WINA:用于加速大语言模型推理的权重感知神经元激活
人工智能·算法·语言模型·自然语言处理·大模型·推理加速
拾忆-eleven2 小时前
NLP学习路线图(二十六):自注意力机制
人工智能·深度学习
FreeBuf_2 小时前
最新研究揭示云端大语言模型防护机制的成效与缺陷
网络·安全·语言模型
MYH5163 小时前
在NLP文本处理中,将字符映射到阿拉伯数字(构建词汇表vocab)的核心目的和意义
人工智能·深度学习·自然语言处理
要努力啊啊啊3 小时前
KV Cache:大语言模型推理加速的核心机制详解
人工智能·语言模型·自然语言处理
mzlogin5 小时前
DIY|Mac 搭建 ESP-IDF 开发环境及编译小智 AI
人工智能
归去_来兮5 小时前
知识图谱技术概述
大数据·人工智能·知识图谱
就是有点傻5 小时前
VM图像处理之图像二值化
图像处理·人工智能·计算机视觉