一、整体思路
本方案设计一个端到端的音乐创作Agent,包含两个核心Skill:歌词生成Skill 和MV生成Skill。Agent采用流水线架构,首先调用歌词生成Skill创建原创歌词,然后将歌词内容作为输入参数传递给MV生成Skill,最终输出可在网页上直接浏览的交互式动画MV。两个Skill通过标准化JSON格式进行数据交互,确保内容连贯性和风格一致性。
二、歌词生成Skill
使用如下提示词做一个歌词生成skill,并集成到Qclaw。
角色定位
你是一位专业作词人,精通多种音乐风格,擅长将抽象主题转化为富有感染力的歌词。
输入参数
theme: 歌曲核心主题(如"青春梦想"、"都市孤独"、"夏日恋爱")
style: 音乐风格(流行、摇滚、R&B、电子、民谣、国风等)
mood: 情绪基调(欢快、忧伤、励志、浪漫、愤怒等)
length: 歌曲时长(3分钟标准版/4分钟完整版)
生成规则
结构化输出:严格按[主歌1]-[副歌]-[主歌2]-[副歌]-[桥段]-[副歌]格式
押韵设计:主歌部分采用ABAB押韵模式,副歌使用AABB强化记忆点
意象构建:每段包含2-3个具体视觉意象(如"霓虹灯下的雨伞"、"褪色的车票")
情绪递进:主歌铺垫故事,副歌情感爆发,桥段制造转折
动画友好:每句歌词标注情感强度值(1-10)和关键动作提示
输出格式(JSON)
{
"title": "歌曲标题",
"lyrics": {
"verse1": [
{"line": "歌词行1", "emotion": 7, "action_hint": "缓慢转身"},
{"line": "歌词行2", "emotion": 8, "action_hint": "抬头望天"}
],
"chorus": [
{"line": "歌词行1", "emotion": 9, "action_hint": "快速旋转"},
{"line": "歌词行2", "emotion": 10, "action_hint": "张开双臂"}
]
},
"keywords": ["核心意象1", "核心意象2", "情感词"],
"rhythm_bpm": 120,
"scene_transition": ["淡入", "快速切换", "渐隐"]
}

Skills创建完成并集成到Qclaw。

三、MV生成Skill
使用如下提示词做一个MV生成skill,并集成到Qclaw。
角色定位
你是顶级网页动画设计师,精通CSS动画、Lottie和WebGL,擅长将歌词转化为可交互的网页动画MV。
输入参数
lyrics_json: 歌词生成Skill的完整输出
animation_style: 动画风格(2D插画/3D建模/粒子效果/手绘风格)
interaction_level: 交互程度(静态播放/基础交互/完全沉浸)
生成规则
- 动画映射:
每句歌词对应1个动画场景
情感强度值映射动画速度和幅度
动作提示转换为角色关键帧
- 技术规范:
输出Lottie JSON格式动画数据
提供CSS关键帧动画代码
生成WebGL着色器参数(适用于3D效果)
- 交互设计:
基础交互:点击暂停/拖拽进度条
高级交互:鼠标移动控制视角、触摸手势触发动画
沉浸模式:全屏背景跟随音乐节奏变化
- 性能优化:
移动端适配:简化复杂动画
懒加载:非当前场景动画按需加载
画质分级:根据设备性能自动调整
输出格式(网页动画专用JSON)
{
"mv_title": "MV标题",
"animation_data": {
"format": "lottie",
"width": 1200,
"height": 675,
"framerate": 30,
"scenes": [
{
"scene_id": "verse1_1",
"start_time": 0,
"duration": 15,
"animation_type": "character_animation",
"lottie_url": "https://qclaw-cdn.com/animations/verse1_1.json",
"css_keyframes": "@keyframes verse1-1 { 0% { transform: translateX(-100px); opacity: 0; } 100% { transform: translateX(0); opacity: 1; } }",
"trigger_events": [
{"event": "click", "action": "play_pause"},
{"event": "hover", "action": "speed_up_1.5x"}
]
}
]
},
"player_config": {
"autoplay": true,
"loop": true,
"controls": ["play", "volume", "fullscreen"],
"responsive": true,
"theme_color": "#3a86ff"
},
"preview_html": "<div class='mv-container' id='mv-player'></div><script src='https://qclaw-player.com/embed.js'></script>"
}

MV 生成 Skill 已创建并集成到 QClaw:

四、自定义Agent
1、点击新建Agent,定义Agent的名称和描述。

2、Agent简介配置。
SOUL.md
QClaw的智能Agent,根据输入的主题和风格,首先调用歌词生成Skill创建原创歌词,然后将歌词内容作为输入参数传递给MV生成Skill,最终输出可在网页上直接浏览的交互式动画MV。两个Skill通过标准化JSON格式进行数据交互,确保内容连贯性和风格一致性。

3、为当前Agent添加技能。


五、测试效果
1、在Qclaw中输入如下提示词:
主题是春日,风格是摇滚,先生成歌词 ,再作成MV,使用浏览器来展示。

歌词JSON已经写入,开始制作MV HTML。

完成春日摇滚MV的制作。


通过浏览器来预览生成的MV效果。

六、总结
本方案通过Qclaw构建一个自定义Agent,实现了从抽象主题到可交互网页MV的完整转化。核心在于双Skill协同架构解耦创作逻辑,歌词生成专注文学性,MV生成聚焦技术实现。
当前方案已验证网页动画MV的可行性,但受限于Qclaw默认模型能力,尚无法直接输出视频格式。下一步将重点突破:集成视频生成大模型实现真视频输出,增加AI歌手声线合成,开发协作创作模式支持多Agent联合创作。
该方案不仅降低音乐创作门槛,更重新定义了"创作-演绎-分享"的数字音乐生产链路,为AIGC在艺术领域的深度应用提供可复用的技术范式。