Midjourney提示词进阶

Midjourney提示词进阶 - 魔法特效(法术、施法、光环、能量)

问-我如何获得施法、射击能量和施展魔法?

尝试正常写作。探索使用调用方法,如法师使青蛙附魔,以及描述方法,如魔法师对青蛙施放绿色闪光咒语。

⁠ 调用原型

如果它很顽固,并且你想尝试其他东西,那么从--v 3开始,然后再混音,以测试创造性。

我想是这样的:

1.️⃣ 为了让这个咒语看起来像是从施法者那里发出的,你必须用contains或growth from这样的单词来调用。这些召唤将施法者和他的咒语联系起来。

2.️⃣ 要想创造出一种特殊的效果,比如光轴或能量的摆动,你必须用你想要的形状的物理事物的单词来调用一般的形状,比如轴、矛或鞭。为了让它们看起来像是神奇的能量,可以将它们与其他单词结合起来,比如神奇的闪光轴或霓虹灯闪光鞭。为此发挥创意。

3.️⃣ 要使咒语看起来像是在去某个地方或做某事,请使用攻击或支配等词或其他有目标的攻击性单词,然后指定目标。我喜欢使用墙壁(随机),但这是另一个发挥创意的地方。

4.️⃣ 如果你想让你的施法者摆出动作密集的姿势,可以尝试添加动作镜头、动态姿势(一个或两个)。

现在,朝着你想要的样子滚动。(不要掷骰子。如果你的提示在3-5次掷骰子后不起作用,请修改它。)

火花和发光的光环也有助于构建具有"魔力/能量感"的东西

Midjourney提示词进阶 - 创建黑白线条漫画

Q-我如何为书页上色?(即黑白线条艺术)

事实是,即使有一个可靠的着色页面提示,着色页面的主题也可能在你得到的内容中发挥一些作用。要想看到这一点,请查看此推荐的着色页面模板(如下),以及它如何随着主题的变化而变化。

2d outline, simple vector monochrome coloring page depicting three children jumping in puddles in a park scene, on white background --ar 3:2

2d outline, simple vector monochrome coloring page depicting intricate tiger mandala, on white background --v 5

Midjourney提示词进阶 - 创建应用交互界面

问-我如何使用Midtravel制作UI/UX线框、模型和网站?

请记住键入/设置并选择[MJ Version 5](MJ版本5)。

下面是一个示例提示,让您开始使用。

屏幕截图,儿童词典网站的UI/UX设计线框::产品摄影::-0.3-ar 3:2------风格化1000------v 5

1.️⃣ 将字典网站替换为您正在模拟的屏幕类型,例如记录详细信息网站或图书馆搜索网站。我们建议你不要使用"应用程序"这个词,否则你会调出手机。

2.️⃣ 为孩子们更换相关的风格信息,如粗体和/或极简主义。探索,实验!

Midjourney提示词进阶 - 调色板图片

Q-如何创建调色板图像?(Create a Color Palette)

要创建调色板图像,请使用此模板:

>调色板,填充空白的配色方案`

例如

-调色板,舒适图书馆的配色方案------v5`

-调色板,黄昏马戏团的配色方案------v 5`

-调色板,雷暴的配色方案--v 5`

如果您想大致指导颜色,可以探索在提示的最后一段添加两种颜色。如果你添加更多,可能会出现混合。

调色板,阳光明媚的厨房的配色方案,薄荷绿和黄色的色调------v 5

如果你的颜色名称有其他含义,Midtravel可能会误解它。例如,"珊瑚粉"可能需要对"海"取负号,以避免显示真正的珊瑚。

例如:

调色板,日落的配色方案,珊瑚粉和海洋蓝的色调::海,海洋,水:-0.3 -v5

您将无法提供特定的颜色(即Pantone或Hexcode),也无法提供它们在调色板中的顺序,也无法显示它们在示例图像中的显示方式。

可以使用排列快速创建多个选项板。

>调色板,{一、二、三}的配色方案,{A色、B色、C色}的色调`

*这将产生所有可能的术语排列:*

调色板,一个的配色方案,色调的颜色-A-v 5

调色板,一个的配色方案,色调的颜色-B-v 5

调色板,一个的配色方案,颜色的阴影-C-v 5

调色板,两种颜色的配色方案,色调-A-v 5

调色板,两种颜色的配色方案,颜色的阴影-B-v5

调色板,两种颜色的配色方案,颜色的阴影-C-v 5

调色板,三种颜色的配色方案,色调-A-v 5

调色板,三种颜色的配色方案,色调的颜色-B-v 5

调色板,三种颜色的配色方案,颜色的阴影-C-v 5

例如:

调色板,{黄昏马戏团,早晨厨房,午夜森林}的配色方案,{深蓝色和银色,绿松石和金色,黑色和白色}-v 5

这些示例假定默认的纵横比、混乱和风格化。当您更改纵横比(`--ar X:Y`)或使用混乱(`--c N`)和样式化(`--s N`)时,您可能会注意到这些提示需要调整。

这一变化似乎有助于横向画布:

极简主义套装、调色板、旋转木马的配色方案------ar 3:2------v 5

有这些例子可以与社区分享

>有趣地使用调色板排列来生成网站主题。

`{科技网站,艺术网站,电子商务网站},配色方案为{蓝色和灰色,橙色和青色,深绿色和浅绿色},创意设计,简单的ui ux界面--ar 9:16-v 5`

技术网站,配色方案为,-蓝色和灰色色调 -橙色和青色 -深绿色和浅绿色
艺术网站,配色方案为,-蓝色和灰色色调 -橙色和青色 -深绿色和浅绿色
电子商务网站的配色方案为, -蓝色和灰色色调 -橙色和青色 -深绿色和浅绿色

Midjourney提示词进阶 - 使用原型

invoke方法是什么?什么是原型?我如何打破它们或调用它们?

如果在提示特定动作、姿势或场景时遇到问题,请考虑使用invoke方法。invoke方法说:不要描述它。调用它。

要调用图像,请用"原型"或"库存"角色、动作、姿势或场景来加强或替换描述。你的工作是调用原型,或者混合原型,或者打破原型。

不要从字面上描述细节。相反,用刻板印象、原型、陈词滥调来唤起细节。

❌ 一只嘴里叼着信封的小狗沿着街道走向邮箱

✅ 送信的小狗

❌ 一位戴着眼镜的中年妇女坐在一张桌子后面,桌子上摆满了书和一个苹果

✅ 一位教师坐在她的书桌旁

为什么invoke方法有效?

下面是聊天中简短解释的链接。

⁠即时常见问题⁠ 调用原型

下面是更多的例子。

不要这样说➡️ 改为说这个

拿着剑的人➡️ 剑客(或守护者,或战士,或...)

一个拿着剑的女人➡️ 女剑客

...用弓箭➡️ 男/女护林员

戴着眼镜,拿着苹果➡️ 教师

骑自行车➡️ 骑自行车的人

骑在马上➡️ 骑手

带着魔杖➡️ 魔术师

穿着商务套装➡️ 商人

喝一杯酒,和其他人交谈➡️ 混合

坐在桌子旁,手里拿着一堆扑克筹码➡️ 玩扑克

围着一张有粉色蛋糕和气球的桌子➡️ 生日聚会

具有任何非人类特征的人➡️ 类人的

有任何非猫特征的猫➡️ 猫科动物

打破原型时需要更多的力量?在提示中添加解锁词。

例如,具有任何非人类特征的人可能会被提示

蓝色皮肤的人形机器人

但更强大的调用可能是

一个拥有蓝色皮肤的人形,幻想艺术

这里的解锁词是幻想。

以下是invoke方法解决的一些难题:

你想要一只有三只眼睛的猫吗?典型的眼睛是成对的,而典型的猫有两只眼睛。你可能不得不为猫和眼睛调用一个不同的原型!试试一只有第三只眼睛的超现实猫,幻想艺术------v 5。看到解锁词了吗?记得使用 重新滚动、:vroll:vrolls和重新混合,以更接近您的愿景。

你想要玻璃做的船锚吗?原型锚不是由玻璃制成的。你可能需要找到一个可以由玻璃制成的原型。试试这个:一个船锚形状的玻璃雕塑。

为什么invoke方法有效?

这是我的看法。

1) 为了了解标记和像素放置规则之间的相关性,Midjourney研究了文本和图像之间的关系。当我们写文本时,我们倾向于调用而不是描述,因为相关性、丰富性和简洁性都是高度优先的。我们不希望我们的视障用户坐着看10秒长的文本。所以我们不太可能写,一个穿着皮裤、翻毛皮背心、格子衬衫、靴子和帽子的男人,手里拿着套索,靠在雪松篱笆上,周围是一群奶牛。我们更有可能这样写:在一个养牛场,一个牛仔靠在雪松篱笆上。这在很短的时间内会更加丰富。因此,当Midjourney学习如何制作图像时,它很可能已经学习了在alt文本中调用语言的传统。

2) 当我们在Midjourney的服务器上运行/想象作业时,每个作业的内存(比如RAM)有限,所以Midjourney实际上无法保留太多代币。相反,代币会变弱,和/或混合在一起,和/或者掉落。这意味着invoke方法在技术上更高效。简单地说,牛仔比一个穿着皮裤、翻毛皮背心、格子衬衫、靴子和帽子、拿着套索的男人记忆力差。这意味着Midjourney可以处理得更好。

invoke方法的缺点是无法在第一个想象中指定细节。你的牛仔可能不会穿上你想要的格子衬衫。但这正是Midjourney的其他功能所在,尤其是remix。一旦你有了牛仔,你就可以使用混音工作流程来添加、删除或修改细节。这需要一些时间,但它更有可能为您提供所需的控制,因为它尊重Midjourney当前的限制。

希望这能有所帮助!

一旦你调用了一个原型,你就可以使用remix来用你想的任何东西来替换它的部分。

Midjourney提示词进阶 - 负向权重

问-有没有办法不在我的图片中包含某些内容?(--不,不,负权重)

有两种方法可以确保图像中不会出现内容。

参数:--否

对于初学者来说,它很容易使用,但没有提供太多的控制。

在提示的最后,为不想包含的内容添加--no word,word,word。

负权重值::-0.5

提供最大限度的控制。

在提示中的任何位置,添加单词、单词、单词::-0.5(也称为手动加权)

:运输:

我想有人站在雨中,但Midtravel一直给他一把伞。

✅ 这会有所帮助:一个浑身湿透的年轻人站在倾盆大雨中------没有雨伞

✅ 这会有所帮助:一个浑身湿透的年轻人站在倾盆大雨中::雨伞::-0.5

❌ 这无济于事:一个浑身湿透、没有雨伞的年轻人站在倾盆大雨中

❓ Q-有时我会遇到一个错误,说"所有权重的总和必须是正的。"我该如何解决它?

如果提示作为一个整体的值为零或更小,那么Midtravel就不起作用,所以我们需要做一些数学运算,以确保我们所有的权重(无论是手动的还是来自--no的)最终加起来都是正值。数学不是每个人都喜欢的东西,但下面是它的工作原理。。。

在本例中,数学表达式为1减去0.5=.5✅

沙漠景观------没有人、植物、动物

沙漠景观::人、植物、动物::-0.5

但在这个例子中,数学表达式是1减去0.5减去0.5减去0.5=-.5❌

沙漠景观------没有人------没有植物------没有动物

沙漠景观::人:-0.5植物:-0.5动物:-0.5

使用负权重来控制Midtravel对您的图像的"来源"。

负权重不仅仅是去除一些东西。还有一个概念是控制对你生成的图像的无形影响。

我们已经知道,数据集中的某些相关性会造成模糊、不连贯和其他问题。这些通常是与非摄影和非艺术内容的相关性,如屏幕截图、帮助文件、横幅广告等。

负权重的一个用途是减少那些无益相关性的典型"无形"影响。它能帮多少忙?好吧,试一下,即使看起来你不需要这么做,看看你的想法。该技术显著改变了一些提示。

下面是一个示例/模型/模板,让您开始使用:

摄影,[主题和设置],散焦,明暗对照,柔和照明::广告,广告,文本,用户界面,描述,名称,单词,字母,杂志,标题,标题,标签,签名,海报,公告,徽标:-0.5

-photoshoot这个词会使输出具有摄影质量,所以如果你正在寻找绘画风格的东西,请将其删除。

-bokeh、明暗对照、柔和的灯光会产生柔和的闪烁效果,所以如果你不想要这种外观,就用其他东西代替它。

负权重短语是最酷的部分。它努力减少非摄影和非艺术相关性的影响。(你不想在负加权提示段中创建一个庞大的术语列表,因为列表越长,每个令牌的影响就越弱。明智地选择, .)

你不必按原样使用这个提示,但你可以尝试这个概念来设计你自己的版本。用负权重来减少哪些其他"看不见的"影响可能很有趣?

玩得开心,但要注意不要让提示的总重量低于0.05,除非你喜欢事情变得混乱。

Midjourney提示词进阶 - 修改/外扩示例

我可以在中途进行修补或外涂吗?(有点!这叫脚手架!)

请记住键入/设置并选择[MJ Version 5](MJ版本5)。

如果你的图像参考是简单、平坦、颜色有限的,那么它可以充当诸如修复和外涂之类的脚手架。这些平面区域将被大致识别为前景和背景元素,Midtravel将使用这些区域来表达您的文本提示。效果不会非常可控,但你可以尝试一下。你想滚动浏览这个常见问题解答下面的聊天,看看一些有用的例子。

Midjourney提示词进阶 - 创建徽标图标贴纸

如何制作贴纸、模切、矢量图形、平面插图、徽标?

最好的策略是直接的策略。

使用--v 4和--v 5,您可以使用简单的语言:

  • sticker of
  • collection of many stickers
  • icon of or icon set of
  • shape/style logo of (or sigil or emblem or crest)
  • flat illustration of
  • Vector graphic, simplified flat art vector image of
  • 2d flat illustration
  • 2d anything

这是"明显提示"可能是正确提示的领域之一。

如果您的徽标上出现不需要的文字,请尝试以下技巧: --no text

对于那些想知道如何打造"孟菲斯企业风格"的人

使用以下一种或多种风格(孟菲斯公司风格、阿莱格里亚风格、环球风格、大型科技艺术风格)

Midjourney提示词进阶 - 拍照(实物模型)

问-我如何制作自己的参考图像或实物模型?什么是拍照?

Photobashing是一种用于数字艺术和插图的技术,将多张照片中的元素组合在一起,创建一个新的图像。拍照不一定要花哨,尤其是如果你要用实物模型来引导Midjourney制作更精致的最终图像。

请参阅下面的聊天,了解如何在外部工具中快速混合两个图像,为Midjourney创建一个粗略的模型,使其完美完成。

你需要一个自己喜欢的外部照片编辑工具,可以将一张照片的部分复制粘贴到另一张照片上。

在这个例子中,我们将自拍中的人脸添加到与名人的肖像中。你可以随心所欲地使用这种技术。

1.️⃣ 将名人图片(图片1)和自拍脸(图片2)打开到图片软件中,您可以从一张图片中选择、复制和粘贴到另一张图片。

名人形象:

2.️⃣ 使用你最喜欢的选择方法(比如套索工具)从自拍中抓取人脸,并将其粘贴到名人照片上。将图像展平,使其仅为一层。将其另存为png、jpg或gif。

3.️⃣ 将生成的图像添加到Discord并"打开原始图像"以从浏览器获取URL,或右键单击以获取媒体链接。(不要抓取消息链接。)如果你不确定如何完成这一步,请浏览本线程中的说明

4.️⃣ 现在使用URL作为图像参考,同时使用描述最终图像的文本提示。你必须包括一个主题,当然还有你想在游戏中看到的任何风格的单词。

5.️⃣ 尝试重新滚动、变体和提示调整,直到得到所需的结果。记住,Midjourney只会创造出一个粗略的相似之处。

照片和MJ结果的例子

请求:沙漠场景中的建筑(图2)

步骤1:提示一个背景------一个美丽如画的沙漠,有绿洲和棕榈树------v 5(图1)

步骤2:使用Photoshop或类似工具>魔杖工具>点击白色背景并按下删除键删除背景,使其透明,复制并粘贴在沙漠场景上(图3)

步骤3:使用/混合将生成的图像(图像3)和单独的建筑混合在一起(图像2)

来自/混合的输出(图像4)

Midjourney提示词进阶 - 创建翻转书动画

如何创建一个简单的翻转书风格的动画?(突变提示)

你可以使用中途排列和你最喜欢的视频或GIF工具创建一个简单的翻转书风格的动画。如果没有后期制作的帮助,原始动画将不会流畅或稳定,但一些创意人士发现这些动画有趣且有价值。

点击此处阅读更多信息:⁠ {置换}

对于翻转书本,请遵循以下概念步骤:

1.️⃣ 首先,考虑受试者的"之前"和"之后"条件。例如,一朵美丽的花逐渐枯萎,或者一片阳光明媚的森林景观逐渐变暗到黄昏。

将这两个条件排列成简单的相反提示:

一朵盛开的玫瑰

一朵死玫瑰

阳光明媚的森林景观

黄昏的森林景观

2.️⃣ 接下来,创建一个排列模板,该模板改变这两个短语的各自权重,使得一个短语具有显著更高的权重,然后它们共享相同的权重,那么另一个短语则具有显著更大的权重。

你可以选择对构图进行种子锁定,使其在与--seed N的想象中保持一定的一致性。你可以选择添加-c 0来减少混乱,和/或添加-s 1000来最大限度地发挥Midtravel房屋风格的稳定效果。

一朵盛开的玫瑰::{0.1,0.5,1.0}一朵枯萎的玫瑰:{1.0,0.5,0.1}------种子999999------v 5

这将产生你的术语的每一个可能的排列:

一朵盛开的玫瑰:0.1一朵枯萎的玫瑰::1.0------种子999999------v 5

一朵盛开的玫瑰:0.1一朵枯萎的玫瑰::0.5------种子999999------v 5

一朵盛开的玫瑰::0.1一朵死玫瑰::0.1--种子999999--v5

一朵盛开的玫瑰:0.5一朵枯萎的玫瑰::1.0------种子999999------v 5

一朵盛开的玫瑰:0.5一朵枯萎的玫瑰::0.5------种子999999------v 5

一朵盛开的玫瑰:0.5一朵枯萎的玫瑰:0.1------种子999999------v 5

一朵盛开的玫瑰::1.0一朵枯萎的玫瑰:------1.0------种子999999------v 5

一朵盛开的玫瑰::1.0一朵枯萎的玫瑰:0.5------种子999999------v 5

一朵盛开的玫瑰::1.0一朵枯萎的玫瑰:0.1------种子999999------v 5

虽然输出不会按顺序排列,但这些可能是可以在动画中使用的帧。如果希望帧之间有更细微的差异,请减少权重的差异。对于从一帧到另一帧更明显的步骤,请增加权重之间的差异。这包括设置负权重。

一朵盛开的玫瑰::{-0.5,0.5,1.5}一朵枯萎的玫瑰:

当然,你不需要局限于这些例子!这些都是故意简单的,只是为了让你思考。尝试使用权重和单词的创造性排列,以各种不同的方式推动你的作文。

3.️⃣ 最后,将各个帧放入您最喜欢的视频或GIF制作工具中,以创建动画。根据需要使用工具的功能来创建有趣的过渡、效果和持续时间。回到Midtravel创建任何缺失的框架。

具有风格的过渡。使用排列从图解到摄影的景观过渡。

有山、森林和河流的景观,深橙色和品红色,浅蓝色和琥珀色,日落,戏剧性的照明,景观插图:2{摄影::{-1,-.875,-.75,-.625,-.5,-.375,-.25},有山\、森林\和河流\的景观,暗橙色和品黄色\,浅蓝色和琥珀色\,日落\,戏剧性的灯光\,景观摄影:{1,1.5,2,2.5,3.25,3.75,4.5}}

-有山脉、森林和河流的景观,深橙色和品红色,浅蓝色和琥珀色,日落,引人注目的灯光,景观插图:2

--{摄影::{-1,-.875,-.75,-.625,-.5,-.375,-.25},

--有山脉、森林和河流的景观,深橙色和品红色,浅蓝色和琥珀色,日落,戏剧性的照明,景观摄影:{1,1.5,2,2.5,3.25,3.75,4.5}}

Midjourney提示词进阶 - 不同标点符号的区别

逗号、句号、加号等标点符号有区别吗?

✅ 建议:在Midjourney中使用标点符号,就像你在学校学到的那样!✏️

也就是说,对于故障排除或解决问题,以下信息可能很有用。

Midjourney唯一能理解的标点符号:双连字符、双冒号、花括号、空格

双连字符(也称为短划线)分隔参数--第9:16页

双冒号分隔整数(正数和负数)作为权重。::-0.5

花括号{}用于排列

空格被用作分隔标记的实际字符。

⁠ {}

那[]呢?<>怎么办?()呢?如果标点符号不在上面的列表中,那么它就不起作用了。这是噪音。这是一种有趣的噪音。噪波是雕刻图像的一种迷人工具。不,这并不意味着人类认为它意味着什么,但它绝对是艺术工具箱的一部分。[]、<>、()有什么作用吗?答案是他们正在做一些事情( ) 但我们唯一能描述它的方式是"有趣的噪音"

Midjourney没有被编程为知道逗号或连字符的任何特殊之处,但由于人类使用它们,我们建议在提示中使用它们。它们在数据集中可能具有良好的相关性。

建议正确使用逗号,以帮助人类理解自己的令牌分组,就像在普通写作中一样。不,Midjourney不知道逗号是什么,但人类知道,我们发现在提示中使用逗号的人类似乎有更好的提示时间。(从技术上讲,你可以使用任何你喜欢的字符,但逗号是有意义的,因此可能会更好地关联。)

Ornate shadowed massive sentient➡️ 这样写可能会有所改进➡️ Ornate, shadowed, massive, sentient

有时,在进行故障排除时,连字符可能会增加标记之间的关系。连字符有语法意义,它们被人类使用,因此可能有助于相关性。

所以::是提示中唯一的"官方"中断,但逗号、加号、管道也都有一些(小)影响。没有什么是一致的,但在某些情况下,一个可能比另一个更好。

这是我不久前做的一个测试:

Red panda 清楚地显示了这个名字的动物。

Red, panda把它们分开一点(一只红发的红熊猫)

Red:: panda 给一只红色的熊猫

Red:: panda:: ---no red panda 更清楚地是一只红色的熊猫(而不是一只红大熊猫)

更多的实验使这一点有点失败。实验的输出有差异。。。根据你使用的算法、设置的参数以及标点符号使用的单词生成。。。就像'red panda'已经是一种东西了,'iron lung'也是。。。所以测试已经失败了。如果你尝试'lunch box',你也会处于同样的位置。你必须尝试'fish wrench' 或 'pizza telephone'才能获得控制权,然后我们就无法就效果达成一致,因为披萨+电话是什么样子的?

因此,为了尝试将所有这些打包成可用的东西,常见问题解答将具有编程意义的标点符号与其他所有标点符号分开。""其他一切"都可以用短语"有趣的噪音"来表达,因为很明显,有些事情正在发生,即使还没有设计实验来告诉我们它是什么。在对提示符进行故障排除时,使用有趣的噪音显然是值得的,因为这可能是解锁你想要的东西的诀窍。

噪音是雕刻图像的一种迷人工具。不,这并不意味着人类认为它意味着什么,但它绝对是艺术工具箱的一部分。

Midjourney提示词进阶 - 创建空白背景

如何获得空白背景?如何在空白背景上隔离对象?

您可以尝试在提示中添加"在白纸上隔离"或"在白色背景上隔离"。

例如:

描绘龙的盾徽,孤立在白色背景上--v5

你可以用你喜欢的任何颜色代替白色。

在这里,白色是很强大的,请注意,如果你改为单独摆姿势或跳舞,白色仍然会发挥作用。权力的另一个位置是在白色的另一边,比如在白纸上、白色背景上或白色沙发上

在%color%上使用单词似乎可以更好地处理颜色

当你说染色-%color%时,还有另一个亮点,这有助于Midjourney打破在训练中学到的典型颜色。所以紫色猫不如染色的紫色猫可靠,最强的猫用染色的紫色猫科动物两次打破了原型

它确实有效,但很多事情都在同时进行,所以解锁不是一件容易的事情。

单词选择(你说的是白湖上的狗还是白纸上的蓝------)

文字强度:背景和背景在白纸或白纸上效果不佳,尽管输出看起来可能完全一样:ablobshrug:

在一个组合和排列的世界里,当一切最终协同工作时,有时感觉就像中了彩票

我的技术被称为DDNDD或DoubleDotNegateDoubleDot

避免背景或特定关键字的成功率高。

考虑到我们不想要背景的地方?

主题::4简短描述,同义词::3背景,白色背景::2雪,背景::-2

::2告诉mj我们不想要背景,我们想要白色背景。

但白色背景的问题过于笼统和抽象,可能是:天空、云、雪。。。。

我在白色背景的树上

Midjourney提示词进阶 - 在图片上写字

如何使用图像参考来制作文本?

请记住键入/设置并选择[MJ Version 5](MJ版本5)。

这里描述的步骤可以帮助您,但要注意,这很容易需要20-50代或更多代人。这不适合胆小的人,也不适合那些想节省GPU时间的人,而且在中途可能需要一个小时。将其与Adobe Express等免费外部工具中的5分钟进行比较

为了实现文本,我们通常需要在中途版本之间切换。这意味着有时打开Remix,其余时间关闭它,以便您的:vroll:vrolls(变体)正常工作。

--v5可以使事情变得连贯

--v3可以帮助修复拼写

--testp可以帮助将文本转换为定义明确的字母,但也经常拼写错误。

放大可能仍然会破坏拼写。放大多次,直到你得到一个看起来正确的。

以下是使用图像引用生成文本的步骤:

1.️⃣ - 制作单词的参考图像。最好是简单的字体,全部大写,字母之间留有空格。可以只是MS Word的屏幕截图。

2.️⃣ - 提示时将其作为参考图像上传。示例提示:

文字徽标"YOUR WORD"三维技术徽标--c 60

3.️⃣ - 要获得各种各样的想法,请添加-c 60或类似内容(在此处阅读更多信息:⁠ 参数:-c、-s、-style...)

4.️⃣ - 看到这个词在第四版中将是胡言乱语。当字母的形状和数量看起来最终可能是正确的时,打开混音,并使用混音将提示从-v4更改为-v3。冲洗并重复,直到--v3修复拼写。这可能需要一分钟或一个小时。这就是为什么我们不建议在中途制作文本。

5.️⃣ - 当拼写正确时,再次混音--testp或直接混音到--v4。现在重复任何一个步骤,直到拼写再次正确,因为你这样做的时候可能会出错。

6.️⃣ - 如果你的拼写看起来不错,现在你可以稍微轻推一下提示了。在关键词中添加3d,将形状轻推成猫。。。任何不会破坏拼写或设计的东西。你可以随心所欲地进行实验。最好关闭混音,这样你就可以正常运行变体。最终输出可能需要多次放大才能保持正确的拼写。

Midjourney提示词进阶 - 创建艺术字母

如何创建排版设计?(V5提示)

想要一个发光的字母(或者两个)而不是一个完整的单词吗?

请记住键入/设置并选择[MJ Version 5](MJ版本5)。

对于有趣的装饰字母,我们推荐一种脚手架方法,该方法通过创建模糊的起始图像并将其作为remix的基础来工作。这对一些人来说很有趣,因为它不需要任何外部工具。按照4️⃣ 下面的四个步骤来创建一个发光的印刷字母。

超级用户会注意到,这种脚手架和remix方法可以用来做各种事情,而不仅仅是排版。期待看到你能创造什么!

1.️⃣ 你的第一个/想象应该是这样的。请注意添加了--stop 15和--styleize 0。

Typography design, capital letter "T" decorated in floral vines, isolated on a white background --stylize 0 --v 5 --stop 15

2.️⃣ 接下来,选择并提升一个明确的候选人:

3.️⃣ 现在,重新混合你的高档产品以去除------停止15。请确保保留--styleize 0。

Typography design, capital letter "T" decorated in floral vines, isolated on a white background --stylize 0 --v 5

4.️⃣ 最后,选择并重新混合另一个清晰的候选者,但这一次,不对提示进行任何更改。[你可能想做两次。这取决于你的结果。]

Typography design, capital letter "T" decorated in floral vines, isolated on a white background --stylize 0 --v 5

➡️ 如果没有这个方法,下面是直接/想象提示的样子。没有remix技巧就很接近了,但有了remix技巧就更清晰了。

字体设计,大写字母"T"用花藤装饰,孤立在白色背景上------风格化0-v5

Midjourney提示词进阶 - 创建道具(握持、挥舞、携带)

如何让我的角色拿着东西?(武器、魔杖、书籍、物品)

让我们以武器为例,因为这是经常被问到的问题。

这一切都是为了让Midjourney去做。你可能会写一个提示,就像一个穿着皮草、拿着木棒的男人。这种提示方法被称为"描述"。另一种方法叫做"调用"。这时你会援引角色的刻板印象,让米奇来决定剩下的。什么是穿着皮草和皮革的男人?野蛮人?举个例子,假设他是个野蛮人。为了援引他的话,我会说出他的刻板印象,只对他进行最低限度的描述。米奇会做剩下的。

魔兽世界人物肖像,一个部落野蛮人,带着巨大的木棒,串珠绒面靴子,大腿纹身,2D游戏艺术,概念艺术,迪士尼,皮克斯,ArtGerm,查理·鲍沃特--ar 2:3--niji

拥有武器的原型(刻板印象、陈词滥调)自然会持有武器。

骑士、剑客、守护者、野蛮人、弓箭手、游侠、土匪、武士等。

有魔杖的原型(刻板印象、陈词滥调)自然会持有魔杖。

法师、魔术师、巫师、女巫、术士等。

通常有书的原型自然也会有书:

图书馆员、教师、学者、教授等。

所以这个想法是通过提示中的原型/原型来调用模型,并让原型做所有的工作来调用他们所持有的东西。你的提示可能甚至不必包括拿着它,因为原型总是被描绘成拿着它!在其他情况下,你可以通过提及它来强化它的外观。

⭐ 注意:我的提示中有多少是关于风格的:魔兽世界人物肖像和2D游戏艺术、概念艺术、迪士尼、皮克斯、ArtGerm、查理·鲍沃特。这是因为我希望能够在很多角色中一次又一次地获得这种风格。如果我不知道具体的风格,Midjourney会为我做一个,我可能无法复制它。如果我控制了风格,我可以复制它。:blobpraise:

❓问:这样做了,但我的角色似乎拿着某种东西,而不是我指定的对象。

这意味着是时候学习滑块方法了!这是当你在主提示中用一个确切的短语创建一个提示,并给它一个虚拟的"滑块"

Midjourney提示词进阶 - 创建照片

如何获取照片?(照片、摄影、逼真)

有几种非常基本的方法可以从v4中获取照片图像和/或在v5中将非照片图像转换为照片真实感。

在--v 5中,第一个技巧是使用--s 0将--styleize设置为0,以确保获得v5默认照片样式的全部好处。

另请参阅:⁠ 参数:-c、-s、-style...

除上述方法外,还可以添加其中一种方法。

1.️⃣ 找一位知名摄影师。

[主题]由[摄影师]拍摄--v 5--s 0

[摄影师]风格的[主题]--v 5--s 0

2.️⃣ 引用照片输出样式。例子包括全彩摄影或电影静态镜头。您可以选择通过添加电影和胶片等摄影媒体来加强这一点。

电影静止镜头,[主题],在[电影标题]中--v 5--s 0

电影静态镜头,[主题],导演[名称]--v 5-s 0

3.️⃣ 使用权重来去除你不想要的艺术品质,或者强调那些你想要的品质。

全彩摄影,一只狗睡在门廊上::数字绘画::-0.5-v5-s0

宝丽来摄影::1.5我的狗的宝丽来照片--v5-s0

⚠️ 注意:由于v4&v5中的自然语言处理(NLP)元素,相机单词可能无法按预期工作:

命名相机类型或镜头(名词)实际上可能会把相机或相机镜头放进你的作品中。

使用像照片或照片这样的词(名词)可以呈现出一张镶框的照片或照片。

或它们将按预期工作。

❌ 避免使用超写实、超写实、写实、照片真实感、照片真实主义等风格短语,这些短语被艺术家用来描述模仿照片的绘画风格。它们看起来可能有效,但在进行故障排除时,我们经常发现它们有问题。

❌ 避免使用CGI中的风格短语,如Render、Octane Render、Unreal Engine、hd、4k、6k、8k和其他术语,除非你希望你的照片具有景深和/或倾斜偏移效果。

这是一个很酷的尝试。将FictionalSource拍摄的照片添加到提示的末尾,以获得有趣的效果。例如,由皮卡丘拍摄或由DramaDramaMedia拍摄。

--v5负面提示有时有助于提高照片的逼真度(真实感)。给这样的短语一个小的负权重可以引导Midtravel选择与这些术语相关性较低的细节和组成规则。你也可以在主提示中添加短语,比如偷拍,甚至糟糕的照片。创造性地思考并探索各种可能性

ad, advertisement, text, ui, descriptions, names, words, letters, magazine, titles, captions, labels, signatures, poster, announcement, logo::-0.3

如果你想要看起来很老的复古照片,请将提示的焦点转移到照片上,而不是主题上,如下所示:

An old 1960s vintage photograph album depicting a parked car in front of a house --ar 3:2 --v 5

Midjourney提示词进阶 - 脚手架技术

什么是中途搭脚手架?

脚手架是一种利用现有图像的结构来创建新图像的技术。你从一个基本的图像开始,它有一些你喜欢的构图元素。然后,通过提示和一些 重新滚动。

您可以从设备上传起始图像,也可以在Midjourney中创建。如果你在Midjourney中创建它,你可以使用"remix"功能将基本图像的构图转换为最终图像。Remix将原始图像视为一个框架,根据您对隐喻的偏好进行构建、绘制或绘制。 在再混合之后, 重新滚动并使用:vroll:variations来追逐所需的图像。

脚手架是一种引导你脑海中最终图像的结构或构图的方式。从构图指导图像(基础)开始,然后使用提示和参数添加所需的细节。基本图像成为提示的组成基础或脚手架。

Midjourney提示词进阶 - 常见问题汇总

为提示词构建模板

这不是硬性规定,但是可以作为改进提示词的基础。

Midjourney --v 5 模板

Midjourney --v 4 模板

Midjourney --v 3模板

带有权重的提示词,也是一样。

介词短语不可靠,因此请尝试使用这些其他方法

✅使用形容词-名词词序来代替介词短语。

用令人回味的形容词代替介词短语。

  • "头发随风飘扬"➡️"飘逸的头发"
  • "夕阳色的眼睛"➡️"夕阳色的眼睛"
  • "胡萝卜换鼻子"➡️"胡萝卜鼻子"

✅使用非常具体的动词来代替介词短语。

用令人回味的动词代替含糊的介词短语*。*

  • "一个带手电筒的女孩"➡️"一个使用手电筒的女孩"
  • "一个拿着蛋糕的女孩"➡️"一个吃蛋糕的女孩"
  • "悲伤的女孩"➡️"悲伤的女孩"或"悲伤的女孩"或"沮丧的女孩"
  • "一个脸上挂着灿烂笑容的女孩"➡️"微笑的女孩"或"快乐的女孩"
  • "一把剑在它的身边"➡️"一把被丢弃的剑"

✅使用非常具体的词汇来代替介词短语。

当您用具体的词替换含糊的词时,您可能会看到改进的结果*。*

  • "一个女孩在森林里睡觉" ➡️ "森林庇护着一个熟睡的女孩"
  • "走在飞船上的女孩"➡️"飞船走廊里有一个大步走来的女孩"
  • "带反曲弓的少女"➡️"带反曲弓的女游侠"

✅尝试颠倒细节的顺序。

这种方法可以调整 Midge 的焦点,并可能增加连贯性*。*

  • "池塘倒映彩虹"➡️"池塘倒映彩虹"
  • "一只蜜蜂盘旋在一朵花上"➡️"一只蜜蜂拜访了一朵花"
  • "船上的风暴"➡️"受到风暴威胁的船"
  • "装满蓝莓的篮子"➡️"装在篮子里的蓝莓"

✅尽量减少冗余。

寻找你的形容词已经融入其中的地方。消除标记会减少组合结果的数量,这可能会增加连贯性。

  • "黑曜石"➡️"黑曜石"(已经是黑色的)
  • "botanical plants" ➡️ "botanicals"(已经是植物)或"plants"(已经是植物)

✅抓住每一个机会提高特异性。

使用带有您想要查看的内容的角色/上下文的词语。带有更多"包袱"的词会为你做更多的工作。使用原型或常用字符。

  • 戴着眼镜拿着苹果➡️老师
  • 戴着带灯的黄色帽子➡️消防员(还是矿工?)
  • 骑自行车➡️骑车人
  • 在马上➡️骑手
  • 穿着婚纱➡️新娘
  • 短发男童装➡️假小子
  • 拿着大礼帽和魔术棒➡️一个魔术师
  • 喝一杯酒和其他人聊天➡️交流
  • 坐在桌前一堆扑克筹码拿着牌➡️打扑克
  • 围着一张桌子放着粉色蛋糕和气球➡️生日派对

提示词可能需要多次机会来表达自己。

如果只使用/imagine 一次并停在第一个格子上,那么提示词只有一次机会来表达自己。"一次机会"在组合和排列的系统中效果不佳。需要给提示不止一次机会。

进行网格选择以将其引导至你想要的外观 (vrolls),或者,如果不喜欢所有选项, ️重新滚动整个网格。

在 3-5 次 ️ 刷新或 vroll 之后,如果发现一切还是不对劲,那么终于到了对提示文本进行故障排除并重新开始的时候了。

质量有时很重要。

当--quality命令可用时,您可能会考虑使用更高的值。当您使用更高的质量值时,您将允许 Midge 在 GPU 烤箱中"烘烤"东西更长时间。它正在花费您的 GPU 时间。您花费的 GPU 分钟数越多,输出的质量就越好。不是美学质量,而是技术质量。如果你的提示可以产生最好的是不连贯的垃圾,你会看到最高技术质量的不连贯垃圾。

标点符号确实很重要,但有点,但不是,但是是的,但不是。

嘿!只需按照您在学校学到的方式在 Midjourney 中使用标点符号即可。好的,就是说,在排除故障或解决问题时,以下信息可能会有用。

  • 只有三种标点符号类型具有任何编程效果。
  • 双连字符分隔参数。------看点9:16
  • 双冒号分隔权重的整数(正负)。::-0.5
  • 空格被用作分隔标记的实际噪声,因此实际上是特殊噪声。
  • 从字面上看,所有其他标点符号只不过是增加了有趣的噪音。
  • 所有标点符号都增加了我们所说的*"有趣的噪音"。*
  • 有时,逗号噪音和连字符噪音可能是有用的噪音。
  • 建议正确 使用逗号以帮助分组,就像在普通写作中一样。
  • "华丽的阴影大量有知觉" ➡️ "华丽,阴影,巨大,有知觉"
  • 有时,在进行故障排除时,连字符可能会 增加标记之间的关系。
  • "古董黄铜烛台" ➡️"黄铜古董烛台"

使用权重(双冒号)来创建一些特殊效果。

你好。在本节中,我将向您展示如何处理场景和主题, 但这只是因为使用权重创建主题和场景是学习权重的一种有趣方式。

创建主题

  1. 找到您感兴趣的主题词,例如:友谊、恐惧、安全、希望、战争、浪漫、毁灭、英雄主义、沉默、心碎、虚荣、青春、未来主义、机器人、太空歌剧、神秘等。
  2. 用主题介绍你的提示,并根据你希望看到主题在你的其余视觉中饱和的程度来加权(建议值为 1-3),然后像往常一样写你的提示。
  3. 主题将遍及提示。以此提示为例,然后制作您自己的提示。

Sentience::3 这是一张在繁忙的城市夜晚氛围中,野兽派建筑的墙壁上外部布线和管道混乱的照片。颜色以午夜蓝和橡木棕为主。--ar 5:9

创建设置/场景/背景

  1. 设想一个背景或环境,并用 3-5 个词描述它,例如:"午夜森林空地" 或*"俯瞰大海的悬崖"。*
  2. 用描述介绍您的提示并对其进行加权,以帮助它与提示的其余部分竞争(建议值为 1-3)。
  3. 它就像一个"舞台",您的提示的其余部分将在其上呈现。尝试将这些提示作为示例,然后制作您自己的提示。

暮光之城,老式咖啡馆::1.5 时髦女性,蓝眼睛,长长的飘逸的棕色头发,身着花卉背心和牛仔裤,照片级逼真的边到边印花,风格为 Joe Ranft、Tom Ruegger、John Canemaker、Atelier Lulua --亚 5:7

多雨被遗忘的丛林遗址:: 两位老年男性探险家争论信用卡、季风气氛、乔·兰夫特、汤姆·鲁格、约翰·坎梅克、Atelier Lulua 风格的逼真边到边印刷品 --ar 5:7

负向权重

中途根据事物最主要的标准特征来定义事物。偏离标准意味着 Midjourney 不再认可它。调用破坏其原型的对象的一种方法是找出允许它使用的令牌。例如,你不能得到"一个绿色皮肤的女人",但你可以得到"一个绿色皮肤的女性人形生物 ",因为对于 Midjourney,"女人"不能拥有人类原型的绿色皮肤,而是人形生物根据非人类原型,可以拥有绿色皮肤。

另一个打破原型的好方法是使用负权重。您可能需要使用负权重来对抗刻板印象。例如,如果您正在努力为某些东西赋予"非标准"特征,您可以尝试为您不想看到的特征赋予负权重。

在下面的这个例子中,我们想给猫一个非标准的第三只眼。我们允许 Midge 通过用"felinoid"替换"猫"原型来添加第三只眼,并通过给"两只眼睛"负权重来引导 Midge 远离两只眼睛。尝试这样的东西,了解它如何帮助你。

第三只眼,类猫科动物::1 两只眼睛::-0.5

使用类似句子的片段,而不是单词列表。

在--v 5中,写成类似句子的片段,而不是单词列表。"一个年轻的女人走过校园"比"女人,年轻,走路,校园" 更有效。

风格你的艺术,让它成为你自己的。

在--v 5中,要生成摄影图像以外的内容,您需要参考艺术运动、艺术技巧、流派、媒体类型、游戏名称、导演、艺术家姓名、影响、时间段等*。*

要调用图像的美学风格,请尝试引用 其中的++两个或多个:++

  • 艺术运动: 识别提示中的艺术运动将介绍其风格和技巧。例子包括印象派、超现实主义或波普艺术。
  • 媒体类型: 识别图像的媒体将决定其美感。示例包括摄影、插图、漫画、概念艺术、故事板、雕塑等。
  • 媒体标题: - 识别媒体影响将影响其外观。例如,来自《千与千寻》或《绿野仙踪》或《席德梅尔的文明》或电子游戏《决斗》。
  • 艺术家姓名:引用特定艺术家的姓名或作品将粗略地调用他们的独特风格。示例包括文森特·梵高、弗里达·卡罗或班克斯。
  • 技术:参考技术会将这种风格添加到图像中。示例包括厚涂、铅笔素描、水彩或数字艺术。
  • 时间段: 识别图像的历史背景将调用其审美。例如,文艺复兴时期、巴洛克时期或现代主义时期的图像。
  • 地理位置: 参考地区和国家会影响风格。例子包括日本浮世绘版画、非洲部落艺术或美国抽象表现主义。

Midjourney提示词进阶 - 多个主体(原型)

如何获得两个科目?三个主题?多个,多个,几个,不止一个?

:abobRunGhost:两个问题困扰着多个主题。首先,让他们出现。其次,主题往往会融合在一起。以下是一些有帮助的方法。

1.️⃣ 完全原型方法。与其描述个人和构图安排(左边、旁边、附近、前面等),不如描述人的类型和他们互动的情况。

例如,三个朋友为钱而争吵

或者一个商人铲了一个宇航员

或者一个机器人和一个孩子在舞厅跳华尔兹

或者双胞胎在田野里看着一架巨大的纸飞机

角色和背景越刻板(实际上是原型),Midtravel的输出就越可靠。

2.️⃣ 半原型方法。如果你想要细节,只描述你的一个主题。第二个主题需要是一个原型。例如,一位戴着软帽的金发波西米亚女性和她的哥哥一起散步。图像中的第二个主题被调用,而不是被描述。

例如,一个12岁的金发男孩穿着工作服,和他的狗在公园的长椅上放松(狗没有描述)

或者一个赛博朋克发光的霓虹灯机器人和一个孩子一起跳华尔兹(孩子没有描述)

探索利用原型为您带来优势。找到原型,然后尝试改变单词。例如,奶牛踩踏对Midtravel来说很容易,因为它是一个原型。现在用它来创造你自己的愿景,无论是什么:古钟的踩踏,还是长着绿色獠牙的人形战士的踩踏。


混音提示:如果你有多个任何类型的受试者,你可以使用混音将这些受试者替换为其他受试者。因此,如果由于原型的原因,得到三只失明的老鼠更容易,那么就得到它们,并用你的东西重新混合来代替失明的老鼠。

多学科咨询

让Midtravel来做吧。限制你自己的描述,让Midtravely来做细节。

整个场景充斥着文字。例如,如果你指定了一个类型/时间段/心情/风格/电视节目,那么它会出现在任何地方。

即使是"无声"的属性也可以渗透到整个场景中。例如,魔鬼是红色的。如果你的提示中有魔鬼这个词,那么红色可能无处不在。

如果你不小心,混合会困扰你,即使在--v5.:重影(_H):⁠ 多个受试者(混音)


配对示例:

"汤姆、简和尼尔","祖母看到她的孙子","巫师打败了一个妖精","弗雷德与敌人作战","两个中年南非妇女姆巴利和米宁勒边喝茶边聊天","一个女人在运送藏在外套里的吉娃娃","罗杰站在恐龙旁边","跑步者带着他们的宠物怪物跑步","大猩猩与鲨鱼搏斗","Sarah和Nancy紧挨着,拥抱在一起"

组示例:

"骑士"(复数)、"一群怪物"、"50只乌鸦"、"追逐逃跑的人群"、"一群老鼠"、"被兔子包围"、"宇宙飞船的船员"、"迅猛龙踩踏"、"拥挤"(在这些词前面使用几个不同的短语来阻止复制)

场景示例:

"足球比赛"、"外出就餐"、"生日派对"、"在商场购物"、"舞台表演"、"开会喝咖啡"、"被警察追捕"、"动作场面"、"激烈的戏剧性场面"、《情感场面》、"电影场景"、"礼仪喜剧"、"好友喜剧"

有时,以这种场景的常见风格调用场景可以帮助获得两个不同的主题。在这里,战斗场景以3D渲染的视频游戏艺术风格描绘,这似乎是对场景的支持。(或者,X攻击Y这个短语就足够了。)

有时使用twin这个词可以帮助获得两个不同的主题

另一种尝试的方法。为每个字符命名,并将它们放在提示的两端,如下面的示例所示。

两个<主题类型>,<第一个主题及其属性><动作/场景/关系填充><第二个主题>

提示符的第一部分告诉MJ创造多种事物,并驱动构图两个动物两个人等。。

示例两种动物,一只小猫在奔跑,追逐一只小老鼠------ar 3:2

这可能需要重新滚动才能在不混合的情况下获得正确的主题

当遇到这样两个倾向于混合的主题时,使用通过动词(通常)反对或以某种方式区分它们的语言会有很大帮助。有时,从一半的信息开始并尝试注入也更容易(不一定很容易),就像我在这里所做的那样,只从受试者开始,然后尝试将毯子放进去。即使没有这种方法我能够非常接近,我也永远无法实现零混合。这最终导致我用动词"战斗"来反对他们,并删除了野餐的提法。我一直在做一些中途的自由职业项目,当你需要一个非常具体的主题和设置时,逐段添加数据似乎比一次添加数据更可靠。

我有一个非常好的老鼠和刺猬的选择。我的最终结果与这只老鼠差异如此之大的原因是,添加野餐毯只是太改变了风格。当我过于努力地保持老鼠更逼真的品质时,我发现野餐时注射的能力受到了很大的影响,否则刺猬就会变形。我最终决定与它断绝关系,继续前进。

Midjourney提示词进阶 - 创建多个主体(remix)

如何获取两个或多个不同的主题?

很难阻止多个主题混合,因为一份/imagine中的工作没有太多内存(想想RAM)。

脚手架是一种强烈推荐的方法。

等等,脚手架是什么?单击此处:⁠ 脚手架

创建任意两个主题,然后使用remix使它们成为您想要的两个主题。

请单击此处获取分步说明。

他们不适合这个空间,所以点击这个链接在下面的聊天中放大。

➡️ ⁠即时常见问题⁠ 多个受试者(remix)⬅️


上面的链接是主要方法。先试试,哟。❤️

这里有一种不太可靠的备份方法:直接提示您正在追逐的内容,然后重新混合以增加一致性。强化(针对同一脚手架的两次调用)似乎将受试者固定到位

1.️⃣ 使用invoke方法创建两个实际对象的图像。(请随意使用--v4。)假设你想要一只北极熊和一只企鹅一起走。一个很好的提示可能是:一只北极熊和他的宠物企鹅一起在雪地里行走。如果"宠物"是错误的关系,不要担心。invoke方法说使用库存情况来调用你想要的图像,而主人/宠物是一个涉及两个明确主题的原型。您可以为此使用任何您喜欢的调用关系。还要选择第二个备用短语,您将在步骤#3中使用它。

所需读数:⁠ 调用原型

2.️⃣ 现在,重新滚动,直到你找到一张能很好地清晰显示你的两个主题的图像,即使它并不完美。当您找到一个非常好的(如果不是很好的话)时,如果您在--v3中,请转到下一步。若您在-v4中,将其重新混合到-v3中,则转到下一步。我认为当你退出这一步时,你需要在-v3中,但请随时留在-v4中,看看情况如何。

3.️⃣ 现在,您看到的是一个--v3网格,其中包含两个主题的相当好(但不太好)的版本。选择最好的一个,重新remix以编辑提示。将调用短语替换为备份调用短语。我们之前说过"一只北极熊和他的宠物企鹅"。现在我们要说,一只北极熊和他的朋友企鹅一起在雪地里行走------测试------有

##为多个受试者搭建脚手架,循序渐进

中途不能计数,但你可以通过使用通常有三(或四,或五,或...)的事物的原型/刻板印象来"调用"数字

"三姐妹"

"三只失明的老鼠"

"三个智者"

一旦你得到了三个使用刻板印象/原型的东西,你就可以使用remix来用你心目中的任何东西取代姐妹、老鼠或智者。

###在这个例子中,我想要三个珊瑚分支。如果我不搭脚手架,我会得到随机的珊瑚。通过脚手架,我可以控制画布。

1.️⃣ 我从这里开始

三位智者------v 3

由于"智者"是一种原型/刻板印象,他们很可能正好是三个人。(您可以在此处阅读更多信息:⁠ 调用原型)我使用--v3是因为我只需要一个用于脚手架目的的通用画布。对于脚手架来说,更多的细节或连贯性可能更差,而不是更好,所以-v3是一个很好的选择。

2.️⃣ 现在我们将选择网格[V3]中的第三个项目,因为它将成为良好的脚手架。与我的其他选择相比,这些数字很清楚,背景也很简单。所以我点击[V3]。由于我已经打开了remix,所以我会得到一个弹出窗口来编辑提示。我把"三个智者"这个词换成了"珊瑚的分支",其他的都保持原样。

remix在--v3中运行,因为我没有更改提示的其他内容。我立刻看到我的智者被水下的珊瑚树枝取代了!请注意,它使用了与原始图像相同的构图(排列)。这就是脚手架的魔力。

我们仍在--v3中,所以它看起来还不连贯。首先,我将使用变体和重新滚动来尽可能接近这个非相干的-v3模型中我想要的构图。毕竟,这只是脚手架。

3.️⃣ 当我得到一个我满意的构图时,是时候烘焙图像了!我可以通过再次重新混合来添加一致性,这一次我删除了-v 3,并将其替换为-v 5.1,以覆盖其高度详细的一致性。

这就是为什么我最终得到了我想要的三件东西,就像这样!

Midjourney提示词进阶 - 展示人物全身

要拍摄全身照片,而不是头部和肩部的肖像,请完成所附清单中的所有四件事。 下面。

完成清单中的所有四件事。看看下面的GIF动画,给你看一些例子。

检查清单:

1.️⃣ 包括构图类型,如全身肖像、全身拍摄或从头到脚拍摄。

2.️⃣ 描述你的主题。

3.️⃣ 锚定可能会掉出画面的部分,这意味着要提到不断消失的部分,比如穿着巨大的红色牛仔靴,或者只穿着大腿、小腿、脚踝和鞋子。 这是因为Midtravel努力服从我们。如果你提到鞋子,如果Midtravel想服从你的提示,它有义务展示自己的脚。

4.️⃣ 在场景中加入熟悉的动态姿势,比如在森林里巡逻,或者走在人行道上,或者在公园里漫步,等等。

重要的是,避免使用暗示"头部和肩部"框架的词语,如肖像本身(没有全长)或关注眼睛和头发等头部特征的描述。是的,我用headular这个词只是想看看你是否读到这一步。是吗原因:

好的。第一次没看到你想要的结果吗?重新滚动。

还遇到麻烦吗?

考虑利用"影响力的斜率",也就是单词序列。提示前面的单词比提示后面的单词更有影响力。因此,将全身投篮、站立和/或鞋子放在提示的前面可能是有益的。这可能单独起作用,也可能不起作用。还有其他东西需要添加,或者尝试一下。

还可以考虑调整纵横比以适应您想要的图像。对于全长镜头,2:3的纵横比有时比1:1更好。

一些可以玩的短语:

-建立快照

-广角镜头

-全身角度

另一种技巧是先描述背景,然后描述其中的角色。这有时很有效,例如在一条赛博朋克城市街道上,站在前面的是一个穿着城市街头服饰的模特

有人略带玩笑地建议(不要剪头发):

秃头的

秃头确实有效。要想展现秃头角色,MJ必须展示他们的头顶。

以下内容稍微温和一些:

帽子

分开

为了让双脚清晰可见,我在以下方面取得了不错的成绩:

跑步

MJ真的很喜欢展示与地面接触的鞋子。对于我使用的一个静止姿势:

脚、脚踝、膝盖、大腿

这在一定程度上超过了最低限度,但(可能)有助于这些都不那么粗略。

不要描述他们坐着。调用让他们就座的情况。一起交谈。玩扑克。摔跤。为钱争吵。✅

混音无法为您的画布添加空间。

混音是一个拉伸工具,而不是一个调整大小的工具。如果模型的头部在框架顶部被切掉,那么选择更长的纵横比将创建模型头部的拉伸版本,仍然在框架顶部切掉。要"修复"裁剪/取景/剪裁的问题,您需要做的不仅仅是更改纵横比。

虽然使用的长宽比有助于为MJ提供全身空间,但这并不是绝对必要的。有了足够的身体部位参考,你想出现在框架内,即使在方形(1:1的第一个图像)中,获得完整框架身体的概率也非常高。在V3中,几率约为1/4,在测试中约为80%。使用特定的种子可以帮助确保它几乎每次都发生(第二张图片)。如果您计划重新映射到测试中,使用2:3的比例是一个很好的做法,因为这是测试的最大垂直方向,但必须将此AR添加到初始提示中。之后添加它只会拉伸或挤压图像。

使用过高的纵横比可能会导致另一个问题。(第三个和第四个图像-即使在框架中有空间,也要切除肢体)。我认为这是由于v3学习集的扫描方式------图像被裁剪成正方形,身体部位被裁剪了很多次。由于有太多的"空气"需要填充,MJ试图合理地塑造一个人的高大身材,这些作物表现为四肢缺失或截断。使用2:3或4:5通常可以解决其他问题。

Midjourney提示词进阶 - 提示词长度

提示词单词数是有上限。但这并不像单词计数那样直截了当。(token数,比方there这个单词,可以分割为 the、here、there)v5版本有大约80个单词的软上限。还想知道更多细节,请继续阅读。。。

1.️不同版本的模型有不同的"落差趋势",落在后面的单词会失去影响力。

在-v1、-v2、-v3、-v4、-niji、-test和-testp中,当接近60个单词时,会出现线性下降。60个单词之后,影响的非常低,甚至单词被被切断。其实前60个单词,落差趋势也是可以观察到的。

尝试一个经验法则,通过测试可以观察到:

单词1-5:非常有影响力,很可能会出现在第一卷。

单词6-20:仍然在玩,你可能会很幸运,可能会进行2-3次vroll/reroll。

单词21-40:仍在发挥作用,但可能需要更多的尝试,可能会被忽视。

单词40+:可能需要更多的尝试,可能会被忽视。

单词60+:更有可能被忽略。

然而,在-v 5中,影响力要考虑token权重而不光是token所在位置的因素。因此,即使在单词位置很靠前,较弱的token也可能需要额外处理才能在图像中出现。更强的token,即使位置靠后,也可能需要额外处理才能减弱其对图像的影响。

2.️ 除了"落差趋势","组合"或"排列"因素也会起作用。

简单来讲,你的提示词越长,单词的"排列"就越多,你就越不可能看到它们都被表达出来,或者以你想的方式表达出来。

以下是一种对排列效应的原理:

如果你有3个单词(2*2*2),你可能会看到这些单词的8个组合。

如果你有9个单词(2*2 *2*2*2 *2*2*2*2),你可能会看到512个排列。

如果你有40个单词,这些排列可能看起来无法计数。但并不是所有的单词都有同样的可能性,因为后面的单词比第一个弱得多,而且l从数据集中吸取的经验,不同的单词有不同的"力量"。

这只是一种简单的方式来理解组合原理。实际的组合是未知的巨大和不可预测的。

结果:对于--v 1-4和--test/testp,提示词越长,每个单词在排列的海洋中丢失的就越多,可能永远看不到它的影响。对于-v 5,你的提示词越长,在场上争论优先级的组合就越多。

3.️为什么要"落差趋势"和排列?我不知道确定的答案,但有一个部分答案:影响力的斜率和加权平均值是MJ所拥有的,而不是语法。然而,在--v5中,有一些自然语言处理(NLP)技术在发挥作用,所以"落差趋势"并不是必要的,也没有以这样的强度来实现。相反,功能强大的是提示词的"真实"语法。试着像在学校学到的那样写作,看看你的想法。

❇️ (请参阅附图)当使用权重/多重选项时:从微观角度来看,用权重定界的单词集会受到该集内部影响的斜率的影响。从宏观角度来看,这组集合同时受到影响斜率的影响。权重的值大致充当位置影响值的修改器。如果你给60号位的东西一个很高的重量,它上场的机会就会提高,因为高重量可以补偿它的后期位置。

Midjourney提示词进阶 - 种子

什么是种子?什么是同一种子?种子能做什么?

所以,让我们打破一些关于种子的神话:

种子无法在作业之间传递图像的样式或外观。

种子不能用于"书签"样式或外观。(即"使用种子XYZ!")

种子是中程中最弱的力量。在--v 5中,它们可能根本无法按预期工作。

种子是随机生成的噪波。想象一下电视静态画面的快照。此噪波场用作Midtravel用于渲染图像的空白起始页。如果起始页(称为父图像)是由变体、混音或图像参考提供的,那么种子就不再发挥作用了。这意味着它们只能由纯文本提示使用,并且只能在初始/express命令期间使用。。

对于有技术头脑的人来说,这里有一个更深入的解释:

Midtravel使用一个称为种子的随机变量来创建一个视觉噪声场(如电视静态噪声),如果没有提供其他父图像,则将其用作渲染图像的实际起点。渲染过程由神经网络和扩散模型处理,根据它在检查过的数十亿张其他图片的基础上学到的数十亿经验教训,对这些随机像素的正确放置或移除做出数十亿决定。渐渐地,通过这些十亿个决定,Midtravel将随机像素转换为一张图像,努力表达提示的正确像素位置。Midtravel开始渲染过程的"随机视觉噪音画布"是由一个随机生成的称为种子的数字决定的。

以下是Midtravel中与种子相关的命令:

要获得图像的--seed值,请在Discord中使用✉️ 信封

要获取过去图像的--seed,请从网站详细信息菜单中复制作业ID,并对该ID使用/show job_ID命令,然后对显示的✉️ 信封

要使用它,请将其添加到提示中:I am a prompt--seed N(其中N是种子的值)。

第五版中的种子:⁠即时常见问题⁠ 种子

我可以使用以前创作的种子吗?

不。种子会变。虽然你可能知道你的图像的种子值是X,但很快这个名字就会指向一个与你第一次制作该图像时不同的"随机噪声起始页"。这意味着种子值的效用被限制在一个时间段内。

我可以用种子复制图像吗?

没有,或者,只有在-v 4中。当与您的(从未重新混合过)提示:加号:AND:加号:parameters组合在一

所以大多数时候,当我们写提示时,我们都是从随机噪音和提示中的单词开始的。。。他们把噪音加工成一幅画,有点像噪音是大理石,而我们的文字是凿子...

种子是我们开始的噪音模式,有点像我们开始的是哪块大理石

所以你可以说------1602号种子...也就是说,从1602号大理石块开始...也就是------1602种子。。。也许,只是也许,如果我们凿出我们的噪音。。。大理石块1602...带有相同的提示词。。。我们可能会再次得到类似的图像,对吧?

就像真正的大理石一样,以同样的方式凿两次可能不会得到雕塑的精确复制品。种子也是这样。仅仅因为你要求相同的起始噪声并不意味着你会得到相同的图像。事实上,如果你的提示不同,那就意味着你的凿子在做各种不同的事情,对吗?,你根本不会得到同样的照片。

最后,你从哪块大理石开始并不重要。无论你用凿子做什么,都会对它产生很大的影响。尽管如此,你还是会遇到一些人发誓,如果他们从某些大理石块(种子)开始,雕塑就有某种难以言喻的品质

您无法访问所有四个值。有一个核心值(当你请求种子时得到的值),其余的是函数根据该值运行的结果。

我很难在每个网格下面的小段落中解释这一点。

所有这些都意味着,如果你谈论的是种子"345",那么你处理的并不是那个种子,而是随机函数加上那个种子的结果。因此,你永远不会真正感知或直接处理"345"。

这就是为什么使用种子来"控制构图"对我来说真的很难推销。人们说"使用种子5568,因为它非常适合肖像画",但你实际上并没有使用5568。你使用的是5568所指的任何东西(我想象它就像电视静态,噪声场),由一个未知的随机函数作用。那么,当提示本身是通配符时,可以可靠地产生"有利于肖像"的噪声场呢?

我确实喜欢在一定的方差范围内复制合成物的种子,因为随机化函数作用的"5568"与其先前由相同函数作用的值"5568)仍有一定的关系。。。我的意思是,也许这在某种程度上稳定了。。。特别是因为提示无论如何都会完成大部分工作,所以如果提示基本相同,并且种子产生了一个新值,该值与其先前的值有有用的关系。。。这就是为什么你可以再次获得一个相当接近的先前作品的再现。(但即便如此也不确切)

这就是为什么使用种子来"控制构图"对我来说真的很难推销。人们说"使用种子5568,因为它非常适合肖像画",但你实际上并没有使用5568。你使用的是5568所指的任何东西(我想象它就像电视静态,噪声场),由一个未知的随机函数作用。那么,当提示本身是通配符时,可以可靠地产生"有利于肖像"的噪声场呢?

我确实喜欢在一定的方差范围内复制合成物的种子,因为随机化函数作用的"5568"与其先前由相同函数作用的值"5568)仍有一定的关系。。。我的意思是,也许这在某种程度上稳定了。。。特别是因为提示无论如何都会完成大部分工作,所以如果提示基本相同,并且种子产生了一个新值,该值与其先前的值有有用的关系。。。这就是为什么你可以再次获得一个相当接近的先前作品的再现。(但即便如此也不确切)

种子和V4中对图像的微小更改

如果你得到了你喜欢的东西,但你想要非常小的变化,比vrolll要小,你可以得到该图像的种子,然后用该种子和相同的提示进行谴责。通常情况下,这会产生一个像素对像素的复制,但如果你在提示中更改一些小的东西(比如一个逗号),每次这样做时,结果都会发生小的变化。

您可以通过使用信封表情符号对其作出反应来获得提示作业的种子(只需将鼠标悬停在提示频道中作业的右上角,表情符号工具就会出现)。如果你以前没有用过这个信封,你可能需要搜索一下。这将向您的DM频道发送作业ID和种子#。去那里取种子号。

然后在提示频道中重新播放完全相同的内容(你可以从原始频道复制粘贴),并在最后添加种子,然后添加一个空格,然后添加你从DM频道获得的数字。在点击go之前,更改提示中的一个小东西------比如一个字符,或者加或减一个逗号或一个单词。

你可以在这些图像中看到------添加种子和重新尝试会产生完全相同的网格,但微小的变化会产生微小的变化。这是不可控制的,但可能很微妙------请注意,网格2发生了巨大变化,而网格4几乎没有被触摸。

将其与最后两个图像进行比较,其中一个是网格4的vroll,另一个是栅格4的remix,以及它们是如何变化的,以及重新尝试的种子图像是如何变化。

种子提示(仅限第4版)


使用混音?如果在混音过程中添加或更改--seed N值,则不会发生任何事情。混音已经有了父图像。它不需要"随机视觉噪音的起始页",因为它已经有了。

使用图像参考?如果您使用的是图像参考,它们将充当父图像。这些工作不需要"随机视觉噪音的起始页",因为他们已经有了。

想将种子价值保密吗?默认情况下,它们是私有的,直到你用--seed N显示它,然后它是你的提示和公共的一部分。如果你有隐形模式,你可以取消发布图像,这样就不会有人看到它。

种子提示(仅限第5版)


In--v5种子有点随机,所以即使是种子锁定测试也可能会产生意想不到的结果。(你希望得到准确的副本,但你可能得不到。)或者它们可能很好用。

当你提示--seed N时,其中N是一个整数,你会得到系统分配给N的随机种子,有时可能与系统刚才、一小时前或昨天给N的分配种子不同。

掷骰子!

这是否意味着种子永远不会起作用?不,但这意味着它们有时会对你产生影响,所以如果你使用种子之类的东西,请记住这一点 完全香蕉 似乎正在发生。

##种子命令是否适用于所有版本的Midtravel?

不可以。参数--samesend N仅在v1-3中起作用。如果在提示的末尾添加-sameseed N,那么网格中呈现的组合将非常相似。这对于1-3版本中的故障排除、测试和试验非常有用。

之前有一个--v5的怪癖,使用✉️ 获得种子只对网格起作用。现在你可以申请高档的种子了。返回给您的种子值将成为网格的种子。

Midjourney提示词进阶 - 创建文字

如何添加单词、印刷品、文本、字母和数字?

文本是GPU密集型的,而且很难。我们建议您在Midjourney中在此制作基本图像,然后使用[Adobe Express]等工具(https://www.adobe.com/express/)用于文本。

但是!如果你有雄心壮志,这里有一些事情可以尝试。

如果您的文本少于5个字符。。。

使用--v 4或--v 5。创建一个带有提示的简单参考图像。

如果您的文本超过5个字符。。。

使用--v 3。请参阅所附图片。

有些文本将更容易提示。

简短的单词写起来更快。

在自己最常见的上下文中显示的单词制作速度更快。就像一张写着"你好"的海报,或者一块写着"投票"的牌子,或者一个写着"欢迎"的门垫。

注意事项

如果使用样式化(-s)或混乱(-c),文本将无法工作。如果您正在尝试执行文本操作,请确保将它们从提示中删除。

Midtravel中的文本是GPU密集型的。请谨慎行事。

生成文本的示例提示如下所示。滚动查看。

**V4文本创建技巧**

Midtravel在拼写方面非常糟糕。但这是可能的。

请记住,其中一些东西在Midjourney中需要花费大量时间,或者在Gimp、Canva或Photoshop中需要5分钟。

**方法1-从v3到v4**

如果你下定决心------这是实现文本的一种方法,即使控制水平不稳定。

截图文本-留出空间,使用与您想在Midjourney中使用的纵横比相同的纵横比。我添加了颜色,因为我想避免黑白图像。

在Midjourney V3中运行此操作。可能需要多次滚动才能获得文本,但您将获得文本。

```https://s.mj.run/znsJcDDRLVw黄色文本表示"正义"--v 3-iw 5```

运行直到文本拼写正确,并且您喜欢布局和颜色。。。下一步我们将强行将其转换为V4。确保你打开了/更喜欢混音。这会将你的V按钮变成一个额外的弹出窗口来更改提示。

保留图像链接,并更改提示以更好地使用V4。就我而言:

```https://s.mj.run/znsJcDDRLVw3d图标,香蕉,文字"JUICY"--v 4```

过了一会儿,我又轻推了一下,改变了背景。

```https://s.mj.run/znsJcDDRLVw3d图标,香蕉,文字说"JUICY",腮红backgrpund--v 4```

你重新滚动和混音,直到你有所进展,然后尝试高档。

用较长的单词这样做的例子:

**方法2-直接在v4中**

这很可能需要更长的时间,而且只适用于短单词。有些字母组合,Midjourney不喜欢。

使用所需的配色方案,将单词截屏。运行它直到它拼写正确-这可能需要很长时间。。。然后进行混音以达到完美。

```https://s.mj.run/u6aRcnQ412w%3E"SANNE",蒸汽朋克独角兽--v 4```

Midjourney提示词进阶 - 控制人物姿势

我可以控制我的模特的姿势吗?(即向下看,面对镜头,向上看,向侧面看)

1.️给模型一种情绪、态度,甚至一种与你想看到的位置相关的活动。

以下是示例单词:

害羞、害羞、尴尬、尴尬

昏昏欲睡、放松、分心

激烈的、凶猛的、愤怒的

等等。

以及

2.️添加面部的描述性细节。

明亮的眼睛、强烈的凝视、激烈的凝视

笔直的鼻子

皱眉、脸红、大笑

对称的脸

尝试"展示面部"或"相机角度视图显示面部"。你也可以添加一个请求,例如面部表情,它会相对重视展示面部,例如"微笑"、"惊讶的表情"或"蓝眼睛"

如果颜色是一个问题(黑白色或一种颜色非常浓烈,喜欢影响一切),或者你不想有太多表达------明亮的眼睛(只适合"给我看眼睛")-直鼻子(适合"正常"的鼻子)-微微的微笑(适合低表情的嘴)

提示词一开始:四分之三角度摄像机,通常在"军事"风格的摄影和肖像画上效果最好。

Midjourney提示词进阶- Sliders方法 & Cowbells方法

问-我如何确保提示中的所有内容都显示出来?

如果注意到Midjourney似乎"忽略"了提示的部分内容,那么是时候学习Sliders方法了!这是当在主提示中用一个精确的短语(一个精确短语)创建一个提示,并给它一个"Sliders"你可以调整以增加/减少影响力。

1.️首先创建并运行一个基本提示,如下所示:

然后,如果您注意到一个细节丢失了,请按照主提示中的内容(完全)拾取它,并添加一个滑块,如下所示:

A green dog sleeps in a forest clearing, magical twilight atmosphere:: magical::0.3 --ar 3:2

对于多个主题,请确保它们是不同的(在这里,给它们起了名字),然后为可能丢失的关于它们的详细信息添加Sliders。

2.然后,如果您注意到一个细节丢失了,请按照主提示中的内容(完全)拾取它,并添加一个滑块,如下所示:

A green dog sleeps in a forest clearing, magical twilight atmosphere:: magical::0.3 --ar 3:2

1.基本提示,首先运行此操作:

Detective Joe watches Nancy make a call in a phone booth, night atmosphere, city environment --ar 3:2

2.带有Sliders的基本提示,强调丢失内容:

Detective Joe watches Nancy make a call in a phone booth, night atmosphere, city environment:: Nancy makes a call in a phone booth::0.5 --ar 3:2

再来个例子

1.基本提示,首先运行此操作:

several sad cats watch a crying woman in a home-office environment with laptop --ar 3:1

2.带有Sliders的基本提示,强调丢失内容:

several sad cats watch a crying woman in a home-office environment with laptop:: several sad cats::0.5 crying woman::0.6 laptop::0.7 --ar 3:1

请注意,滑块是放在主提示的确切短语上的。提示越向下,滑块设置得越高,以补偿它们在提示中的后期(较弱)位置。

⚠️ 要使滑块工作,您需要一个全部为一个字符串/句子/语句的主提示。它不可能已经有重量了。如果主提示中已经有权重,则此方法不起作用。

滑块的推荐值是多少?

正值:

0.25, 0.3, 0.5, 0.6, 0.7

负值:

-0.7, -0.6, -0.5, -0.3, -0.25

为什么这些是推荐值?

由于数学原因,这些是推荐值。我们希望在确保滑块有效的同时,阻止提示接近零。基本提示以:结束,这意味着它的权重为1.0。您希望滑块(因此)接近1.0,而不会达到或超过该值,这样滑块就不会变得比基本提示更强大。

当使用负滑块时,技巧是确保当在所有提示中计算权重时,你不会接近0,因为事情会变得奇怪(除非你想要奇怪的事情)。我们确保1.0减去负滑块等于0.3或更高,以保持稳定。

如果滑块方法对我不起作用,或者我想尝试其他方法呢?

是时候学习Cowbells法了!

1.基本提示,首先运行此操作:

A songbird sits on the shoulder of a shy blonde woman dressed in white.

2.重复遗漏的个别单词:

A songbird sits on the shoulder shoulder shoulder shoulder shoulder shoulder of a shy shy shy shy shy shy shy blonde woman dressed in white.
相关推荐
努力学习的啊张29 分钟前
消息称三星正与 OpenAI 洽谈,有望令 Galaxy AI 整合ChatGPT,三星都要和chatgpt合作了,你会使用chatgpt了吗?
人工智能·chatgpt
Together_CZ30 分钟前
GPT-4 Technical Report——GPT-4技术报告
人工智能·gpt-4
huaqianzkh2 小时前
人工智能大趋势下软件开发的未来
人工智能
酱香编程,风雨兼程3 小时前
深度学习——多层感知机的从零开始实现和简洁实现
人工智能·深度学习
King.6243 小时前
sql工具!好用!爱用!
大数据·数据库·人工智能·sql·学习
GOTXX3 小时前
基于深度学习的手势识别算法
人工智能·深度学习·算法·机器学习·数据挖掘·卷积神经网络
Jurio.3 小时前
【论文笔记】Large Brain Model (LaBraM, ICLR 2024)
大数据·论文阅读·人工智能·深度学习·数据挖掘
EasyCVR4 小时前
ISUP协议视频平台EasyCVR萤石设备视频接入平台银行营业网点安全防范系统解决方案
大数据·人工智能·物联网·安全·音视频·监控视频接入
声网5 小时前
WebRTC 作者加入 OpenAI 主导实时 AI 项目;TTS 小模型 OuteTTS v0.2 发布:声音克隆+多语言
人工智能
剑盾云安全专家5 小时前
AI助力PPT创作:从手动到智能,打造高效演示
人工智能·powerpoint