LangChain+LLM实战---Midjourney高级技巧的极简教程

原文:An advanced guide to writing prompts for Midjourney ( text-to-image)

作者:Lars Nielsen

Midjourney生成的图像,文本Prompt:beautiful, fantasy city unreal engine

一句话介绍midjourney ?

对于那些还没有听说过Midjourney的人,这里是一个简短介绍:Midjourney是一款文本到图像生成应用程序,类似于OpenAI的DALLE-2和Stable Diffusion的DreamStudio,它使用互联网上发现的大量图片(约6.5亿张)来根据提供的文本提示生成令人惊叹的图像。目前处于测试阶段 - 但每周都在添加更多功能...未来还有很多想象空间!(当前他们的AI引擎为v5.1)

原始的prompt

如果您使用 midjourney 应用程序,则会知道您在文本中越详细描述,输出结果就越生动独特。用户通常使用原始和直接的提示词语,例如:a cowboy wearing a tuxedo on the moon(一个穿着礼服在月球上骑马的牛仔)",将生成这样的内容:

但是除了简单的原始prompt文本之外,还有更多选项可以创建可预测和一致的图像输出!

现在直接进入文本提示的高级选项列表!

以下是您可以生成图像变体的一些方法以及相应的高级设置:(每个设置的详细信息在列表下方)

  1. 提供风格关键字 --- 'style'
  2. stylize(美化)
  3. chaos(随机性)
  4. Resolution
  5. Aspect ratio(长宽比)
  6. 将图像作为URL prompt上传
  7. 应用权重到图像prompt。
  8. 为某些词加权
  9. 过滤掉某些词

简而言之,您的风格受到所选关键词的影响------您可以指定选择何种类型的风格------此图显示了风格类型的广泛分类。

  1. Style --- keyword

提供一组与"style"(风格)相关的prompt关键词,可以根据您选择的风格类型创建不同的输出。以下是一些基于您可能想要选择为样式的艺术形式/设计/艺术家/流派的关键词和子类型:

  • 使用不同的设计流派作为style(风格)关键字
  • 使用艺术家名称作为style(风格)关键字

您还可以将艺术家指定为样式输出。以下是一些相同prompt的示例:

|-----------|-----------------------------------------------------------------------|
| 1 | /imagine horse galloping at sunset painting Andy Warhol style |

  • 使用渲染/光线属性作为style(样式)关键词

2. stylize the output(美化输出)

您可以添加设置--s <某个数字>(表示样式)

以下图片来自相同的提示 - 低和高风格化选项。

|-----------|----------------------------------------|
| 1 | /imagine firefighters --s 6000 |

3. chaos --- 提高抽象程度

接受0到100之间的数字,以增加或减少主题中的抽象程度。

|-----------|------------------------------------------|
| 1 | /imagine Eiffel tower --chaos 60 |

4. Resolution(分辨率)

为了指定输出分辨率,您可以使用一些常用的关键词,如8K、4K、逼真、超逼真、超详细复杂细节等。

或者您也可以选择标准设置以获得可预测的输出。hdquality / --q 是其中两个设置指令。

|-------------|----------------------------------------------------------------------------|
| 1 2 | /imagine red rose flower --hd /imagine red rose flower --quality 5 |

5. Aspect ratio(长宽比)

你可以指定输出图像的宽高比,这被称为纵横比。默认输出是一个正方形图像(1:1 纵横比)。但如果你想要更具电影感的视角------或者只是想制作一张适合笔记本电脑桌面的壁纸,你可以改变纵横比。

|-----------|------------------------------------------------------|
| 1 | /imagine jasmine in the wild flower --ar 4:3 |

如果您想指定自定义图像大小,请使用以下示例。

|-----------|-------------------------------------------------------------|
| 1 | /imagine jasmine in the wild flower --w 600 --h 300 |

您无法指定自定义的宽高比,但可以指定一些标准的宽高比以及一些非标准的宽高比!(以下是一些示例)

6. Image as a prompt

如果您想要在多张图片上获得类似图像风格的输出(当您需要获得一致的输出时),请传递一个图像的URL。

|-----------|-------------------------------------------------------------------------|
| 1 | /imagine http://www.imgur.com/Im3424.jpg box full of chocolates |

生成的图像将同时参考种子图像(来自您传递的URL)和文本prompt。

  • 您可以提供多张图片作为prompt

  • 您可以为这些图片指定权重(请参见下一条)

7. 为图片加权(重)的prompt

如果您希望输出结果更接近于您的提示图像 (减少midjourney自己的想象力,请参见上一点),则应该给予该图像更高的权重。 (keyword : --iw <number>) .

|-----------|---------------------------------------------------------------------|
| 1 | /imagine http://www.imgur.com/ks34f24.jpg chocolates --iw:4 |

8. 为prompt中的文本加权

|-----------|------------------------------------------------------------|
| 1 | /imagine wild animals tiger::2 zebra::4 lions::1.5 |

9. 从图像中过滤掉词语

使用 --no 关键字来丢弃任何不想要的主题。

|-----------|-----------------------------------------------|
| 1 | /imagine KFC fried chicken --no sauce |

10. 最后,这里有一些你可以尝试使用的有趣关键词

|-----------------------|------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 1 2 3 4 5 6 7 | Sony Alpha α7, ISO1900, Leica M = 指定任何镜头类型或相机类型。 photorealistic(逼真照片级别) , ultra photoreal(超逼真) , ultra detailed(超详细), intricate details(错综复杂的细节) = 为了指定一些可能的细节和更加现实而不是艺术化的外观。 unreal(虚幻) = 指定虚幻引擎的感觉。 volumetric light(立体光) , cinematic lighting(电影级照明) = 指定一些光线条件。 |

相关推荐
杨小扩5 小时前
第4章:实战项目一 打造你的第一个AI知识库问答机器人 (RAG)
人工智能·机器人
whaosoft-1435 小时前
51c~目标检测~合集4
人工智能
雪兽软件5 小时前
2025 年网络安全与人工智能发展趋势
人工智能·安全·web安全
元宇宙时间6 小时前
全球发展币GDEV:从中国出发,走向全球的数字发展合作蓝图
大数据·人工智能·去中心化·区块链
小黄人20256 小时前
自动驾驶安全技术的演进与NVIDIA的创新实践
人工智能·安全·自动驾驶
ZStack开发者社区7 小时前
首批 | 云轴科技ZStack加入施耐德电气技术本地化创新生态
人工智能·科技·云计算
X Y O8 小时前
神经网络初步学习3——数据与损失
人工智能·神经网络·学习
唯创知音8 小时前
玩具语音方案选型决策OTP vs Flash 的成本功耗与灵活性
人工智能·语音识别
Jamence8 小时前
多模态大语言模型arxiv论文略读(151)
论文阅读·人工智能·语言模型·自然语言处理·论文笔记
tongxianchao8 小时前
LaCo: Large Language Model Pruning via Layer Collapse
人工智能·语言模型·剪枝