Ideogram 是一款令人印象深刻的人工智能图像工具,但尽管它于去年 8 月推出并具有不可思议的文本渲染能力,但它并没有引起其他一些更引人注目的 GenAI 服务的关注。
随着该公司推出其生成式人工智能模型 1.0 版本,这种情况即将发生改变,该模型能够在图像上创建更加一致、时尚和清晰的文本。
这家总部位于多伦多的初创公司最近在 A 轮融资中筹集了 8000 万美元,将用于加速发展并建立更广泛的媒体模式。
我从 0.1 版本开始就开始使用 Ideogram,它已经给人留下了深刻的印象。该公司表示,其新的 1.0 模型是"从头开始训练的",具有改进的真实感、复杂的即时理解和渲染文本。
虽然你已经可以使用 MidJourney v6、DALL-E 3、Stable Diffusion 3 和 Google 的 Imagen 2 创建渲染文本,但结果却时好时坏。
Ideogram 1.0 中最突出的新功能之一是它的 Magic Prompt。这需要你的简短提示并重写它以更好地反映你的意图或愿景。
例如,你可以要求一个关于猫的有趣模因,Magic Prompt 会将其转化为更具描述性的概述 - 包括描述猫的每个元素、文本应如何呈现并赋予其情绪。
你已经可以使用 ChatGPT 在某种程度上做到这一点,方法是让 OpenAI 聊天机器人在将其发送到 DALL-E 之前提出详细的提示。 Leonardo 还提供了一个即时优化工具,但使用 Ideogram 时它会自动发生。
不过,该公司表示,它还致力于让模型更容易理解复杂的提示并遵守要求。因此,如果你是一位敏捷的工程师,或者你的愿望特别具有描述性,Ideogram 会比以前更准确地掌握完整的请求。
版本 1 包括更新的文本渲染引擎。这显着提高了人工智能引擎生成的文本的准确性和易读性。
本文中的所有图像都是根据我在 Ideogram 中输入的提示生成的,特别是要求图像上有文本。
去年年底,图像上的文本在 Google 的 DALL-E、MidJourney 和 Imagen 等大型工具中才开始变得清晰易读,但 Ideogram 自推出以来已经具有一定程度的文本功能。
在一些测试中,它似乎是第 1 版,它似乎不仅能够准确地呈现主要单词,还能够准确地呈现副标题或宣传语。它并不总是完美的,但比其他模型更加一致。
Ideogram 表示,准确性的提高使得"轻松创建个性化消息、模因、海报、T 恤设计、生日贺卡、徽标等"成为可能。
如何访问 Ideogram?
Ideogram 是一个简单易用的网站,带有提示框、控制选项(例如生成的图像大小或样式按钮)以及最近创建的生成选项。
喜好儿网
随着 1.0 版本的推出,还有一个新的订阅计划。虽然仍然会有免费套餐和每日免费生成,但对于需要更快渲染和上传图像作为源材料的能力的用户来说,还有付费选项。
高级计划的价格范围从每月 8 美元(每天 100 次提示)到 20 美元(每天无限次提示)不等。
无论你是免费还是付费计划,都没有使用限制,但在免费计划中你只能下载压缩的 jpg 文件。