托马斯·史密斯
(图片由本文所述软件生成)
正如我最近分享的,我一直在测试Niche Site Lady提供的一种策略,试图用不到300美元的成本,让一个Facebook页面增长到20,000名粉丝。
进展非常顺利!我的页面在不到一周的时间里已经达到了18,000个点赞。
更棒的是,这个页面加入了Facebook的奖励计划。这意味着当人们与我在页面上发布的内容互动时,我可以直接在Facebook上赚钱。
那么,在我的Facebook页面上,什么内容最能引起人们的互动呢?猫咪表情包!
我试过发布宗教内容、美食图片、争议性话题等等。但没有任何内容能像猫咪表情包那样吸引互动。
我发布的普通猫咪表情包帖子通常会获得数百次浏览,并至少收到60-70个点赞或评论。随着我的页面吸引到更多粉丝,这个数字只会继续增长。
看到这个趋势后,我意识到一件事:我需要批量生成猫咪表情包。
于是,我求助于世界上最强大的AI系统来帮助我实现这个目标。
GPT-4.5,表情包创作大师
OpenAI本周刚刚发布了GPT-4.5。这是目前全球最强大的AI系统。
它在理解人类情感和心理方面表现尤为出色。这使它成为打造搞笑猫咪表情包的完美工具。
为了构建我的表情包生成器,我使用了Python,并集成了OpenAI的API。我给GPT-4.5设定了一个提示,要求它生成10个猫咪表情包,并描述图片和文本内容,代码如下:
response = client.chat.completions.create(
model="gpt-4.5-preview", # 或者你喜欢的其他模型
messages=[
{
"role": "developer",
"content": "你是一名擅长制作表情包和幽默内容的创作者,尤其熟悉适用于Facebook和其他社交媒体的幽默风格。你经常浏览Reddit,风格讽刺而风趣。"
},{
"role": "assistant",
"content": '''
示例输出:
[
"一只猫咪躲在笔记本电脑屏幕后面,怀疑地盯着前方,配文:'我看到你又在谷歌搜索狗了,解释一下。'",
"一只猫咪夸张地瘫在地上,疲惫不堪,配文:'今天辛苦地无视你了一整天,该睡个觉了。'",
"一只猫咪直勾勾地盯着你,同时把一个玻璃杯推下桌子,配文:'重力检测完成。嗯,依然有效。'",
"一只猫咪挤进一个明显太小的盒子里,姿势滑稽,配文:'只要我能塞进去,我就能坐进去。物理学不关我的事。'",
"一只猫咪震惊地盯着空空如也的食碗,配文:'碗是空的。即将饿死。快打911!'",
"一只猫咪自信地站在被它推倒的圣诞树上,配文:'冷静点,凯伦。我帮你重新布置装饰了。'",
"一只猫咪抓着关上的门,戏剧性地用爪子扒着,配文:'人类!出大事了------门居然关上了!'",
"一只猫咪毛炸开,眼睛瞪得溜圆,配文:'刚看到黄瓜,险些丧命。'",
"一只猫咪悠闲地趴在键盘上,旁边是工作文件,配文:'你的邮件需要更多的"喵"之输入。'",
"一只猫咪慵懒地躺在床上,一脸得意,配文:'抱歉,今天无法成人化生活。太忙着当猫了。'"
]
'''
},
{
"role": "user",
"content": f"""
生成关于'{topic}'的10个新的表情包。
你的表情包应该包含图片描述和文本内容,并且要非常搞笑,能够在Facebook和其他社交媒体上爆红。
例如,一个猫咪表情包的格式可以是:"一只猫咪夸张地瘫在地上,疲惫不堪,配文:'今天辛苦地无视你了一整天,该睡个觉了。'"
请确保你始终明确指出这些是表情包,并在描述中使用"配文:"来标明文本内容。
请以JSON格式返回结果,形式如:["一只猫咪躲在笔记本电脑屏幕后面,怀疑地盯着前方,配文:'我看到你又在谷歌搜索狗了,解释一下。'"]
"""
}
]
)
为了训练模型,我还使用了ChatGPT界面,直接与GPT-4.5合作,构思了10个搞笑的示例表情包,并将它们输入GPT-4.5,让它知道我要的风格是什么。
接下来,我添加了一些代码,处理模型生成的JSON数据,遍历每个表情包创意,并使用Ideogram API创建实际的表情包图片。
url = "api.ideogram.ai/generate"
payload = {
"image_request": {
"prompt": meme,
"aspect_ratio": "ASPECT_4_3",
"model": ideogram_model,
"magic_prompt_option": "AUTO",
"style_type": "REALISTIC"
}
}
headers = {
"Api-Key": ideogram_key,
"Content-Type": "application/json"
}
r = requests.post(url, json=payload, headers=headers)
r_data = r.json()
print(json.dumps(r_data, indent=4))
提取图片URL
image_url = r_data['data'][0]['url']
我只需要点击一个按钮,大约30秒后,我就能得到完整生成并保存到我的电脑上的表情包。
和
像下面这个:
和
里面甚至还有一些非常前卫的。
我想你会同意,其中一些真的很搞笑。
它们还相当逼真。请记住,这些猫和图片都是完全由AI生成的------在制作这些图片的过程中,没有任何真实的猫受到伤害(或被打扰)。
有趣的是,这个系统具有很强的扩展性------我可以输入任何主题,并立即获得无限数量的表情包。
虽然这个系统是基于猫咪表情包训练的,并且在这方面表现出色,但它也能生成还算不错的其他主题表情包,比如狗或食物。
猫咪表情包的经济学
GPT-4.5的API使用成本昂贵。生成10个猫咪表情包创意大约要花费0.25美元。
使用Ideogram生成一张图片需要5美分。所以,每个猫咪表情包的成本大约是7.5美分。
Facebook的奖励计划没有固定的付款金额。但成功的帖子可能从0.50美元到几百美元不等。
只要我的猫咪表情包平均每个能赚取超过10美分,我就能盈利!
更棒的是,这些表情包都是原创的。我不是在转载别人已经发布过的表情包,而是在为世界贡献全新的猫咪表情包。
不是所有的英雄都披着斗篷......
这意味着什么?
这是不是OpenAI新推出的GPT-4.5模型最具影响力的应用?可能不是。
但它确实展示了这个新AI的一些重要特性。
首先,GPT-4.5确实非常擅长理解人类。OpenAI表示,这是该模型最重要的创新。
它不像即将推出的GPT-5那样强大,也不会像GPT-o1那样'碾压'各种基准测试。但这个新模型专门设计用于与人类协作,并理解驱动我们行为的独特心理。
从我在这个(确实有点无厘头的)示例中看到的情况来看,GPT-4.5确实做到了。许多这些表情包都很有趣,而其中一些(比如'凯伦'那个)还能巧妙地融入流行文化梗。
其次,GPT-4.5在可编程性和输出一致性方面表现良好。是的,它的API价格昂贵。但只要训练得当,它就能输出稳定的数据,使我可以顺利地将其输入脚本的下一部分,而不会遇到太多错误或问题。
早期的AI模型经常表现不稳定------要让它们生成一致的输出非常麻烦,这使得在现实世界的程序中整合AI变得困难。
OpenAI在这方面显然取得了重大进步,这将使得AI的应用变得越来越容易。
最后,我希望这也能证明,将不同的AI模型结合在一起可以产生真正惊艳且新颖的效果。
Ideogram本身不足以独立生成搞笑的猫咪表情包。但当你让GPT-4.5充当Ideogram的'大脑'时,这两个模型的结合远比它们单独使用更强大。
今天,我在生成猫咪表情包。但我同样可以将GPT-4.5与更有实际价值的东西结合------比如医学图像数据库,或客户服务通话的文本记录------从而打造真正对现实世界产生影响的AI应用。
不过,在那之前,我还是先享受这源源不断的AI猫咪表情包吧。