老板:GPU这么贵,你天天吃泡面的,怎么玩的起自建AI写真?

老板:GPU这么贵,你天天吃泡面的,怎么玩的起自建AI写真?
我:老板,吃泡面只是我的爱好,欣赏美女是我的另一个爱好。
老板:别说了,仓库里还有一台机皇,拿去当你的写真服务器,算是我的一点心意。
我:好的,谢谢老板,顺便帮我充个一年的花生壳,我做内网穿透,让它早日上线。
老板:准。

好了,年初的时候,想找个赚钱的思路,ai赛道什么可以做的?

问了一下kimi,得到以下答案:

以下是一些适合普通人和程序员利用AI开发应用赚钱的项目和方向:

内容创作类

  • AI辅助写作:使用ChatGPT、文心一言等AI写作工具,创作自媒体文章、电子书、广告文案等内容。通过在百家号、微信公众号等平台发布文章获取广告收入,或者将电子书上传到Amazon KDP等平台销售。
  • AI绘画与设计:掌握Midjourney、Stable Diffusion等AI绘画工具,创作壁纸、头像、表情包、插画等作品,通过小红书、抖音、闲鱼等平台展示和销售。
  • AI视频创作:利用Runway、Pika等AI视频生成和编辑工具,制作热门或垂直领域的视频内容,发布到抖音、B站、YouTube等平台,通过流量变现。

技术开发类

  • 开发AI工具/应用(To C市场) :程序员可以开发自动生成PPT、简历优化、代码补全插件、AI写作助手、AI音乐生成等工具,通过订阅制、按次收费或平台分润的方式盈利。
  • 提供AI技术服务(To B市场) :为企业提供定制模型开发、数据清洗与标注、AI运维服务等,通过接单平台(如程序员客栈、猪八戒网、Upwork、Fiverr)接项目,按项目报价或按小时计费。

其他方向

  • AI数字人直播:通过D-ID或HeyGen生成数字人形象,用GPT-4编写直播话术,利用Azure Cognitive Services实现语音合成,进行数字人直播带货或企业IP代运营,通过带货分佣或收取月费盈利。
  • AI咨询:结合自己的专业知识和AI工具,提供企业管理咨询、升学咨询、职业规划咨询、心理咨询等服务。
  • AI套壳服务:选择特定的AI功能,开发或购买套壳系统,添加自有品牌和特色功能,加入付费机制后部署上线并推广,通过订阅或付费使用的方式盈利。

在选择项目时,需要根据自己的技能、兴趣和市场需求进行综合考虑,并且要注重持续学习和优化,以提高项目的竞争力和盈利能力。

上面的思路还是可以的,说说我的实践:

我用python做过ai语音播报软件,用来做直播,自己训练的语音模型,充分利用了GPU的性能。为公司节省了可能投入的几千上万的软件成本。

除此之外,我还对ai写真感兴趣。

调研了一下,stable diffusion ,midjourney 这些都能生成ai美女图片, 一般的写真方案就是,先用prompt 提示词生成自己想要的美女或帅哥图片,然后用替换头像的软件或者插件把客人的头像替换上去,这个就像小时候路边的照相馆,用ps替小朋友做艺术写真。十多年了,技术变了,但生意的思路还是没变。

如果用 stable diffusion 的话,虽然是免费的,但需要自己安装,并且需要电脑有gpu算力,不然就是需要租用算力服务器,比如 autoDL

一小时就是一包泡面的价格,不是很贵,但长期下去,我可能连泡面都吃不起了。(不是

如果用midjourney,只需要买套餐,一个月70块左右还是能做出一两百张图片的,需要魔法,还需要再买一个机器人插件 InsightFaceSwap才能换脸,试了一下效果并不是很好。

对了,stable diffusion 用来写真的通常做法是这样的,我提一下: 就是训练LORA,给它喂5张以上的你的不同风格的照片,然后它需要训练好几分钟生成一个你的专属模型,然后你给它你想要的风格提示词,就可以生产你的艺术写真了。

这个做法还挺麻烦的,有一个叫XX相机的用的就是这个方法,我觉得都不是我想要的,那上面的思路是不是都不行了?有没有更直接简单的方法?毕竟我要商业化也要标准化,简单化和低成本化。

也不是,后来多亏了一些开发团队开发出了一些新模型,比如我现在要说到的 InstantID,它是stable diffusion 的一个模型插件,由中国的小红书团队开发的,

源码地址在这里:github.com/instantX-re...

图片是对现有的所有模型生成的同一个头像的风格对比,最后一列就是instantID的效果。

如果想体验但又不想自己搭建程序,可以使用huggingface(抱抱脸),或者replicate,这两个上面都有部署:

huggingface地址:huggingface.co/spaces/Inst...

replicate地址:replicate.com/zsxkib/inst...

友情提示:以上链接里的内容都是英文的,可以自行用谷歌浏览器翻译。好好的玩一下,还是值得的,因为下面我就要开挂了:

什么?什么都没讲清楚,就要开挂了?!

是的,我现在给你看到的这个 replicate 是一个好东西,让我们看看它能做什么:

Replicate由一支专注于AI基础设施优化的技术团队打造,致力于简化模型开发流程。该平台通过统一接口支持文本、图像、语音、视频等多种模态的AI模型部署,覆盖从实验到生产落地的全生命周期。无论是初创企业还是大型研发团队,均可通过Replicate快速实现技术验证与商业化应用。

让我一句话说明一下: 使用replicate 可以通过CLI和API封装复杂环境配置,自动处理依赖项安装,实现"一行代码调用模型"。

重点在这里:"一行代码调用模型"。 这个网站上面有成千上万个模型,你不需要自己安装部署模型,官方已经部署安装好了,你只要会调用api ,就可以使用这些模型,而且是按需计费,使用多少付费多少,不用就不需要钱。

作为程序员的优势,我们的路子就一下子宽了,这就好玩了,原本我们需要通过一个页面,传我们的照片上去,并且在页面的输入框里写上prompt提示词来生成我们想要的目标写真图,现在我们可以自己调用api,批量生成写真。
有没有更方便的办法?不用写提示词,我上传图片,然后点点点,点一个参考风格图片,就能生成和它一样的风格?当然是可以的,这个就是我想实现的方法。如果你还是没有反应过来,我讲一下我的做法:
我写一个界面,然后在上面提供风格图片,每个风格图片都是自己试出来的效果,在数据库里填写了这张图片的prompt,这样我加个功能,上传一张原图,然后随便点击一张风格图,将这张图和promopt提示词一起发送到replicate上的instantID模型服务器,这样就能直接生成和这个风格图类似的图片了。

是不是 思路很棒也很简单,我给你看一下我最后实现出来的效果:

这些风格图片都是我从网上收集来的,提示词是我自己加在数据库里的,这样我上传一张照片,点击一张风格盲盒,就能生成和它类似的写真图片了。是不是很好用?

我用了两个模型,这个是instantID,生成的效果比较好,但是时间长,经常会遇到服务器冷启动:

这个模型是PuLID , 也是国产的,字节跳动的作品, replicate地址在: replicate.com/bytedance/p... 这个可以十几秒同时生成4-8张写真,效果还可以,初次使用可以选择这个模型。

这个是原图:

是不是还是有点像的?

好了,我晚饭的泡面还没煮,今天就先抛砖引玉,更多细节如果有人想了解的话,我有空和你们交流一下,可以联系我laplacemaker。毕竟码字还是挺累的,我又不善于分享。

相关推荐
小森776719 分钟前
(六)机器学习---聚类与K-means
人工智能·机器学习·数据挖掘·scikit-learn·kmeans·聚类
RockLiu@8051 小时前
探索PyTorch中的空间与通道双重注意力机制:实现concise的scSE模块
人工智能·pytorch·python
进取星辰1 小时前
PyTorch 深度学习实战(23):多任务强化学习(Multi-Task RL)之扩展
人工智能·pytorch·深度学习
极客智谷1 小时前
Spring AI应用系列——基于ARK实现多模态模型应用
人工智能·后端
思悟小卒1 小时前
可以自我反思的检索增强生成
人工智能
学点技术儿1 小时前
torch.cuda.empty_cache()使用场景
人工智能
孔令飞2 小时前
如何在 Go 中实现各种类型的链表?
人工智能·云原生·go
XCristiano2 小时前
LLM魔法:让非结构化文本变身知识图谱
人工智能
redparrot20082 小时前
LeNet5 神经网络的参数解析和图片尺寸解析
人工智能·深度学习·神经网络
刘立军2 小时前
本地大模型编程实战(26)用langgraph实现基于SQL数据构建的问答系统(5)
人工智能·后端·python