❎35岁程序员,转行了么?

新职业

在Boss直聘、智联等招聘网站中,您是否遇见过这样的职位邀请?它的名字叫做LORA模型训练师

从图上我们可以看出其需要的技能大致是下面的样子:

  1. Stable Diffusion: 机器学习、神经网络、模型训练的知识;
  2. Lora: 训练Lora模型的能力;
  3. Python: 一门编程语言,这里应该是通过编程使用TensorFlow、Diffusers等AI技术;

什么是Stable Diffusion?

Stable Diffusion是一种文本到图像的潜在扩散模型,由CompVis、Stability AI和LAION的研究人员和工程师创建。

基于Stable Diffusion的开源技术,我们可以进行下面的一些操作:

  1. 根据文字生成图片;
  2. 根据文字+图片生成图片;
  3. 通过各种插件控制图片的生成质量和效果;
  4. 其他很多功能;

生成图像的效果可以参考我掘金中的文章,比如:

  1. 🎨日日AIGC:微笑着,好运来-多图预警
  2. 🎨日日AIGC:神奇世界的建筑-多图预警
  3. 🎨日日AIGC:战争与和平-多图预警
  4. 🎨日日AIGC:画了个画,风雨过后的程序员-多图预警
  5. 🎨日日AIGC:画个冰雪奇缘的Elsa
  6. 🎨日日AIGC:来自东北的五彩狐仙-多图预警
  7. 🎨日日AIGC:来自大连的赛博朋克-多图预警
  8. 🎨日日AIGC:来自大连的小丑女-多图预警
  9. AI风格调研-Punk Style💥
  10. AI风格调研-地狱恶魔(女)🔥

什么是Lora?

完整的名字应该叫做Low-Rank Adaptation of Large Language Models,翻译成汉语是大语言模型的低阶适应,从资料上看是微软的研究人员为了解决大语言模型微调而开发的一项技术。

在AI绘图领域,更多是指基于大模型的一种微调技术,常见的有人像Lora、风格Lora、特征Lora等等,Lora主要是针对U-Net这一部分进行的微调。

训练Lora

在掘金写过一些Lora的训练教程,有兴趣的可以细看下哈

  1. 云服务上进行Lora训练(俗称炼丹)👗👗👗
  2. Lora训练实战-第2章节

什么是Diffusers?

Diffusers库是一个开创性的工具,用于生成各种类型的数据,包括图像、音频等等。主要功能如下:

  1. 能够利用扩散stabled diffusion模型生成图像。
  2. 使用不同的噪声调节器来平衡模型生成速度和质量之间的关系。

简单使用Diffusers

简单的写个使用Diffusers生成图像的Python脚本,其实整体上是比较简单的。目前业界也有一种工作流程,就是通过某种顺序依次调用不同的模型以实现最终的图片生成效果。

python 复制代码
import torch
from diffusers import DiffusionPipeline, AutoencoderKL

# mps是Mac的神经网络
device = "cuda" if torch.cuda.is_available() else "mps"
vae = AutoencoderKL.from_pretrained('madebyollin/sdxl-vae-fp16-fix', torch_dtype=torch.float16)
pipe = DiffusionPipeline.from_pretrained(
    "stabilityai/stable-diffusion-xl-base-1.0",
    vae=vae, torch_dtype=torch.float16, variant="fp16",
    use_safetensors=True
)
pipe.to(device)
prompt = "Fujifilm Provia 400X M85, This K-pop girl is full of liveliness and energy, with wet dress, enjoying dancing, Breathtaking, professional, bokeh, highly detailed, Shadowy, "
negativeprompt = "anime, cartoon, 3D, graphic, text, painting, crayon, graphite, abstract, glitch, deformed, mutated, ugly, umbrella,"
image = pipe(
    prompt=prompt,
    negative_prompt=negativeprompt,
    num_inference_steps=30,
    height=768,
    width=512
).images[0]
image.save(f"image.png")

执行后,可以看到生成图像的进度条 生成的结果可能不太好,实际使用的时候,还需要对各个参数进行微调。

工作内容

大部分公司对Lora模型训练师的要求都比较简单,也就是训练出符合要求的Lora微调模型。

也有一部分更加高端的,需要使用Diffusers或者ComfyUI进行AI工作流程的定制,比如

  1. Stable Diffusion 小技巧:重绘脸部
  2. ✅分享新知识:AI绘画中常用的工作流程

目前行业前景应该不错,毕竟比较新,供需关系还没有平衡。

从学习成本来说,目前的模型迭代很频繁,是否跟进还需要看个人意愿。其他的相关文章可以关注我的掘金账号哈。

钱景

我不晓得具体的钱景,只能通过圈子内的聊天略见一斑。如果,失业之后难以找到工作,那么尝试下这个方向也未尝不可。

另外,当作一个兴趣也是不错的选择,甚至用生成的AI图来运营自媒体。比如

  1. 【出路】23天小红书运营经验分享
  2. 【出路】36天小红书运营经验分享
  3. 【出路】43天小红书运营经验分享

这个季节,钱难赚,出路更难找。

相关推荐
东方翱翔6 分钟前
CSS的三种基本选择器
前端·css
Fan_web29 分钟前
JavaScript高级——闭包应用-自定义js模块
开发语言·前端·javascript·css·html
yanglamei196237 分钟前
基于GIKT深度知识追踪模型的习题推荐系统源代码+数据库+使用说明,后端采用flask,前端采用vue
前端·数据库·flask
千穹凌帝37 分钟前
SpinalHDL之结构(二)
开发语言·前端·fpga开发
Adolf_199340 分钟前
Flask-JWT-Extended登录验证, 不用自定义
后端·python·flask
dot.Net安全矩阵1 小时前
.NET内网实战:通过命令行解密Web.config
前端·学习·安全·web安全·矩阵·.net
叫我:松哥1 小时前
基于Python flask的医院管理学院,医生能够增加/删除/修改/删除病人的数据信息,有可视化分析
javascript·后端·python·mysql·信息可视化·flask·bootstrap
海里真的有鱼1 小时前
Spring Boot 项目中整合 RabbitMQ,使用死信队列(Dead Letter Exchange, DLX)实现延迟队列功能
开发语言·后端·rabbitmq
Hellc0071 小时前
MacOS升级ruby版本
前端·macos·ruby
工业甲酰苯胺1 小时前
Spring Boot 整合 MyBatis 的详细步骤(两种方式)
spring boot·后端·mybatis