HeyGen AI 三步创建产品广告视频

Hugging Face 官方教程:消费级显卡实现 FLUX.1-dev 微调

Hugging Face[1] 官方发布教程《LoRA Fine-Tuning FLUX.1-dev on Consumer Hardware》,详细讲解如何在单张消费级显卡(10GB显存)上,使用 QLoRA 技术和 diffusers 库对 FLUX.1-dev 模型进行高效微调。

佬们可以在这里看完整教程细节[2]

Kyutai 推出 STT 模型

Kyutai Speech-To-Text 是一款开源的语音转文本模型,支持流式传输和批量推理两种模式,运行速度极快。它提供两个版本:

  1. 纯英语 2.6B 参数模型 - 即使作为流式模型,在基准测试中表现也优于 Whisper Large v3
  2. 轻量级 1B 参数双语模型 - 专为英语/法语实时语音聊天应用优化

可惜没有中文,佬们可以直接在官方渠道[3]下载模型、查看代码。

Adobe 发布 Self Forcing:基于 Wang 2.1 的实时视频生成

Self Forcing[4] 是 Adobe 最新推出的基于 Wang 2.1 实现的实时流式视频生成模型。该模型在单张 RTX 4090 显卡上即可实现流式视频生成。

佬们可以试试这个社区实现的在线试用[5] Space

NVIDIA 发布 UniRelight:基于扩散模型的通用视频重照明技术

NVIDIA AI 团队最新推出的 UniRelight[6] 是一项基于扩散模型的通用重照明技术。

该技术能够仅凭单个图像或视频就实现高质量的重新照明效果。

从官方演示来看,效果非常不错,项目的代码即将开源,感兴趣的佬可以先到官网查看示例。

HeyGen 推出 AI 广告生成工具:三步创建产品视频

HeyGen 最新推出的 Product Placement[7] 功能,只需上传产品照片、选择一个人像、输入文案脚本,即可生成产品介绍视频。

相关推荐
李子圆圆9 分钟前
地下安全防线:电缆通道防外破地钉如何守护城市隐形生命线
大数据·人工智能
火山引擎边缘云10 分钟前
更强模型效果!豆包大模型 1.6 系列上线边缘大模型网关,最高申领1000万免费 Tokens
人工智能·aigc
我在北京coding21 分钟前
基于OpenCv(开源计算机视觉库)的图像旋转匹配
人工智能·opencv·计算机视觉
西猫雷婶25 分钟前
python学智能算法(十四)|机器学习朴素贝叶斯方法进阶-CountVectorizer文本处理简单测试
人工智能·python·机器学习
lgbisha1 小时前
华为云Flexus+DeepSeek征文|体验华为云ModelArts快速搭建Dify-LLM应用开发平台并搭建查询数据库的大模型工作流
人工智能·ai·自然语言处理·华为云
愚者大大1 小时前
自然语言处理相关基本概念
人工智能·自然语言处理
十子木1 小时前
什么是池化
人工智能·深度学习·机器学习·cnn
PRML_MAN1 小时前
OpenCV指定pid和vid通过MSMF打开摄像头
人工智能·opencv·计算机视觉
聚客AI1 小时前
🧠 预训练核心解密:Masked Language Model运作原理解析
人工智能·llm·掘金·日新计划
说私域1 小时前
社群经济视阈下开源AI智能名片链动2+1模式与S2B2C商城小程序在私域电商中的融合应用研究
人工智能·小程序·开源·零售