MatAnyone本地部署,视频分割处理,绿幕抠像(WIN/MAC)

大家好,今天要和大家分享的项目是MatAnyone ,与上一篇分享的SAM2LONG类似,不过上次的分享没有提到如何在 MAC 上部署,后来有小伙伴私信说希望能出一个 MAC 版本的。那正好看到MatAnyone这个项目顺手就写下来。该项目基于SAM2同样可以一键抠出视频中的主体,快速输出绿幕视频或者是AlphaMask视频。本篇会分享本地手动部署流程以及MatAnyone的使用方法。

以下是手动部署的步骤,也可以直接使用一键包进行部署。

手动部署

克隆代码仓库
python 复制代码
git clone https://github.com/pq-yang/MatAnyone
cd MatAnyone
创建 Conda 虚拟环境
python 复制代码
conda create -n matanyone python=3.10 -y
安装依赖
python 复制代码
pip install -e .
python 复制代码
pip3 install -r hugging_face/requirements.txt
安装FFmpeg
python 复制代码
# macOS
brew install ffmpeg

# Windows (通过 Chocolatey)
choco install ffmpeg

# Ubuntu/Debian
sudo apt install ffmpeg
安装pytorch

windows

安装 CUDA 12.8 支持的 PyTorch 套件,启用 GPU 加速。

python 复制代码
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu128

MAC

python 复制代码
pip3 install torch torchvision torchaudio

MAC部署需要修改下matanyone_wrapper.py第44行

python 复制代码
 device = torch.device("mps") if torch.backends.mps.is_available() else torch.device("cpu")
    mask = torch.from_numpy(mask).to("cpu")


    frames_np = [frames_np[0]]* n_warmup + frames_np

    frames = []
    phas = []
    for ti, frame_single in tqdm.tqdm(enumerate(frames_np)):
        image = to_tensor(frame_single).to("cpu").float()
运行

首次运行会自动下载模型

python 复制代码
python hugging_face/app.py

使用教程

上传需要处理的视频

点击加载视频

点击右边的区域可以选择蒙版

支持多选

选择完成后点击下方的视频抠图

最后输出绿幕视频以及Alpha视频

配置需求

Windows

WindowsN卡需10G显存

如果运行报错,需要安装cuda12.8

https://developer.nvidia.com/cuda-12-8-0-download-archive

支持50系显卡

MAC

MAC Apple Silicon M1/M2/M3/M4 芯片

10G内存以上

关于速度

11秒视频(每秒24帧)

4090完成花费60秒左右。

5090完成花费45秒左右。

MAC M1 MAX完成花费20分钟左右。

整合包获取

👇🏻👇🏻👇🏻下方下方下方👇🏻👇🏻👇🏻

夸夸夸盘:

https://pan.quark.cn/s/9160ab732d7b

度度度盘:

https://pan.baidu.com/s/1OKOTyzo-PW9Zd3HVK4QK0w?pwd=p7x3

制作不易,如果本文对您有帮助,还请点个免费的赞或关注!感谢您的阅读!

相关推荐
TeleostNaCl6 分钟前
解决 Chrome 无法访问网页但无痕模式下可以访问该网页 的问题
前端·网络·chrome·windows·经验分享
音视频牛哥2 小时前
从协议规范和使用场景探讨为什么SmartMediaKit没有支持DASH
人工智能·音视频·大牛直播sdk·dash·dash还是rtmp·dash还是rtsp·dash还是hls
音视频牛哥2 小时前
SmartMediaKit:如何让智能系统早人一步“跟上现实”的时间架构--从实时流媒体到系统智能的演进
人工智能·计算机视觉·音视频·音视频开发·具身智能·十五五规划具身智能·smartmediakit
音视频牛哥3 小时前
超清≠清晰:视频系统里的分辨率陷阱与秩序真相
人工智能·机器学习·计算机视觉·音视频·大牛直播sdk·rtsp播放器rtmp播放器·smartmediakit
johnny2333 小时前
AI视频创作工具汇总:MoneyPrinterTurbo、KrillinAI、NarratoAI、ViMax
人工智能·音视频
寒某4 小时前
在Windows上部署RAGFlow
windows·ai
DolphinScheduler社区4 小时前
真实迁移案例:从 Azkaban 到 DolphinScheduler 的选型与实践
java·大数据·开源·任务调度·azkaban·海豚调度·迁移案例
安全不再安全5 小时前
免杀技巧 - 早鸟注入详细学习笔记
linux·windows·笔记·学习·测试工具·web安全·网络安全
猫头虎5 小时前
昆仑芯 X HAMi X 百度智能云 | 昆仑芯 P800 XPU/vXPU 双模式算力调度方案落地
人工智能·百度·开源·aigc·文心一言·gpu算力·agi
2501_915106326 小时前
App 怎么上架 iOS?从准备资料到开心上架(Appuploader)免 Mac 上传的完整实战流程指南
android·macos·ios·小程序·uni-app·iphone·webview