MatAnyone本地部署,视频分割处理,绿幕抠像(WIN/MAC)

大家好,今天要和大家分享的项目是MatAnyone ,与上一篇分享的SAM2LONG类似,不过上次的分享没有提到如何在 MAC 上部署,后来有小伙伴私信说希望能出一个 MAC 版本的。那正好看到MatAnyone这个项目顺手就写下来。该项目基于SAM2同样可以一键抠出视频中的主体,快速输出绿幕视频或者是AlphaMask视频。本篇会分享本地手动部署流程以及MatAnyone的使用方法。

以下是手动部署的步骤,也可以直接使用一键包进行部署。

手动部署

克隆代码仓库
python 复制代码
git clone https://github.com/pq-yang/MatAnyone
cd MatAnyone
创建 Conda 虚拟环境
python 复制代码
conda create -n matanyone python=3.10 -y
安装依赖
python 复制代码
pip install -e .
python 复制代码
pip3 install -r hugging_face/requirements.txt
安装FFmpeg
python 复制代码
# macOS
brew install ffmpeg

# Windows (通过 Chocolatey)
choco install ffmpeg

# Ubuntu/Debian
sudo apt install ffmpeg
安装pytorch

windows

安装 CUDA 12.8 支持的 PyTorch 套件,启用 GPU 加速。

python 复制代码
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu128

MAC

python 复制代码
pip3 install torch torchvision torchaudio

MAC部署需要修改下matanyone_wrapper.py第44行

python 复制代码
 device = torch.device("mps") if torch.backends.mps.is_available() else torch.device("cpu")
    mask = torch.from_numpy(mask).to("cpu")


    frames_np = [frames_np[0]]* n_warmup + frames_np

    frames = []
    phas = []
    for ti, frame_single in tqdm.tqdm(enumerate(frames_np)):
        image = to_tensor(frame_single).to("cpu").float()
运行

首次运行会自动下载模型

python 复制代码
python hugging_face/app.py

使用教程

上传需要处理的视频

点击加载视频

点击右边的区域可以选择蒙版

支持多选

选择完成后点击下方的视频抠图

最后输出绿幕视频以及Alpha视频

配置需求

Windows

WindowsN卡需10G显存

如果运行报错,需要安装cuda12.8

https://developer.nvidia.com/cuda-12-8-0-download-archive

支持50系显卡

MAC

MAC Apple Silicon M1/M2/M3/M4 芯片

10G内存以上

关于速度

11秒视频(每秒24帧)

4090完成花费60秒左右。

5090完成花费45秒左右。

MAC M1 MAX完成花费20分钟左右。

整合包获取

👇🏻👇🏻👇🏻下方下方下方👇🏻👇🏻👇🏻

夸夸夸盘:

https://pan.quark.cn/s/9160ab732d7b

度度度盘:

https://pan.baidu.com/s/1OKOTyzo-PW9Zd3HVK4QK0w?pwd=p7x3

制作不易,如果本文对您有帮助,还请点个免费的赞或关注!感谢您的阅读!

相关推荐
cup111 分钟前
[Full Clock 技术复盘] 一、浏览器前端如何实现百毫秒级时间校准?时间 API 推荐、模拟 NTP 算法原理及局限
typescript·开源·api·时钟·时间同步
不爱洗脚的小滕21 分钟前
【RAG】召回(Retrieval)与重排(Rerank)核心技术要点汇总
langchain·aigc·ai编程·rag
win4r2 小时前
MiniMax M3 深度体验:这可能是国产模型里最接近“全能工程师”的一次
aigc·ai编程·claude
冬奇Lab3 小时前
每日一个开源项目(第118篇):SkillOpt - 像训练神经网络一样优化 LLM Agent 的技能
人工智能·开源·agent
妄想出头的工业炼药师3 小时前
GS slam mono
算法·开源
Cheng小攸5 小时前
综合实验2
网络·windows
后端小肥肠5 小时前
效率狂飙9000%!Codex + HyperFrames 让一篇文章 5 分钟变视频
人工智能·aigc·agent
DigitalOcean7 小时前
AI推理成本砍半:DigitalOcean 批量推理服务正式上线
aigc·agent
酿情师7 小时前
Microsoft Visual C++ Build Tools 2026 下载与安装指南(Windows)
c++·windows·microsoft
妄想出头的工业炼药师9 小时前
暗光长走廊特殊场景视觉解决方案
算法·开源