论文阅读——SimpleClick

SimpleClick: Interactive Image Segmentation with Simple Vision Transformers

模型直接在VIT上增加交互是分割

用VIT MAE方法训练的预训练权重

用交互式分割方法微调,微调流程:

1、在当前分割自动模拟点击,没有人为提供的点击

受到RITM启发,使用随机和迭代的点击模拟策略结合。

随机点击生成的点不考虑顺序,

迭代点击模拟策略生成的点是有顺序的,后一次点击应该在前次点击生成的掩码错误的区域,更像人类点击。

2、结合前次交互得到的掩码作为额外输入,提高分割质量,以及根据现有的分割掩码refine.

损失函数:normalized focal loss

实验结果:

相关推荐
克里斯蒂亚诺·罗纳尔达3 分钟前
智能体学习16——学习与适应(Learning-and-Adaptation)-深入解读
深度学习·学习·机器学习
小蒋聊技术3 分钟前
电商系列第五课:支付中心——资金安全、幂等设计与 AI 风控大脑
人工智能·安全
AC赳赳老秦6 分钟前
OpenClaw text-translate技能:多语言批量翻译,解决跨境工作沟通难题
大数据·运维·数据库·人工智能·python·deepseek·openclaw
SuAluvfy8 分钟前
2026年大模型免费版体验评测:从“无限供给”到“精细配额”的转折点
人工智能·agent
call me by ur name11 分钟前
ERNIE 5.0 Technical Report论文解读
android·开发语言·人工智能·机器学习·ai·kotlin
ZC跨境爬虫13 分钟前
dankoe视频笔记:如何培养对自己喜欢之事的痴迷感
人工智能·笔记·搜索引擎
追风少年ii14 分钟前
HD文献分享(正刊)--结肠炎的表观遗传记忆促进肿瘤生长
人工智能
西陵15 分钟前
别再写 Prompt 了Spec Mode 才是下一代 AI 编程范式
前端·人工智能·ai编程
冰西瓜60018 分钟前
深度学习的数学原理(二十六)—— 多头注意力
人工智能·深度学习
子兮、20 分钟前
DotCloudLib点云后处理算法库首次开源!
人工智能·算法库