2025计算机视觉新技术


  1. CLIP / BLIP-3 类「视觉-语言大模型」

    • 是什么:让网络自己学会"看图说话",zero-shot 就能分类、检测、检索。

    • 能干什么:不写训练代码,直接一句中文 prompt 就把商品图分成 500 类。

    • 落地难度:★☆☆(pip install open_clip_torch,CPU 也能跑)

    • 入口:https://github.com/mlfoundations/open_clip

  2. Segment Anything Model 2 (SAM-2)

    • 是什么:Meta 刚开源的"万能分割",视频里点一下即可追踪目标。

    • 能干什么:直播换背景、工业缺陷区域一键抠出,不用逐帧标注。

    • 落地难度:★☆☆(PyTorch 权重直接推理,1080Ti 可跑 720p)

    • 入口:https://github.com/facebookresearch/segment-anything-2

  3. YOLO-World / YOLOv9-Universal「开放词汇检测」

    • 是什么:YOLO 也能 zero-shot,输入"红色安全帽"就能检测没见过的东西。

    • 能干什么:工地摄像头今天想查"未戴绝缘手套",改行文本即可,不用重训。

    • 落地难度:★★☆(需 GPU 转 ONNX,边缘用 RKNN 量化)

    • 入口:https://github.com/AILab-CVC/YOLO-World

  4. 自监督 + 少样本工业缺陷检测(Diffusion + Memory Bank)

    • 是什么:用 5 张 OK 图就能学出"异常",无需缺陷样本。

    • 能干什么:手机背板划痕、布料脏点实时检,省掉千级人工标注。

    • 落地难度:★★☆(开源模型 + 10 行微调代码)

    • 入口:https://github.com/openvinotoolkit/anomalib

  5. 单目深度估计「Depth Anything V2」

    • 是什么:一张普通照片就生成 0-10 m 稠密深度图,误差 < 5%。

    • 能干什么:给 AR 导览、机器人避障当"廉价 LiDAR",成本 0 元。

    • 落地难度:★☆☆(pip install depth-anything,ONNX 仅 30 MB)

    • 入口:https://github.com/DepthAnything/Depth-Anything-V2

  6. 高光谱「伪」实时分析(RGB → 512-band 重建)

    • 是什么:AI 把普通相机 RGB 插值成 512 波段"超光谱",能看水分、糖分、药残。

    • 能干什么:果园无人机飞一圈,立刻出"糖度分布热图",无需 30 万高光谱相机。

    • 落地难度:★★★(需标定一次+GPU 推理,但硬件 0 额外成本)

    • 入口:https://github.com/StaRainJ/HyperRecon


好!

相关推荐
叫我:松哥6 分钟前
基于深度卷积神经网络的水果图片分类算法设计与实现,有ResNet50的迁移学习模型,准确率达95%
人工智能·python·神经网络·机器学习·分类·cnn·迁移学习
大囚长6 分钟前
大模型API的上下文缓存(Contextual Cache)
人工智能·缓存
无心水6 分钟前
【Hermes:团队、企业、生态与边界】47、Hermes 在 CI/CD 中的完整 DevOps 流水线:从 PR 审查到自动部署,让 Agent 接管你的发布流程
运维·人工智能·devops·openclaw·养龙虾·hermes·honcho
名不经传的养虾人11 分钟前
从0到1:企业级AI项目迭代日记 Vol.44|功能建好,和功能接通,是两件完全不同的事
人工智能·架构·agent·ai编程·企业ai
金融小师妹14 分钟前
AI因子共振模型显示:金银比突破区间上沿,白银定价逻辑进入再校准阶段
人工智能·算法·均值算法·线性回归
奶油话梅糖15 分钟前
IMA 知识库体验(内有资源分享):把资料变成可以提问的 AI 知识助手
人工智能·ai·aigc·知识图谱·知识库·学习工具·ima
老金带你玩AI18 分钟前
用ChatGPT管项目,让Codex只做Ticket
人工智能
前端不太难27 分钟前
从模型部署到智能运营:企业AI的新挑战
人工智能
ZFSS35 分钟前
VS Code + Luma MCP 使用教程
人工智能·ai·ai作画·copilot·ai编程·ai写作