多模态大模型通过外接数据方案实现电力智能巡检(设计方案)

大模型相关目录

大模型,包括部署微调prompt/Agent应用开发、知识库增强、数据库增强、知识图谱增强、自然语言处理、多模态等大模型应用开发内容
从0起步,扬帆起航。

  1. 大模型应用向开发路径:AI代理工作流
  2. 大模型应用开发实用开源项目汇总
  3. 大模型问答项目问答性能评估方法
  4. 大模型数据侧总结
  5. 大模型token等基本概念及参数和内存的关系
  6. 大模型应用开发-华为大模型生态规划
  7. 从零开始的LLaMA-Factory的指令增量微调
  8. 基于实体抽取-SMC-语义向量的大模型能力评估通用算法(附代码)
  9. 基于Langchain-chatchat的向量库构建及检索(附代码)
  10. 一文教你成为合格的Prompt工程师
  11. 最简明的大模型agent教程
  12. 批量使用API调用langchain-chatchat知识库能力
  13. langchin-chatchat部分开发笔记(持续更新)
  14. 文心一言、讯飞星火、GPT、通义千问等线上API调用示例
  15. 大模型RAG性能提升路径
  16. langchain的基本使用
  17. 结合基础模型的大模型多源信息应用开发
  18. COT:大模型的强化利器
  19. 多角色大模型问答性能提升策略(附代码)
  20. 大模型接入外部在线信息提升应用性能
  21. 从零开始的Dify大模型应用开发指南
  22. 基于dify开发的多模态大模型应用(附代码)
  23. 基于零一万物多模态大模型通过外接数据方案优化图像文字抽取系统
  24. 快速接入stable diffusion的文生图能力
  25. 多模态大模型通过外接数据方案实现电力智能巡检(设计方案)

文章目录


需求介绍

传统电网智能巡检锚定摄像机点位,将一系列点位组成巡检业务,通过yolo对一系列点位上传来的系列图像进行目标检测,发现预训练所设定的label后计为异常,最后返回巡检报告,报告内容包括点位总体异常占比、异常类型分布、异常置信度等等。

易知,该模式下,巡检颗粒度止步异常类型,其只起到异常检测的作用,对更详细的异常处理方案、该异常点位负责人、该异常点位相关信息等等信息未能更好利用。【事实上该问题我已在https://blog.csdn.net/qq_43128256/article/details/137204652一文中提出了解决方案】

此外,该模式下,其异常评估标准单一,识别模式较弱。例如,对于工装检查,传统yolo模式检测下,往往简单地将长袖归为正常,将短袖、卷袖一律视为不正常,这与实际判别逻辑存在一定距离。这是由于yolo小模型目标检测上能力的局限带来的。

解决方案

多模态大模型的相关能力和应用开发可参考我的系列文章:

https://blog.csdn.net/qq_43128256/article/details/138163078

https://blog.csdn.net/qq_43128256/article/details/138337768

https://blog.csdn.net/qq_43128256/article/details/138574623

本文想说的是,多模态大模型完全具备很强的图像理解能力,且完全可通过agent组多步利用其语义理解和逻辑推理能力,结合外接信息,对图像进行综合分析,实现 更高颗粒度下的异常巡检,以更贴合实际逻辑的标准进行识别

具体如下图所示:

多模态大模型

  1. 可利用文本对齐能力,对图像进行描述
  2. 可通过检测要求(利用prompt进行规范),对图片重点部分进行检测
  3. 可结合外部信息(脚本加载,嵌入query),与检测结果综合分析
  4. 最终给出隐患描述、隐患级别、整改措施等结论

其实现可参考往期代码,利用dify开发比较简单。

多模态大模型在线试用

https://huggingface.co/spaces/HuggingFaceM4/idefics2_playground

相关推荐
h64648564h9 分钟前
CANN 性能剖析与调优全指南:从 Profiling 到 Kernel 级优化
人工智能·深度学习
数据与后端架构提升之路11 分钟前
论系统安全架构设计及其应用(基于AI大模型项目)
人工智能·安全·系统安全
忆~遂愿14 分钟前
ops-cv 算子库深度解析:面向视觉任务的硬件优化与数据布局(NCHW/NHWC)策略
java·大数据·linux·人工智能
Liue6123123118 分钟前
YOLO11-C3k2-MBRConv3改进提升金属表面缺陷检测与分类性能_焊接裂纹气孔飞溅物焊接线识别
人工智能·分类·数据挖掘
一切尽在,你来26 分钟前
第二章 预告内容
人工智能·langchain·ai编程
八零后琐话28 分钟前
干货:程序员必备性能分析工具——Arthas火焰图
开发语言·python
23遇见30 分钟前
基于 CANN 框架的 AI 加速:ops-nn 仓库的关键技术解读
人工智能
Codebee39 分钟前
OoderAgent 企业版 2.0 发布的意义:一次生态战略的全面升级
人工智能
光泽雨1 小时前
检测阈值 匹配阈值分析 金字塔
图像处理·人工智能·计算机视觉·机器视觉·smart3