数据科学每日总结--Day43--计算机视觉

简介

计算机视觉是人工智能(AI)的一个领域,使计算机能够基于视觉输入(如图像、视频和实时相机馈送。它模仿了人类看待和理解世界的方式,但有能力更快、更准确地处理大量数据,比较常见的是面部识别,对象检测和图像分类。

演变史

在初期,人们通过把图像分成一个个圆来框选不同的部分,后来,随着光流的诞生(通过像素来判断),逐渐可以捕捉到更具体的事物。接着,边缘算法的诞生,使人们在很长一段时间内,把图像变化明显的部分称作边缘,以此分割图像。紧接着是划时代的创新,机器学习和深度学习的产物:神经网络,展示了强大的图像分类能力;最后是最近几年的人工智能结合计算机视觉。

从一开始的简陋的几何形状,到后来甚至能够自主根据图像回答问题,代表了视觉研究的角度的变化,从探究形状到深层的像素。

目的

一开始,计算机视觉只是用来识别简单的东西,比如人的字迹,修复修复不清楚的数字,到后来,便利性提高到了为人类服务,比如人脸识别,瞳孔追踪,这让不用密码却能登录成了可能;以及娱乐app里的3D特效,AI生成脸,智能驾驶和登上火星的检测仪,能够获取并识别高质量的图像。

这其中所反映的就是从观察像素,到从图像上提取特征,虽然都是用来区分图像,但是后者是前者加工后的数字化信息。

常用的技术有

  • 边缘检测:通过识别图像中对象边界的技术强度或颜色发生显著变化的检测点,将图像转换为区域或对象

  • 目标检测:识别和定位图像中对象,通常用于面部识别系统、检测行人的自动车辆等

  • 图像分类:根据图像的内容将标签或类别分配给图像的过程,广泛用于医学判断(比如识别,标记肿瘤)

  • 面部识别:基于面部特征识别或验证个人身份的技术,广泛用于访问控制安全系统、社交媒体平台

  • 卷积神经网络:通过自适应地学习空间层次的特征,达到自动分类图像的效果,一般用于图像识别,自动驾驶

相关推荐
AI_小站1 小时前
6个GitHub爆火的免费大模型教程,助你快速进阶AI编程
人工智能·langchain·github·知识图谱·agent·llama·rag
xindoo1 小时前
GitHub Trending霸榜!深度解析AI Coding辅助神器 Superpowers
人工智能·github
时间之里1 小时前
【深度学习】:RF-DETR与yolo对比
人工智能·深度学习·yolo
北京阿法龙科技有限公司1 小时前
数智化升级:AR 智能眼镜驱动工业运维效能革新
人工智能
风落无尘1 小时前
《智能重生:从垃圾堆到AI工程师》——第二章 概率与生存
大数据·人工智能
j_xxx404_1 小时前
Linux:静态链接与动态链接深度解析
linux·运维·服务器·c++·人工智能
收获不止数据库2 小时前
达梦9发布会归来:AI 时代,我们需要一款什么样的数据库?
数据库·人工智能·ai·语言模型·数据分析
hhb_6182 小时前
AI全栈编程生存指南
人工智能
AI-Frontiers2 小时前
transformer进阶之路:#2 工作原理详解
人工智能·深度学习·transformer
科研前沿2 小时前
2026 数字孪生前沿科技:全景迭代报告 —— 镜像视界生成式孪生(Generative DT)技术白皮书
大数据·人工智能·科技·算法·音视频·空间计算