数据科学每日总结--Day43--计算机视觉

简介

计算机视觉是人工智能(AI)的一个领域,使计算机能够基于视觉输入(如图像、视频和实时相机馈送。它模仿了人类看待和理解世界的方式,但有能力更快、更准确地处理大量数据,比较常见的是面部识别,对象检测和图像分类。

演变史

在初期,人们通过把图像分成一个个圆来框选不同的部分,后来,随着光流的诞生(通过像素来判断),逐渐可以捕捉到更具体的事物。接着,边缘算法的诞生,使人们在很长一段时间内,把图像变化明显的部分称作边缘,以此分割图像。紧接着是划时代的创新,机器学习和深度学习的产物:神经网络,展示了强大的图像分类能力;最后是最近几年的人工智能结合计算机视觉。

从一开始的简陋的几何形状,到后来甚至能够自主根据图像回答问题,代表了视觉研究的角度的变化,从探究形状到深层的像素。

目的

一开始,计算机视觉只是用来识别简单的东西,比如人的字迹,修复修复不清楚的数字,到后来,便利性提高到了为人类服务,比如人脸识别,瞳孔追踪,这让不用密码却能登录成了可能;以及娱乐app里的3D特效,AI生成脸,智能驾驶和登上火星的检测仪,能够获取并识别高质量的图像。

这其中所反映的就是从观察像素,到从图像上提取特征,虽然都是用来区分图像,但是后者是前者加工后的数字化信息。

常用的技术有

  • 边缘检测:通过识别图像中对象边界的技术强度或颜色发生显著变化的检测点,将图像转换为区域或对象

  • 目标检测:识别和定位图像中对象,通常用于面部识别系统、检测行人的自动车辆等

  • 图像分类:根据图像的内容将标签或类别分配给图像的过程,广泛用于医学判断(比如识别,标记肿瘤)

  • 面部识别:基于面部特征识别或验证个人身份的技术,广泛用于访问控制安全系统、社交媒体平台

  • 卷积神经网络:通过自适应地学习空间层次的特征,达到自动分类图像的效果,一般用于图像识别,自动驾驶

相关推荐
视觉&物联智能15 小时前
【杂谈】-企业人工智能超越实验:安全拓展的实践路径
人工智能·安全·aigc·agent·agi
ting945200015 小时前
Kirki 深度技术解析:WordPress 自定义控件开发与可视化配置底层原理
人工智能·架构
掘金一周15 小时前
想换一辆电车,JYM有什么推荐 | 沸点周刊 5.21
前端·人工智能·后端
创世宇图15 小时前
【AI入门知识点】LLM 原理是什么?为什么 ChatGPT 看起来像“会思考”?
人工智能·ai·llm·token
不爱吃糖的程序媛15 小时前
2026年Electron 鸿蒙PC环境搭建指南
人工智能·华为·harmonyos
码途漫谈15 小时前
让 AI 编程不断线:9Router 的本地模型路由与 Token 节流术
人工智能·ai·开源·ai编程
nashane15 小时前
HarmonyOS 6学习:长截图功能开发中的滚动拼接与权限处理实战
人工智能·华为·harmonyos
zhojiew15 小时前
在本地PostgreSQL使用pgvector构建生成式 AI 应用的实践
数据库·人工智能·postgresql
hogenlaw15 小时前
AI 编程概念扫盲
人工智能
莱歌数字15 小时前
从6DOF到近场动力学:多物理场耦合仿真的技术跃迁与工程实践
人工智能·科技·cae·液冷散热·散热齿