数据科学每日总结--Day43--计算机视觉

简介

计算机视觉是人工智能(AI)的一个领域,使计算机能够基于视觉输入(如图像、视频和实时相机馈送。它模仿了人类看待和理解世界的方式,但有能力更快、更准确地处理大量数据,比较常见的是面部识别,对象检测和图像分类。

演变史

在初期,人们通过把图像分成一个个圆来框选不同的部分,后来,随着光流的诞生(通过像素来判断),逐渐可以捕捉到更具体的事物。接着,边缘算法的诞生,使人们在很长一段时间内,把图像变化明显的部分称作边缘,以此分割图像。紧接着是划时代的创新,机器学习和深度学习的产物:神经网络,展示了强大的图像分类能力;最后是最近几年的人工智能结合计算机视觉。

从一开始的简陋的几何形状,到后来甚至能够自主根据图像回答问题,代表了视觉研究的角度的变化,从探究形状到深层的像素。

目的

一开始,计算机视觉只是用来识别简单的东西,比如人的字迹,修复修复不清楚的数字,到后来,便利性提高到了为人类服务,比如人脸识别,瞳孔追踪,这让不用密码却能登录成了可能;以及娱乐app里的3D特效,AI生成脸,智能驾驶和登上火星的检测仪,能够获取并识别高质量的图像。

这其中所反映的就是从观察像素,到从图像上提取特征,虽然都是用来区分图像,但是后者是前者加工后的数字化信息。

常用的技术有

  • 边缘检测:通过识别图像中对象边界的技术强度或颜色发生显著变化的检测点,将图像转换为区域或对象

  • 目标检测:识别和定位图像中对象,通常用于面部识别系统、检测行人的自动车辆等

  • 图像分类:根据图像的内容将标签或类别分配给图像的过程,广泛用于医学判断(比如识别,标记肿瘤)

  • 面部识别:基于面部特征识别或验证个人身份的技术,广泛用于访问控制安全系统、社交媒体平台

  • 卷积神经网络:通过自适应地学习空间层次的特征,达到自动分类图像的效果,一般用于图像识别,自动驾驶

相关推荐
B博士37 分钟前
科研进展 | JAG: 大光斑高光谱激光雷达遥感辐射传输模型从垂直视角解锁森林叶绿素分布密码
人工智能·jag·高光谱激光雷达·森林分层叶绿素诊断
Yao.Li2 小时前
PVN3D ORT CUDA Custom Ops 实现与联调记录
人工智能·3d·具身智能
诺伦2 小时前
LocalClaw 在智能制造的新机会:6部门AI+电商政策下的工厂AI升级方案
人工智能·制造
小陈工4 小时前
Python Web开发入门(十七):Vue.js与Python后端集成——让前后端真正“握手言和“
开发语言·前端·javascript·数据库·vue.js·人工智能·python
墨染天姬8 小时前
【AI】端侧AIBOX可以部署哪些智能体
人工智能
AI成长日志8 小时前
【Agentic RL】1.1 什么是Agentic RL:从传统RL到智能体学习
人工智能·学习·算法
2501_948114248 小时前
2026年大模型API聚合平台技术评测:企业级接入层的治理演进与星链4SAPI架构观察
大数据·人工智能·gpt·架构·claude
小小工匠8 小时前
LLM - awesome-design-md 从 DESIGN.md 到“可对话的设计系统”:用纯文本驱动 AI 生成一致 UI 的新范式
人工智能·ui
黎阳之光8 小时前
黎阳之光:视频孪生领跑者,铸就中国数字科技全球竞争力
大数据·人工智能·算法·安全·数字孪生
小超同学你好8 小时前
面向 LLM 的程序设计 6:Tool Calling 的完整生命周期——从定义、决策、执行到观测回注
人工智能·语言模型