数据科学每日总结--Day43--计算机视觉

简介

计算机视觉是人工智能(AI)的一个领域,使计算机能够基于视觉输入(如图像、视频和实时相机馈送。它模仿了人类看待和理解世界的方式,但有能力更快、更准确地处理大量数据,比较常见的是面部识别,对象检测和图像分类。

演变史

在初期,人们通过把图像分成一个个圆来框选不同的部分,后来,随着光流的诞生(通过像素来判断),逐渐可以捕捉到更具体的事物。接着,边缘算法的诞生,使人们在很长一段时间内,把图像变化明显的部分称作边缘,以此分割图像。紧接着是划时代的创新,机器学习和深度学习的产物:神经网络,展示了强大的图像分类能力;最后是最近几年的人工智能结合计算机视觉。

从一开始的简陋的几何形状,到后来甚至能够自主根据图像回答问题,代表了视觉研究的角度的变化,从探究形状到深层的像素。

目的

一开始,计算机视觉只是用来识别简单的东西,比如人的字迹,修复修复不清楚的数字,到后来,便利性提高到了为人类服务,比如人脸识别,瞳孔追踪,这让不用密码却能登录成了可能;以及娱乐app里的3D特效,AI生成脸,智能驾驶和登上火星的检测仪,能够获取并识别高质量的图像。

这其中所反映的就是从观察像素,到从图像上提取特征,虽然都是用来区分图像,但是后者是前者加工后的数字化信息。

常用的技术有

  • 边缘检测:通过识别图像中对象边界的技术强度或颜色发生显著变化的检测点,将图像转换为区域或对象

  • 目标检测:识别和定位图像中对象,通常用于面部识别系统、检测行人的自动车辆等

  • 图像分类:根据图像的内容将标签或类别分配给图像的过程,广泛用于医学判断(比如识别,标记肿瘤)

  • 面部识别:基于面部特征识别或验证个人身份的技术,广泛用于访问控制安全系统、社交媒体平台

  • 卷积神经网络:通过自适应地学习空间层次的特征,达到自动分类图像的效果,一般用于图像识别,自动驾驶

相关推荐
愈努力俞幸运9 分钟前
llm+agent,使用与 OpenAI 兼容的 API 格式
人工智能
IT_陈寒10 分钟前
Vue组件复用率提升300%?这5个高阶技巧让你的代码焕然一新!
前端·人工智能·后端
jkyy201414 分钟前
破局家电同质化:智能冰箱+主动健康,解锁家庭健康新赛道
大数据·人工智能·健康医疗
王知无(import_bigdata)19 分钟前
一个极简的AI Agentic Engineering技术栈学习路线
人工智能·学习
ToB营销学堂26 分钟前
B2B AI内容实战指南:AI提效 x GEO获客 x 增长闭环
人工智能·geo·b2b营销获客
东离与糖宝36 分钟前
Java 玩转 AI 智能体性能优化:OpenClaw 高并发调用与 Token 成本控制实战
java·人工智能
芯片-嵌入式42 分钟前
具身智能(3):有哪些AI模型
人工智能·深度学习·机器学习
skywalk816344 分钟前
在LMStudio中使用microsoft_Fara-7B 模型(未实践)
人工智能·microsoft
cxr8281 小时前
创建专业虚拟一人公司的 Skills 深度对比分析
人工智能·ai智能体·openclaw
未来之窗软件服务1 小时前
vosk-ASR python调用[AI人工智能(五十一)]—东方仙盟
人工智能·vosk·仙盟创梦ide·东方仙盟