数据科学每日总结--Day43--计算机视觉

简介

计算机视觉是人工智能(AI)的一个领域,使计算机能够基于视觉输入(如图像、视频和实时相机馈送。它模仿了人类看待和理解世界的方式,但有能力更快、更准确地处理大量数据,比较常见的是面部识别,对象检测和图像分类。

演变史

在初期,人们通过把图像分成一个个圆来框选不同的部分,后来,随着光流的诞生(通过像素来判断),逐渐可以捕捉到更具体的事物。接着,边缘算法的诞生,使人们在很长一段时间内,把图像变化明显的部分称作边缘,以此分割图像。紧接着是划时代的创新,机器学习和深度学习的产物:神经网络,展示了强大的图像分类能力;最后是最近几年的人工智能结合计算机视觉。

从一开始的简陋的几何形状,到后来甚至能够自主根据图像回答问题,代表了视觉研究的角度的变化,从探究形状到深层的像素。

目的

一开始,计算机视觉只是用来识别简单的东西,比如人的字迹,修复修复不清楚的数字,到后来,便利性提高到了为人类服务,比如人脸识别,瞳孔追踪,这让不用密码却能登录成了可能;以及娱乐app里的3D特效,AI生成脸,智能驾驶和登上火星的检测仪,能够获取并识别高质量的图像。

这其中所反映的就是从观察像素,到从图像上提取特征,虽然都是用来区分图像,但是后者是前者加工后的数字化信息。

常用的技术有

  • 边缘检测:通过识别图像中对象边界的技术强度或颜色发生显著变化的检测点,将图像转换为区域或对象

  • 目标检测:识别和定位图像中对象,通常用于面部识别系统、检测行人的自动车辆等

  • 图像分类:根据图像的内容将标签或类别分配给图像的过程,广泛用于医学判断(比如识别,标记肿瘤)

  • 面部识别:基于面部特征识别或验证个人身份的技术,广泛用于访问控制安全系统、社交媒体平台

  • 卷积神经网络:通过自适应地学习空间层次的特征,达到自动分类图像的效果,一般用于图像识别,自动驾驶

相关推荐
阿里云大数据AI技术29 分钟前
光轮智能 × 阿里云:共建 Physical AI 云上数据、评测与持续学习基础设施
人工智能·机器学习
机器之心35 分钟前
实锤了:Claude Code偷查用户,时区、中国AI实验室全是关键词
人工智能·openai
网易云信36 分钟前
Cursor点燃个人开发者,企业级AI为何频频受挫?Agent工厂从提效工具到AI员工的跃迁
人工智能·开源
网易云信40 分钟前
解锁触手可及的温暖:网易智企 x Wander Puffs AI 云游泡芙
人工智能
转转技术团队1 小时前
从 PRD 到可验证代码:AI 需求开发闭环实践
人工智能
机器之心1 小时前
飞书让表格变成「AI同事」加入群聊,不打开表就能用表
人工智能·openai
Bigfish_coding2 小时前
前端转agent-【python】-15 AI Agent 可观测性入门:LangFuse 链路追踪、Token 监控与 LLM 质量评估
人工智能
我唔知啊2 小时前
我把 Claude Code 拆成了一间餐厅:从一句话到一次回复,中间到底发生了什么
人工智能
Harry技术2 小时前
02 · Codex 核心概念:代理、沙箱、审批和项目说明书
人工智能