图像识别

山烛4 天前
人工智能·opencv·计算机视觉·图像识别·数字识别
OpenCV 银行卡号识别目录一、项目原理与核心技术二、环境准备与工具包导入1. 环境依赖2. 工具包导入三、自定义工具类 myutils.py 实现
中科逸识10 天前
图像识别·图片文字识别·文字识别·媒资管理·ocr识别
OCR识别在媒资管理系统的应用场景剖析与选择一、核心使用场景文字识别在媒资系统中的应用贯穿于内容注入、管理、生产和分发的全生命周期。1. 自动化元数据提取与标签生成(核心价值)
小Lu的开源日常13 天前
前端·图像识别·next.js
Mathcheap v0.9.x 发布的第一个月,从想法到 MVP(最小可行性产品)一个月前,我上线了 Mathcheap v0.9.0,这是一个 AI 驱动的数学公式识别和 LaTeX 数学公式编辑器。写这篇文章,是想记录一下从 0 到 1 的过程。
用户561299910191 个月前
图像识别
逆天!AiPy 打进专业图像生成阵营,实力够格和主流平台抗衡什么,AiPy打进专业图像生成赛道了?AiPy带着图片、视频生成来啦!本期给大家测评4个国产好用的AI生图工具,不同的生图平台,算法和模型都不一样,快来Pik你的心仪工具吧~
用户6120414922131 个月前
c语言·后端·图像识别
C语言做的停车场车牌识别系统这是一个使用C语言实现的智能停车场管理系统,具备车牌识别、计费系统和车位引导功能。使用简单的gcc指令编译,无需Makefile:
汤姆yu1 个月前
人工智能·分类·数据挖掘·图像识别
基于图像识别与分类的中国蛇类识别系统博主介绍:java高级开发,从事互联网行业六年,熟悉各种主流语言,精通java、python、php、爬虫、web开发,已经做了六年的毕业设计程序开发,开发过上千套毕业设计程序,没有什么华丽的语言,只有实实在在的写点程序。
万俟淋曦1 个月前
人工智能·aigc·图像识别
人工智能图像生成的道德利弊人工智能(AI)发展迅速,尤其是近年来。据估计,超过 2.5 亿家公司(77%) 正在其运营中以某种方式使用或探索人工智能,而且这种趋势短期内不会出现任何放缓的迹象。如果说有什么不同的话,那就是人工智能的使用和可用性将在未来的几个月和几年里继续渗透。
泰Tai1 个月前
python·图像识别
【YOLOv8学习】WSL2中安装标注软件X-AnyLabeling前段时间,在wsl中安装配置了yolov8的环境,在训练模型时,需要用到标注软件,这次参考了官网的快速入门指南和GhatGPT,安装X-AnyLabeling软件,记录下安装过程与错误处理。
阿宙ppppp1 个月前
后端·图像识别
基于yolov5+LPRNet+flask+vue的车牌识别(2)总结:
阿宙ppppp1 个月前
后端·图像识别
基于yolov5+LPRNet+flask+vue的车牌识别(1)其中images中train和val存放的图片,要和label中的train和val标签文件一一对应在images和val的同级目录下的classes.txt文件中放入监测的类型,这边监测的是一种类型,就是车牌(plate)
执器1 个月前
python·图像识别
SIFT实现简单的图像匹配,查找icon在图中的位置通过SIFT匹配到icon在原图的位置(使用LightGlue库的SIFT特征匹配算法)SIFT(尺度不变特征变换) 是一种检测和描述图像局部特征的经典算法,具有尺度不变性和旋转不变性,能在不同尺度、旋转角度下稳定检测到相同特征点。
阿宙ppppp1 个月前
后端·图像识别
yoloV5的环境安装我这边使用的是python3.8和Anaconda管理的环境2. 登录pytorch官网可以看看自己电脑支持什么样版本的
DogDaoDao1 个月前
人工智能·深度学习·开源·github·ocr·图像识别·zerox
GitHub开源项目Zerox:AI驱动的OCR革命零样本学习的实现原理复杂布局解析核心技术分布式处理框架数据来源:CSDN开发者实测报告及AI工具导航站测评
jason_yang2 个月前
python·ai编程·图像识别
yolov8 视频识别动物实战本人使用mac m1电脑安装设置虚拟环境安装依赖库安装 YOLOv8这里会自动拉取官方的模型yolov8s.pt,同时识别图片里面的人物和汽车是否识别
MarkGosling3 个月前
深度学习·计算机视觉·图像识别
【三维重建】VGGT:告别漫长等待,几秒解锁3D世界的CVPR黑马计算机视觉领域常常被复杂的 3 D 重建任务困扰,传统方法需要漫长优化与昂贵计算。但现在,Facebook Research 团队开源的 VGGT(CVPR’25 论文工作)改变了游戏规则。这款前馈 Transformer 模型只需单张到数百张图像输入,几秒钟内直接输出相机位姿、深度图、点云及运动轨迹四大核心结果,无需任何迭代优化。技术发烧友们,是时候体验“一键生成 3 D 世界”的未来了。
MarkGosling3 个月前
人工智能·开源·图像识别
【图片转 3D 模型】北大·字节跳动·CMU携手——单图15 秒生成结构化3D模型!PartCrafter 由北京大学、字节跳动与卡耐基梅隆大学联合研发,是全球首个端到端生成结构化 3 D 网格的模型。它仅需单张 RGB 图像,即可在 34 秒内生成带语义分解的 3 D 部件(如机械关节、家具组件),跳过传统“分割-重建”流程,直接输出可编辑的零件级模型。其核心突破在于将物理世界的组合逻辑融入 AI 生成过程,甚至能推断图像中被遮挡的隐藏结构。
用户098880217933 个月前
macos·mac·图像识别
Topaz Photo AI人工智能图像降噪 安装教程(Mac)安装包有两个版本: - 直接安装版: 版本稍旧,但直接将安装包拖入应用程序中即可完成安装 - 补丁版: 先运行安装包→→安装AI Models需要🛝🧱 科学上网(必须完成的一步,做不到请换版本安装,安装预计需要半小时)→→安装补丁
三花AI3 个月前
图像识别
Chain-of-Zoom :64 倍超分辨率在线体验谷歌最新发布 SignGemma 手语翻译模型,基于 Gemma,专用于美国手语(ASL)与英语的实时双向互译。目前只开放了申请测试[1],预计今年晚些时候才会正式发布。
一个人的博客@你4 个月前
图像处理·c#·ocr·图像识别·文字提取
C# 通用OCR识别通过查看网络资料以及书籍资料,发现大多数OCR识别功能都是基于Python语言开发的,对于习惯使用C# 开发语言的程序猿们,岂不是一件很苦恼的事!当然想学习Python,掌握多一项技能也并不是坏事!为了方便使用,想使用C# 的往下看(或需要使用当作工作辅助也行,资源下载在最后有链接)。
闲人编程5 个月前
python·opencv·图像识别
OpenCV图像矩与形状匹配完全指南总结:本文系统讲解了图像矩与形状匹配的核心技术:下期预告:《模板匹配算法》将深入讲解基于相关性和机器学习的模板匹配技术。