图像识别

MarkGosling5 天前
深度学习·计算机视觉·图像识别
【三维重建】VGGT:告别漫长等待,几秒解锁3D世界的CVPR黑马计算机视觉领域常常被复杂的 3 D 重建任务困扰,传统方法需要漫长优化与昂贵计算。但现在,Facebook Research 团队开源的 VGGT(CVPR’25 论文工作)改变了游戏规则。这款前馈 Transformer 模型只需单张到数百张图像输入,几秒钟内直接输出相机位姿、深度图、点云及运动轨迹四大核心结果,无需任何迭代优化。技术发烧友们,是时候体验“一键生成 3 D 世界”的未来了。
MarkGosling9 天前
人工智能·开源·图像识别
【图片转 3D 模型】北大·字节跳动·CMU携手——单图15 秒生成结构化3D模型!PartCrafter 由北京大学、字节跳动与卡耐基梅隆大学联合研发,是全球首个端到端生成结构化 3 D 网格的模型。它仅需单张 RGB 图像,即可在 34 秒内生成带语义分解的 3 D 部件(如机械关节、家具组件),跳过传统“分割-重建”流程,直接输出可编辑的零件级模型。其核心突破在于将物理世界的组合逻辑融入 AI 生成过程,甚至能推断图像中被遮挡的隐藏结构。
用户0988802179318 天前
macos·mac·图像识别
Topaz Photo AI人工智能图像降噪 安装教程(Mac)安装包有两个版本: - 直接安装版: 版本稍旧,但直接将安装包拖入应用程序中即可完成安装 - 补丁版: 先运行安装包→→安装AI Models需要🛝🧱 科学上网(必须完成的一步,做不到请换版本安装,安装预计需要半小时)→→安装补丁
三花AI20 天前
图像识别
Chain-of-Zoom :64 倍超分辨率在线体验谷歌最新发布 SignGemma 手语翻译模型,基于 Gemma,专用于美国手语(ASL)与英语的实时双向互译。目前只开放了申请测试[1],预计今年晚些时候才会正式发布。
一个人的博客@你1 个月前
图像处理·c#·ocr·图像识别·文字提取
C# 通用OCR识别通过查看网络资料以及书籍资料,发现大多数OCR识别功能都是基于Python语言开发的,对于习惯使用C# 开发语言的程序猿们,岂不是一件很苦恼的事!当然想学习Python,掌握多一项技能也并不是坏事!为了方便使用,想使用C# 的往下看(或需要使用当作工作辅助也行,资源下载在最后有链接)。
闲人编程2 个月前
python·opencv·图像识别
OpenCV图像矩与形状匹配完全指南总结:本文系统讲解了图像矩与形状匹配的核心技术:下期预告:《模板匹配算法》将深入讲解基于相关性和机器学习的模板匹配技术。
闲人编程2 个月前
python·opencv·图像识别
OpenCV图像轮廓分析完全指南总结:本文系统讲解了轮廓分析的核心技术:下期预告:《图像矩与形状匹配》将深入讲解Hu矩、Zernike矩等高级形状特征。
AI技术学长2 个月前
人工智能·深度学习·计算机视觉·图像识别·计算机技术·tensorflow2·猫狗识别
深度学习-python猫狗识别tensorflow2.0猫狗识别的数据集依旧可以从Kaggle上下载,数据集下载链接: https://www.kaggle.com/c/dogs-vs-cats
刘大猫262 个月前
人工智能·数据分析·图像识别
Arthas watch (方法执行数据观测)@[toc]提示函数执行数据观测让你能方便的观察到指定函数的调用情况。能观察到的范围为:返回值、抛出异常、入参,通过编写 OGNL 表达式进行对应变量的查看。
闲人编程2 个月前
python·opencv·图像识别
Canny边缘检测优化实战总结:本文深入讲解了Canny边缘检测的优化策略:下期预告:《霍夫变换》将深入讲解直线/圆环检测原理与优化方法。
闲人编程2 个月前
python·opencv·图像识别
边缘检测基础(Sobel/Laplacian)总结:本文系统讲解了边缘检测的基础技术:下期预告:《Canny边缘检测》将深入讲解最优边缘检测算法的原理与实现。
青云交3 个月前
大数据·迁移学习·图像识别·模型优化·deeplearning4j·机器学习模型·java 大数据
Java 大视界 -- 基于 Java 的大数据机器学习模型在图像识别中的迁移学习与模型优化(173)💖亲爱的朋友们,热烈欢迎来到 青云交的博客!能与诸位在此相逢,我倍感荣幸。在这飞速更迭的时代,我们都渴望一方心灵净土,而 我的博客 正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识,也期待你毫无保留地分享独特见解,愿我们于此携手成长,共赴新程!💖
闲人编程3 个月前
python·opencv·图像识别
形态学操作(腐蚀/膨胀/开闭运算)总结:本文系统讲解了形态学操作的核心技术:下期预告:《边缘检测基础》将深入讲解Sobel、Prewitt等经典边缘检测算子。
合合技术团队3 个月前
大数据·人工智能·图像识别
实测对比|法国 AI 独角兽公司发布的“最强 OCR”,实测效果如何?3月上旬,法国一家AI独角兽公司进军OCR(光学字符识别)领域,发布了一个号称“全世界最好的OCR”产品,根据其技术团队的说明,这款OCR产品具备优秀的准确度和认知能力,能够理解文档的每个元素(包括文本、表格、公式等),从图像和PDF中提取内容信息。与当前市场或学术界其他文档解析工具一样,这款产品(下文中简称为“A产品”)旨在对AI难以直接识别的复杂文档进行解析处理,提升类似RAG等文档场景下的AI应用性能。
小白狮ww3 个月前
开发语言·人工智能·算法·matlab·自然语言处理·图像识别·去雾处理
Retinex 算法 + MATLAB 软件,高效率完成图像去雾处理在计算机视觉领域,图像去雾是一项重要的预处理任务,尤其是在自动驾驶、遥感图像分析以及监控系统中,去雾能够有效提升图像质量,使目标更加清晰可见。本项目采用 Retinex 算法进行图像去雾,并结合 GPU 加速以提高计算效率。 Retinex 算法原理: Retinex (Retina + Cortex) 是 Land 和 McCann 提出的图像增强算法,主要基于人眼视觉系统对亮度变化的适应性。Retinex 算法的核心思想是:
闲人编程3 个月前
python·opencv·图像识别
图像插值算法(最近邻/双线性/立方卷积)总结:本文系统讲解了图像插值核心算法:下期预告:《图像滤波基础》将深入讲解均值滤波、高斯滤波等线性滤波技术。
闲人编程3 个月前
python·opencv·图像识别
OpenCV图像算术运算完全指南总结:本文系统讲解了OpenCV算术运算的核心技术,关键要点:下期预告:《图像阈值化》将深入讲解全局/自适应阈值、Otsu算法等二值化技术。
闲人编程3 个月前
python·opencv·图像识别
图像几何变换(平移/旋转/缩放/仿射)总结:本文系统讲解了OpenCV几何变换的核心技术,关键要点:下期预告:《图像阈值化》将深入讲解全局/自适应阈值、Otsu算法等二值化技术。
闲人编程3 个月前
python·opencv·图像识别
OpenCV像素级操作核心技术解析总结:本文深入解析了像素级操作的三大核心技术,建议开发时:下期预告:《色彩空间转换原理与实战》,将深入讲解HSV/YUV等色彩空间的转换原理与应用场景。
闲人编程3 个月前
python·opencv·图像识别
OpenCV色彩空间转换深度解析总结:本文系统讲解了OpenCV色彩空间转换的核心技术,关键要点:下期预告:《图像几何变换》将深入讲解仿射变换、透视变换等高级几何变换技术。