技术栈
图像识别
德育处主任
5 天前
人工智能
·
机器学习
·
图像识别
地表最强“慧眼”,给大模型戴上智能眼镜 PaddleOCR-VL
当我们谈论大模型时,总在惊叹其 “读懂” 文本、“生成” 内容的能力,GPT-4o 能写代码、Gemini-2.5 Pro 能做逻辑推理。大语言模型(LLM)的能力边界不断拓宽。其中,检索增强生成(RAG)技术更是遍地开花,它让LLM能够连接外部知识库,回答训练数据之外的问题,使其从一个“博学的书呆子”变成了一个能够实时获取信息的“全科专家”。
OpenBayes
6 天前
人工智能
·
深度学习
·
机器学习
·
自然语言处理
·
ocr
·
图像识别
·
文档处理
教程上新|重新定义下一代 OCR:IBM 最新开源 Granite-docling-258M,实现端到端的「结构+内容」统一理解
一直以来,将格式各异的数字文档准确转换为机器可读的结构化数据是一个技术核心挑战。文档布局的复杂多样性、以及其中包含的表格、图片等视觉元素,往往导致传统 OCR 系统的识别准确性难以满足实际需求。现有技术通常依赖于复杂的集成系统,将任务拆解为多个独立子模块,虽在一定程度上有效,但存在优化困难、难以泛化处理各类文档的局限性。
阿杆
6 天前
后端
·
github
·
图像识别
国产神级开源 OCR 模型,登顶全球第一!再次起飞!
就在昨晚,百度正式发布并开源了自研多模态文档解析模型 PaddleOCR-VL。 在最新的 OmniDocBench V1.5 榜单中,它以 92.6 分的综合成绩位列全球第一,是目前唯二突破 90 分的模型。
胡耀超
1 个月前
人工智能
·
百度
·
开源
·
paddlepaddle
·
图像识别
·
图像标注
·
paddlelabel
PaddleLabel百度飞桨Al Studio图像标注平台安装和使用指南(包冲突 using the ‘flask‘ extra、眼底医疗分割数据集演示)
机器学习的核心在于让计算机从数据中学习模式,而监督学习需要大量已标注的训练数据。图像标注工具就是将原始图像转换为机器可理解的训练数据的桥梁。
databook
1 个月前
人工智能
·
python
·
图像识别
让YOLO飞起来:从CPU到GPU的配置指南
最近在配置YOLO(You Only Look Once)进行物体检测和图像分割任务时,发现默认安装的情况下,YOLO使用的是CPU进行计算。
山烛
1 个月前
人工智能
·
opencv
·
计算机视觉
·
音视频
·
图像识别
·
特征提取
·
光流估计
OpenCV :基于 Lucas-Kanade 算法的视频光流估计实现
目录一、光流估计基础认知1.1 什么是光流估计?1.2 光流估计的 3 个核心前提二、核心算法:Lucas-Kanade 稀疏光流
南方者
1 个月前
后端
·
图像识别
当小学生的手写体也能识别出来,PP-OCRv5 稳了!
PaddleOCR 是一个基于 Apache 许可证开源的 OCR 与文档解析工具包,它累计下载量突破 900 万,GitHub Star 数突破 55.1 k,被超 5.9k 开源项目直接或间接使用,PaddleOCR 已成为全球开发者首选的 OCR 工具!也是GitHub 社区中唯一一个 Star数超过 55k 的中国 OCR 项目!
德育处主任
1 个月前
后端
·
图像识别
文字识别:辛辛苦苦练模型,不如调用PP-OCRv5
前两天百度在海外账号介绍了轻量级文字识别模型 PP-OCRv5。看到“OCR”让我想起打工时的经历。公司的主产品需要车牌识别,本该有技术储备,但早期为了快,功能是外购的,后来才有人手研发。
阿杆
1 个月前
后端
·
github
·
图像识别
国产神级开源 OCR 模型,GitHub 55k Star!再次起飞!
前几天,百度在 Hugging Face 上发表了一篇博客,介绍了一款最新的轻量级文字识别模型 PP-OCRv5。这篇博客已连续一周登顶 Hugging Face 博客热度榜首(写稿时在榜单第二)。
山烛
1 个月前
人工智能
·
opencv
·
计算机视觉
·
图像识别
·
数字识别
OpenCV 银行卡号识别
目录一、项目原理与核心技术二、环境准备与工具包导入1. 环境依赖2. 工具包导入三、自定义工具类 myutils.py 实现
中科逸识
2 个月前
图像识别
·
图片文字识别
·
文字识别
·
媒资管理
·
ocr识别
OCR识别在媒资管理系统的应用场景剖析与选择
一、核心使用场景文字识别在媒资系统中的应用贯穿于内容注入、管理、生产和分发的全生命周期。1. 自动化元数据提取与标签生成(核心价值)
小Lu的开源日常
2 个月前
前端
·
图像识别
·
next.js
Mathcheap v0.9.x 发布的第一个月,从想法到 MVP(最小可行性产品)
一个月前,我上线了 Mathcheap v0.9.0,这是一个 AI 驱动的数学公式识别和 LaTeX 数学公式编辑器。写这篇文章,是想记录一下从 0 到 1 的过程。
用户56129991019
2 个月前
图像识别
逆天!AiPy 打进专业图像生成阵营,实力够格和主流平台抗衡
什么,AiPy打进专业图像生成赛道了?AiPy带着图片、视频生成来啦!本期给大家测评4个国产好用的AI生图工具,不同的生图平台,算法和模型都不一样,快来Pik你的心仪工具吧~
用户612041492213
2 个月前
c语言
·
后端
·
图像识别
C语言做的停车场车牌识别系统
这是一个使用C语言实现的智能停车场管理系统,具备车牌识别、计费系统和车位引导功能。使用简单的gcc指令编译,无需Makefile:
汤姆yu
3 个月前
人工智能
·
分类
·
数据挖掘
·
图像识别
基于图像识别与分类的中国蛇类识别系统
博主介绍:java高级开发,从事互联网行业六年,熟悉各种主流语言,精通java、python、php、爬虫、web开发,已经做了六年的毕业设计程序开发,开发过上千套毕业设计程序,没有什么华丽的语言,只有实实在在的写点程序。
万俟淋曦
3 个月前
人工智能
·
aigc
·
图像识别
人工智能图像生成的道德利弊
人工智能(AI)发展迅速,尤其是近年来。据估计,超过 2.5 亿家公司(77%) 正在其运营中以某种方式使用或探索人工智能,而且这种趋势短期内不会出现任何放缓的迹象。如果说有什么不同的话,那就是人工智能的使用和可用性将在未来的几个月和几年里继续渗透。
泰Tai
3 个月前
python
·
图像识别
【YOLOv8学习】WSL2中安装标注软件X-AnyLabeling
前段时间,在wsl中安装配置了yolov8的环境,在训练模型时,需要用到标注软件,这次参考了官网的快速入门指南和GhatGPT,安装X-AnyLabeling软件,记录下安装过程与错误处理。
阿宙ppppp
3 个月前
后端
·
图像识别
基于yolov5+LPRNet+flask+vue的车牌识别(2)
总结:
阿宙ppppp
3 个月前
后端
·
图像识别
基于yolov5+LPRNet+flask+vue的车牌识别(1)
其中images中train和val存放的图片,要和label中的train和val标签文件一一对应在images和val的同级目录下的classes.txt文件中放入监测的类型,这边监测的是一种类型,就是车牌(plate)
执器
3 个月前
python
·
图像识别
SIFT实现简单的图像匹配,查找icon在图中的位置
通过SIFT匹配到icon在原图的位置(使用LightGlue库的SIFT特征匹配算法)SIFT(尺度不变特征变换) 是一种检测和描述图像局部特征的经典算法,具有尺度不变性和旋转不变性,能在不同尺度、旋转角度下稳定检测到相同特征点。