技术栈
图像识别
石榴树下的七彩鱼
1 小时前
开发语言
·
人工智能
·
python
·
ocr
·
图像识别
·
文字识别
·
api接口
OCR API价格对比2026:身份证/发票/医疗票据识别哪家性价比最高?含Python对接+成本公式
做企业级OCR项目选型时,最让人头疼的不是技术接入,而是算不清到底要花多少钱。 本文用实测对比表 + 独家成本测算代码,帮你一次性算清身份证/发票/医疗票据识别的真实成本,并给出高性价比的API选型建议。
Ailan_Anjuxi
6 天前
算法
·
图像识别
手写数字识别零基础实战:基于PyTorch的CNN完整拆解
最近在Kaggle上跑了一个经典的MNIST手写数字识别项目,用PyTorch搭了一个朴素的CNN,效果还不错,准确率能到99.3%左右。
weixin_40809967
8 天前
ocr
·
api
·
图像识别
·
api接口
·
跨境电商
·
电商自动化
·
sku识别
【电商实战】如何用OCR批量提取商品SKU与参数?自动识别+批量处理完整方案(附代码)
在电商运营中,很多卖家都会遇到一个高频问题:👉 商品图片里包含 SKU、规格、参数信息 👉 需要手动录入到系统(ERP / 上架系统) 👉 数量一多,人工直接崩溃
OpenBayes贝式计算
10 天前
人工智能
·
机器学习
·
图像识别
一键移除复杂物体!Netflix VOID 让视频消除拥有「物理直觉」;告别乱码与解析难题,MDPBench 数据集为「真实复杂场景」文档解析而生
公共资源速递11 个公共数据集:Stroke Risk 中风风险数据集ToolACE 复杂工具学习对话数据集
心 爱心 爱
1 个月前
计算机视觉
·
transformer
·
图像识别
·
vit
·
特征提取
·
图像特征提取
AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE 论文精读
论文地址:ICLR 2021 2010 代码地址:https://github.com/google-research/vision_transformer AT SCALE 大规模 IMAGE RECOGNITION 图像识别 AN IMAGE IS WORTH 16X16 WORDS 一图抵 16×16 个词
民乐团扒谱机
2 个月前
人工智能
·
深度学习
·
神经网络
·
机器学习
·
cnn
·
卷积神经网络
·
图像识别
【读论文】深度学习中的卷积算术指南 A guide to convolution arithmetic for deep learning
本指南的作者感谢大卫·沃德-法利、纪尧姆·阿兰和贾拉尔·居尔切雷提供的宝贵反馈。同时,也感谢所有通过有益的评论、建设性的批评和代码贡献帮助完善本教程的读者,期待大家继续提出建议!
小小张说故事
3 个月前
后端
·
python
·
图像识别
Python图像处理利器:Pillow (PIL)入门指南
想象一下,你在开发一个电商平台,需要处理成千上万张不同尺寸、格式的商品图片——有的来自用户的随意上传,有的需要批量添加水印,有的还要转换为适合移动端的格式。如果没有一个强大的图像处理工具,这就像试图用剪刀和胶水来完成一个现代印刷厂的工作,既低效又不可靠。
weixin_46846685
3 个月前
人工智能
·
深度学习
·
算法
·
yolo
·
图像识别
·
目标识别
·
调参
目标识别精度指标与IoU及置信度关系辨析
目标识别,也称为目标检测,是计算机视觉领域中的一个分支,通常与图像分类、语义分割和实例分割并列。目标识别需要输出图片中包含的目标类别,以及目标所在的边界框,同时还可以输出目标类别的置信度。
weixin_37763484
4 个月前
图像识别
·
图像分类
【开源-细粒度图像识别】SCAN快慢思考 无需微调标注即可分类
AAAI2026开源细粒度图像识别工具《Endowing Vision-Language Models with System 2 Thinking for Fine-Grained Visual Recognition》,开源地址,论文介绍了一种不需要训练及标注,仅依靠大语言模型实现细粒度图像识别的方法,借鉴了人类的“快慢思考”流程,并实现了一种平衡快慢思考权重的动态方法,非常值得一读。
简简单单OnlineZuozuo
4 个月前
人工智能
·
深度学习
·
安全
·
图像识别
·
banana
对话式AI的安全和治理模式
简简单单 Online zuozuo :本心、输入输出、结果编辑 | 简简单单 Online zuozuo 地址 | https://blog.csdn.net/qq_15071263
简简单单OnlineZuozuo
4 个月前
人工智能
·
深度学习
·
安全
·
图像识别
·
banana
视觉模型的偏见和捷径测试:来自真实世界实验的实用测试套件
简简单单 Online zuozuo :本心、输入输出、结果编辑 | 简简单单 Online zuozuo 地址 | https://blog.csdn.net/qq_15071263
Dxy1239310216
4 个月前
python
·
深度学习
·
机器学习
·
图像识别
·
验证码识别
·
中文识别
国家税务总局中文点选验证码识别
2026年元旦节,国家税务总局中文点选验证码居然又更新了。这次更新对识别还是有很大的影响。1、文字的位置变得随机
简简单单OnlineZuozuo
4 个月前
人工智能
·
深度学习
·
学习
·
语言模型
·
prometheus
·
图像识别
构建能够从失败中学习的自进化AI代理
简简单单 Online zuozuo :本心、输入输出、结果编辑 | 简简单单 Online zuozuo 地址 | https://blog.csdn.net/qq_15071263
简简单单OnlineZuozuo
4 个月前
人工智能
·
microsoft
·
架构
·
图像识别
·
banana
·
the stanford ai
设计共情:面向真实系统的人本AI模式
简简单单 Online zuozuo :本心、输入输出、结果编辑 | 简简单单 Online zuozuo 地址 | https://blog.csdn.net/qq_15071263
weixin_46846685
4 个月前
人工智能
·
深度学习
·
yolo
·
计算机视觉
·
图像识别
·
目标识别
·
yolov13
YOLOv13结合代码原理详细解析及模型安装与使用
在2015年,YOLO模型问世,YOLO全称为You Only Look Once。顾名思义,YOLO将目标检测任务只分为一个阶段的工作,与2014年提出的两阶段检测的R-CNN模型形成鲜明的区别。
刘磊585
4 个月前
图像识别
PyTorch与PaddlePaddle CUDA冲突的进程级隔离方案
标签:#PyInstaller #进程隔离 #CUDA冲突 #PaddleOCR #工程实践2024年8月,我在开发一个界面识别系统时,遇到了职业生涯中最棘手的框架冲突问题。当尝试在同一个Python进程中同时使用PyTorch(YOLO模型推理)和PaddlePaddle(OCR文字识别)时,系统抛出致命错误:
懷淰メ
4 个月前
深度学习
·
opencv
·
yolo
·
pyqt
·
图像识别
·
车牌识别
·
pyqt5
python3GUI--基于YOLOv8深度学习的车牌识别系统(详细图文介绍)
本系统支持黄牌、蓝牌、绿牌、黑牌、白牌,支持双层车牌识别,且识别准确度95%+,支持多种操作类型以及个性化自定义回显样式,项目上手简单,欢迎了解!
OpenBayes
5 个月前
人工智能
·
深度学习
·
数据集
·
图像识别
·
语音合成
·
图像生成
·
视频生成
VibeVoice-Realtime TTS重构实时语音体验;覆盖9大真实场景,WenetSpeech-Chuan让模型听懂川话
公共资源速递5 个公共数据集:* VOccl3D 三维人体遮挡视频数据集* Spatial-SSRL-81k 空间感知自监督数据集
xixixi77777
5 个月前
人工智能
·
rnn
·
学习
·
架构
·
cnn
·
ocr
·
图像识别
CRNN(CNN + RNN + CTC):OCR识别的经典之作
想象一个自动识别车牌的工厂流水线:过程分解:CNN(视觉质检员):先看整体车牌,找出“哪里是字、哪里是背景”
zxy2847225301
5 个月前
c#
·
图像识别
·
halcon
·
机器视觉
C#的视觉库Halcon入门示例
以前写过emgu.cv的视觉库,但翻了一下招聘软件发现,用得比较多的是halcon,以前也有留意过这玩意,一直没动手,今天有空就来试一波,由于是使用公司的电脑,不能安装收费软件halcon,而halcon我看了一下,网上有好多文章介绍的都是安装了halcon包后再使用的,本文介绍的是使用带有halcon运行时的程序,不需要再单独安装halcon