技术栈
图像识别
人月神话Lee
3 小时前
ios
·
ai编程
·
图像识别
【图像处理】卷积原理与卷积核——图像处理的核心引擎
模糊、锐化、边缘检测、浮雕…… 这些看起来完全不同的效果,底层都是同一个操作:卷积。 理解了卷积,你就掌握了图像处理最核心的工具。
小郭的笔记
2 天前
图像识别
通过vue+js实现在网页端将像素画进行像素块级解析
本文档面向有图像技术背景的读者,包含算法名称和详细技术细节。图片通过 FileReader.readAsDataURL() 读取为 Data URL,加载到 Image 对象后绘制到离屏 Canvas。通过 CanvasRenderingContext2D.getImageData() 获取 RGBA 像素数组。
人月神话Lee
2 天前
ios
·
ai编程
·
图像识别
【图像处理】饱和度——颜色的浓淡与灰度化
饱和度为 0,图像变成灰色。 饱和度为 1,颜色恢复原样。 看似简单的一个滑块,背后是颜色空间的混合运算—— 而"直接灰度化"并不总是最好的选择。
人月神话Lee
4 天前
ios
·
ai编程
·
图像识别
【图像处理】二值化与阈值——从灰度到黑白的决策
二值化是图像处理中最"武断"的操作: 每个像素只有两种命运——要么全黑,要么全白。 但正是这种武断,让机器能够"读懂"文字、识别形状。
人月神话Lee
6 天前
ios
·
ai编程
·
图像识别
【图像处理】亮度与对比度——图像的线性变换
亮度和对比度是最基础的图像调整。 看似简单,背后涉及线性变换、锚点、数值溢出…… 把这两个搞透彻,整个图像变换的思维框架就建立起来了。
人月神话Lee
7 天前
ios
·
ai编程
·
图像识别
【图像处理】颜色科学与灰度化——人眼看到的和数字记录的不一样
你有没有想过:为什么把彩色照片转成黑白, 不能直接用 (R + G + B) / 3? 答案藏在人眼的生理构造里。
weixin_40809967
8 天前
ocr
·
图像识别
·
api集成
·
医疗票据识别
·
石榴智能
·
ocr选型
·
诊断报告
医疗 OCR 识别 API 怎么选?(报告单 / 发票 / 检测单)
导语:2026年,医疗机构每天处理上千张检验报告、收费发票和检查结果——全部依赖人工录入,一张住院发票5分钟,错漏率超过2%。OCR来了,但市面上通用识别挑花眼,只有真正理解医疗场景结构化的API,才能把检查结论、费用明细如实变成可入库的JSON。本文不讲广告,给你一套从“单据类型”出发的选型实战框架 + 多语言代码示例。
weixin_40809967
9 天前
ocr
·
图像识别
·
api对接
·
易语言
·
自动化脚本
·
身份证ocr
·
石榴智能
身份证OCR识别API接入实战:6种自动化脚本3分钟搞定(含天诺/按键精灵/易语言/C#示例)
正反面全字段结构化识别 + 智能矫正 + 翻拍检测 + 头像返回,识别准率99.9%+在电商系统、RPA机器人、实名认证小程序等项目中,开发者用身份证OCR来加速信息录入的频率越来越高。当你给自动化脚本(比如天诺、懒人精灵、按键精灵、易语言、EasyClick、触动精灵等)赋予“看懂身份证”的能力后,一个原本需要几秒人工输入的流程,可以直接压缩到两三秒内完成——体验和效率的提升相当明显。
weixin_40809967
16 天前
人工智能
·
ocr
·
图像识别
·
api接口
·
实名认证
·
身份证ocr
·
石榴智能
身份证OCR识别中的“隐形防线”:复印件/翻拍检测如何拦截99%的虚假注册?(附多语言代码)
导语:在金融开户、网约车司机认证、电商平台商家入驻、政务服务等场景中,身份证的真实性核验是风控的第一道关卡。然而,传统的OCR识别更多关注“文字对不对”,却忽略了“这张身份证是不是真的实体证件”。石榴智能身份证OCR系统在业界领先的识别能力之上,自研了复印件检测、翻拍检测、图片完整度判断三大引擎,将虚假注册拦截率提升至99%以上。本文从安全风控视角深度拆解身份证OCR的“隐形防线”,并提供Python/Java/PHP多语言接入示例。
星瞳科技OpenMV
20 天前
人工智能
·
嵌入式
·
图像识别
·
机器视觉
·
openmv
·
星瞳科技
·
星瞳科技openmv
国家级高新技术企业星瞳科技,定义嵌入式机器视觉行业新标杆
星瞳科技获得国家级高新技术企业认定。该认定是对企事业单位在核心技术、研发投入、创新成果转化等多方面的全面审查和高度肯定。凭借在端侧 AI 与嵌入式视觉技术研发及产品化落地上的持续积累,星瞳科技顺利通过严格评审,获得了这一含金量极高的认可。
石榴树下的七彩鱼
21 天前
开发语言
·
人工智能
·
python
·
ocr
·
图像识别
·
文字识别
·
api接口
OCR API价格对比2026:身份证/发票/医疗票据识别哪家性价比最高?含Python对接+成本公式
做企业级OCR项目选型时,最让人头疼的不是技术接入,而是算不清到底要花多少钱。 本文用实测对比表 + 独家成本测算代码,帮你一次性算清身份证/发票/医疗票据识别的真实成本,并给出高性价比的API选型建议。
Ailan_Anjuxi
1 个月前
算法
·
图像识别
手写数字识别零基础实战:基于PyTorch的CNN完整拆解
最近在Kaggle上跑了一个经典的MNIST手写数字识别项目,用PyTorch搭了一个朴素的CNN,效果还不错,准确率能到99.3%左右。
weixin_40809967
1 个月前
ocr
·
api
·
图像识别
·
api接口
·
跨境电商
·
电商自动化
·
sku识别
【电商实战】如何用OCR批量提取商品SKU与参数?自动识别+批量处理完整方案(附代码)
在电商运营中,很多卖家都会遇到一个高频问题:👉 商品图片里包含 SKU、规格、参数信息 👉 需要手动录入到系统(ERP / 上架系统) 👉 数量一多,人工直接崩溃
OpenBayes贝式计算
1 个月前
人工智能
·
机器学习
·
图像识别
一键移除复杂物体!Netflix VOID 让视频消除拥有「物理直觉」;告别乱码与解析难题,MDPBench 数据集为「真实复杂场景」文档解析而生
公共资源速递11 个公共数据集:Stroke Risk 中风风险数据集ToolACE 复杂工具学习对话数据集
心 爱心 爱
2 个月前
计算机视觉
·
transformer
·
图像识别
·
vit
·
特征提取
·
图像特征提取
AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE 论文精读
论文地址:ICLR 2021 2010 代码地址:https://github.com/google-research/vision_transformer AT SCALE 大规模 IMAGE RECOGNITION 图像识别 AN IMAGE IS WORTH 16X16 WORDS 一图抵 16×16 个词
民乐团扒谱机
3 个月前
人工智能
·
深度学习
·
神经网络
·
机器学习
·
cnn
·
卷积神经网络
·
图像识别
【读论文】深度学习中的卷积算术指南 A guide to convolution arithmetic for deep learning
本指南的作者感谢大卫·沃德-法利、纪尧姆·阿兰和贾拉尔·居尔切雷提供的宝贵反馈。同时,也感谢所有通过有益的评论、建设性的批评和代码贡献帮助完善本教程的读者,期待大家继续提出建议!
小小张说故事
3 个月前
后端
·
python
·
图像识别
Python图像处理利器:Pillow (PIL)入门指南
想象一下,你在开发一个电商平台,需要处理成千上万张不同尺寸、格式的商品图片——有的来自用户的随意上传,有的需要批量添加水印,有的还要转换为适合移动端的格式。如果没有一个强大的图像处理工具,这就像试图用剪刀和胶水来完成一个现代印刷厂的工作,既低效又不可靠。
weixin_46846685
3 个月前
人工智能
·
深度学习
·
算法
·
yolo
·
图像识别
·
目标识别
·
调参
目标识别精度指标与IoU及置信度关系辨析
目标识别,也称为目标检测,是计算机视觉领域中的一个分支,通常与图像分类、语义分割和实例分割并列。目标识别需要输出图片中包含的目标类别,以及目标所在的边界框,同时还可以输出目标类别的置信度。
weixin_37763484
4 个月前
图像识别
·
图像分类
【开源-细粒度图像识别】SCAN快慢思考 无需微调标注即可分类
AAAI2026开源细粒度图像识别工具《Endowing Vision-Language Models with System 2 Thinking for Fine-Grained Visual Recognition》,开源地址,论文介绍了一种不需要训练及标注,仅依靠大语言模型实现细粒度图像识别的方法,借鉴了人类的“快慢思考”流程,并实现了一种平衡快慢思考权重的动态方法,非常值得一读。
简简单单OnlineZuozuo
5 个月前
人工智能
·
深度学习
·
安全
·
图像识别
·
banana
对话式AI的安全和治理模式
简简单单 Online zuozuo :本心、输入输出、结果编辑 | 简简单单 Online zuozuo 地址 | https://blog.csdn.net/qq_15071263