图像识别

人月神话Lee1 天前
ios·ai编程·图像识别
【图像处理】颜色空间——RGB之外的世界RGB 是相机记录颜色的方式,不是人类感知颜色的方式。 当你说"把这张图调得更鲜艳一点",你的意思是什么? RGB 不知道;HSV 知道;Lab 更知道。
人月神话Lee3 天前
ios·ai编程·图像识别
【图像处理】一文带你窥探近期火热图像App的主要实现原理:主色提取——从图像到调色板给一张图,告诉我它的"灵魂颜色"是什么。 音乐 App 动态配色、电商颜色标注、UI 自动主题——背后都是同一个问题: 从百万个像素中,找出最能代表这张图的 6 种颜色。
人月神话Lee6 天前
ios·ai编程·图像识别
【图像处理】图像直方图——从"频率分布"到"智能决策"直方图是图像的"体检报告"。 一眼看出:这张图曝光不足、对比度太低、色调偏暖——不用打开图像本身。 掌握直方图,就掌握了对图像质量"量化评估"的能力。
人月神话Lee8 天前
ios·swift·图像识别
【图像处理】vImage/Accelerate——SIMD 让 CPU 也能飞GPU 是并行之王,但它不是唯一的选择。 CPU 的 SIMD 单元在正确的场景下,可以让代码快 8–16 倍——而且不需要离开 Swift。
人月神话Lee10 天前
ios·ai编程·图像识别
【图像处理】Core Image 与 GPU 渲染管线——让滤镜飞起来CPU 是一位精英工程师,一次专心做一件事; GPU 是一支万人工厂,每条流水线同时处理一块像素。 选对工具,差距可以是 10 倍。
人月神话Lee12 天前
ios·架构·图像识别
【图像处理】框架设计——协议、值类型与工程化思维同样是实现"灰度化"功能, 一个函数、一个类的方法、一个协议的实现,结果一样,设计完全不同。 这一天我们来聊聊这个框架的设计决策背后的思考, 以及什么样的代码算是"工业级"的。
xufengzhu14 天前
bug·图像识别·摄像头
臻识摄像头黑屏Bug 处理我在测试摄像头测试按钮这个功能时,发现它已经弹出了对话框,但是在对话框中没有任何实时的视频图像显示,是一个黑屏,显示的摄像头的状态一直是连接中,在点击"开始播放"按钮后,整个 Python 进程直接崩溃退出,无任何错误弹窗或异常信息。多个同事的电脑上同一套代码可以正常运行,但该电脑每次都必现。
基鑫阁18 天前
tensorflow·企业微信·图像识别·clawdbot
Clawdbot机器学习部署:TensorFlow模型服务化你可能已经注意到,Clawdbot(现名Moltbot)最近在开发者圈子里火得一塌糊涂。它被很多人称为"住在电脑里的贾维斯",能通过WhatsApp、Telegram、钉钉这些你每天都在用的聊天工具,直接帮你处理文件、运行脚本、甚至操作浏览器。但如果你仔细看它的官方文档和社区讨论,会发现一个有趣的现象:Clawdbot本身并不内置机器学习能力,它更像是一个智能调度中心——把你的指令翻译成具体操作,然后调用各种工具来执行。
人月神话Lee20 天前
ios·ai编程·图像识别
【图像处理】卷积原理与卷积核——图像处理的核心引擎模糊、锐化、边缘检测、浮雕…… 这些看起来完全不同的效果,底层都是同一个操作:卷积。 理解了卷积,你就掌握了图像处理最核心的工具。
小郭的笔记22 天前
图像识别
通过vue+js实现在网页端将像素画进行像素块级解析本文档面向有图像技术背景的读者,包含算法名称和详细技术细节。图片通过 FileReader.readAsDataURL() 读取为 Data URL,加载到 Image 对象后绘制到离屏 Canvas。通过 CanvasRenderingContext2D.getImageData() 获取 RGBA 像素数组。
人月神话Lee22 天前
ios·ai编程·图像识别
【图像处理】饱和度——颜色的浓淡与灰度化饱和度为 0,图像变成灰色。 饱和度为 1,颜色恢复原样。 看似简单的一个滑块,背后是颜色空间的混合运算—— 而"直接灰度化"并不总是最好的选择。
人月神话Lee24 天前
ios·ai编程·图像识别
【图像处理】二值化与阈值——从灰度到黑白的决策二值化是图像处理中最"武断"的操作: 每个像素只有两种命运——要么全黑,要么全白。 但正是这种武断,让机器能够"读懂"文字、识别形状。
人月神话Lee1 个月前
ios·ai编程·图像识别
【图像处理】亮度与对比度——图像的线性变换亮度和对比度是最基础的图像调整。 看似简单,背后涉及线性变换、锚点、数值溢出…… 把这两个搞透彻,整个图像变换的思维框架就建立起来了。
人月神话Lee1 个月前
ios·ai编程·图像识别
【图像处理】颜色科学与灰度化——人眼看到的和数字记录的不一样你有没有想过:为什么把彩色照片转成黑白, 不能直接用 (R + G + B) / 3? 答案藏在人眼的生理构造里。
weixin_408099671 个月前
ocr·图像识别·api集成·医疗票据识别·石榴智能·ocr选型·诊断报告
医疗 OCR 识别 API 怎么选?(报告单 / 发票 / 检测单)导语:2026年,医疗机构每天处理上千张检验报告、收费发票和检查结果——全部依赖人工录入,一张住院发票5分钟,错漏率超过2%。OCR来了,但市面上通用识别挑花眼,只有真正理解医疗场景结构化的API,才能把检查结论、费用明细如实变成可入库的JSON。本文不讲广告,给你一套从“单据类型”出发的选型实战框架 + 多语言代码示例。
weixin_408099671 个月前
ocr·图像识别·api对接·易语言·自动化脚本·身份证ocr·石榴智能
身份证OCR识别API接入实战:6种自动化脚本3分钟搞定(含天诺/按键精灵/易语言/C#示例)正反面全字段结构化识别 + 智能矫正 + 翻拍检测 + 头像返回,识别准率99.9%+在电商系统、RPA机器人、实名认证小程序等项目中,开发者用身份证OCR来加速信息录入的频率越来越高。当你给自动化脚本(比如天诺、懒人精灵、按键精灵、易语言、EasyClick、触动精灵等)赋予“看懂身份证”的能力后,一个原本需要几秒人工输入的流程,可以直接压缩到两三秒内完成——体验和效率的提升相当明显。
weixin_408099671 个月前
人工智能·ocr·图像识别·api接口·实名认证·身份证ocr·石榴智能
身份证OCR识别中的“隐形防线”:复印件/翻拍检测如何拦截99%的虚假注册?(附多语言代码)导语:在金融开户、网约车司机认证、电商平台商家入驻、政务服务等场景中,身份证的真实性核验是风控的第一道关卡。然而,传统的OCR识别更多关注“文字对不对”,却忽略了“这张身份证是不是真的实体证件”。石榴智能身份证OCR系统在业界领先的识别能力之上,自研了复印件检测、翻拍检测、图片完整度判断三大引擎,将虚假注册拦截率提升至99%以上。本文从安全风控视角深度拆解身份证OCR的“隐形防线”,并提供Python/Java/PHP多语言接入示例。
星瞳科技OpenMV1 个月前
人工智能·嵌入式·图像识别·机器视觉·openmv·星瞳科技·星瞳科技openmv
国家级高新技术企业星瞳科技,定义嵌入式机器视觉行业新标杆星瞳科技获得国家级高新技术企业认定。该认定是对企事业单位在核心技术、研发投入、创新成果转化等多方面的全面审查和高度肯定。凭借在端侧 AI 与嵌入式视觉技术研发及产品化落地上的持续积累,星瞳科技顺利通过严格评审,获得了这一含金量极高的认可。
石榴树下的七彩鱼1 个月前
开发语言·人工智能·python·ocr·图像识别·文字识别·api接口
OCR API价格对比2026:身份证/发票/医疗票据识别哪家性价比最高?含Python对接+成本公式做企业级OCR项目选型时,最让人头疼的不是技术接入,而是算不清到底要花多少钱。 本文用实测对比表 + 独家成本测算代码,帮你一次性算清身份证/发票/医疗票据识别的真实成本,并给出高性价比的API选型建议。
Ailan_Anjuxi2 个月前
算法·图像识别
手写数字识别零基础实战:基于PyTorch的CNN完整拆解最近在Kaggle上跑了一个经典的MNIST手写数字识别项目,用PyTorch搭了一个朴素的CNN,效果还不错,准确率能到99.3%左右。