技术栈
图像识别
Bigger
4 天前
人工智能
·
图像识别
·
音视频开发
我写了一个AI图像视频生成工具,免费API+本地部署,分享给大家
上个月刷到一条新闻,说有个叫Agnes AI的团队,把旗下文本、图片、视频三个模型的API全部免费开放了,无限期。
ZJPRENO
5 天前
人工智能
·
ai编程
·
图像识别
创作者狂喜!Seedance 2.5 支持 50 份素材同时导入,做短剧广告爽翻
看完火山FORCE大会豆包2.1 Pro,千万别漏掉另一张王牌——Seedance 2.5 AI视频生成模型! 官方已经确认:目前内测收尾,7月初正式全量上线,和豆包2.1 Pro、Seedream图像、Seed-Audio音频组成字节完整全栈多模态AI矩阵,文本、代码、图片、视频、音频一条龙全部打通。
Dxy1239310216
14 天前
网络爬虫
·
图像识别
·
验证码
·
抖音
·
验证码识别
·
豆包
·
九宫格验证码
豆包九宫格验证码识别
上图是抖音九宫格验证码图片的样例图片。这款验证码确实有很大的难度,有一下几个特点:1、首先是图片种类非常多。
叫我:松哥
18 天前
人工智能
·
深度学习
·
神经网络
·
算法
·
cnn
·
迁移学习
·
图像识别
基于卷积神经网络的人脸情绪识别算法,引入残差连接与SE注意力模块
1前言1.1.1 研究背景随着人工智能技术的飞速发展,人机交互日益成为日常生活的重要组成部分。人类情感的表达主要通过面部表情、语音语调、肢体动作等方式传递,其中面部表情是最直观、最丰富的载体。人脸情绪识别旨在使计算机能够自动识别人类的情绪状态,如高兴、悲伤、愤怒、惊讶等,从而实现更自然、更智能的交互。该技术在智能教育、心理健康监测、安全驾驶、娱乐互动等领域具有广阔的应用前景。
哈伦2019
19 天前
人工智能
·
深度学习
·
图像识别
第十二章 深度学习基础 案例:MLP实现银行单据手写数字识别
在本案例中,我们将使用PyTorch和Torchvision构建机器学习模型(特别是神经网络)来执行图像分类任务。我们使用MLP模型来构建手写数字识别模型。本案例中使用的数据集是著名的MNIST数据集,这是一个由手写数字0到9组成的28x28黑白图像数据集。
人月神话Lee
21 天前
ios
·
ai编程
·
图像识别
【图像处理】颜色空间——RGB之外的世界
RGB 是相机记录颜色的方式,不是人类感知颜色的方式。 当你说"把这张图调得更鲜艳一点",你的意思是什么? RGB 不知道;HSV 知道;Lab 更知道。
人月神话Lee
23 天前
ios
·
ai编程
·
图像识别
【图像处理】一文带你窥探近期火热图像App的主要实现原理:主色提取——从图像到调色板
给一张图,告诉我它的"灵魂颜色"是什么。 音乐 App 动态配色、电商颜色标注、UI 自动主题——背后都是同一个问题: 从百万个像素中,找出最能代表这张图的 6 种颜色。
人月神话Lee
1 个月前
ios
·
ai编程
·
图像识别
【图像处理】图像直方图——从"频率分布"到"智能决策"
直方图是图像的"体检报告"。 一眼看出:这张图曝光不足、对比度太低、色调偏暖——不用打开图像本身。 掌握直方图,就掌握了对图像质量"量化评估"的能力。
人月神话Lee
1 个月前
ios
·
swift
·
图像识别
【图像处理】vImage/Accelerate——SIMD 让 CPU 也能飞
GPU 是并行之王,但它不是唯一的选择。 CPU 的 SIMD 单元在正确的场景下,可以让代码快 8–16 倍——而且不需要离开 Swift。
人月神话Lee
1 个月前
ios
·
ai编程
·
图像识别
【图像处理】Core Image 与 GPU 渲染管线——让滤镜飞起来
CPU 是一位精英工程师,一次专心做一件事; GPU 是一支万人工厂,每条流水线同时处理一块像素。 选对工具,差距可以是 10 倍。
人月神话Lee
1 个月前
ios
·
架构
·
图像识别
【图像处理】框架设计——协议、值类型与工程化思维
同样是实现"灰度化"功能, 一个函数、一个类的方法、一个协议的实现,结果一样,设计完全不同。 这一天我们来聊聊这个框架的设计决策背后的思考, 以及什么样的代码算是"工业级"的。
xufengzhu
1 个月前
bug
·
图像识别
·
摄像头
臻识摄像头黑屏Bug 处理
我在测试摄像头测试按钮这个功能时,发现它已经弹出了对话框,但是在对话框中没有任何实时的视频图像显示,是一个黑屏,显示的摄像头的状态一直是连接中,在点击"开始播放"按钮后,整个 Python 进程直接崩溃退出,无任何错误弹窗或异常信息。多个同事的电脑上同一套代码可以正常运行,但该电脑每次都必现。
基鑫阁
1 个月前
tensorflow
·
企业微信
·
图像识别
·
clawdbot
Clawdbot机器学习部署:TensorFlow模型服务化
你可能已经注意到,Clawdbot(现名Moltbot)最近在开发者圈子里火得一塌糊涂。它被很多人称为"住在电脑里的贾维斯",能通过WhatsApp、Telegram、钉钉这些你每天都在用的聊天工具,直接帮你处理文件、运行脚本、甚至操作浏览器。但如果你仔细看它的官方文档和社区讨论,会发现一个有趣的现象:Clawdbot本身并不内置机器学习能力,它更像是一个智能调度中心——把你的指令翻译成具体操作,然后调用各种工具来执行。
人月神话Lee
1 个月前
ios
·
ai编程
·
图像识别
【图像处理】卷积原理与卷积核——图像处理的核心引擎
模糊、锐化、边缘检测、浮雕…… 这些看起来完全不同的效果,底层都是同一个操作:卷积。 理解了卷积,你就掌握了图像处理最核心的工具。
小郭的笔记
1 个月前
图像识别
通过vue+js实现在网页端将像素画进行像素块级解析
本文档面向有图像技术背景的读者,包含算法名称和详细技术细节。图片通过 FileReader.readAsDataURL() 读取为 Data URL,加载到 Image 对象后绘制到离屏 Canvas。通过 CanvasRenderingContext2D.getImageData() 获取 RGBA 像素数组。
人月神话Lee
1 个月前
ios
·
ai编程
·
图像识别
【图像处理】饱和度——颜色的浓淡与灰度化
饱和度为 0,图像变成灰色。 饱和度为 1,颜色恢复原样。 看似简单的一个滑块,背后是颜色空间的混合运算—— 而"直接灰度化"并不总是最好的选择。
人月神话Lee
1 个月前
ios
·
ai编程
·
图像识别
【图像处理】二值化与阈值——从灰度到黑白的决策
二值化是图像处理中最"武断"的操作: 每个像素只有两种命运——要么全黑,要么全白。 但正是这种武断,让机器能够"读懂"文字、识别形状。
人月神话Lee
2 个月前
ios
·
ai编程
·
图像识别
【图像处理】亮度与对比度——图像的线性变换
亮度和对比度是最基础的图像调整。 看似简单,背后涉及线性变换、锚点、数值溢出…… 把这两个搞透彻,整个图像变换的思维框架就建立起来了。
人月神话Lee
2 个月前
ios
·
ai编程
·
图像识别
【图像处理】颜色科学与灰度化——人眼看到的和数字记录的不一样
你有没有想过:为什么把彩色照片转成黑白, 不能直接用 (R + G + B) / 3? 答案藏在人眼的生理构造里。
weixin_40809967
2 个月前
ocr
·
图像识别
·
api集成
·
医疗票据识别
·
石榴智能
·
ocr选型
·
诊断报告
医疗 OCR 识别 API 怎么选?(报告单 / 发票 / 检测单)
导语:2026年,医疗机构每天处理上千张检验报告、收费发票和检查结果——全部依赖人工录入,一张住院发票5分钟,错漏率超过2%。OCR来了,但市面上通用识别挑花眼,只有真正理解医疗场景结构化的API,才能把检查结论、费用明细如实变成可入库的JSON。本文不讲广告,给你一套从“单据类型”出发的选型实战框架 + 多语言代码示例。