图像识别

图片放大为什么会糊？从插值到 AI 超分，超分辨率技术是怎么演进的写业务大概率遇到过：产品甩来一张 200×150 的缩略图，要放大到 banner 尺寸，你一拖就糊成一团。然后有人问："为什么放大就糊，不能像电视剧里那样 enhance 一下看清车牌吗？"

vivo互联网技术

SIGGRAPH 2026 | VeraRetouch：多任务推理式照片修图框架作者：vivo BlueImage Lab **摘要：**我们团队提出了 VeraRetouch，一个轻量、全可微分、可移动端部署的多任务推理式照片修图框架。VeraRetouch 不仅能自动修图，还能听懂用户想要的风格描述，甚至能执行精确的参数式调整。通过将 0.6B 视觉语言模型作为“修图大脑”，并设计全可微分的 Retouch Renderer 作为“修图执行器”，VeraRetouch 能够把高层语言意图转化为低层像素级调整，在保持图像结构和细节的同时完成专业化色调与色彩优化。对应的论文已被 S

基于监控视频的水位尺自动识别技术方案与实现该场景本质是一个图像/视频类计算机视觉水位监测问题：通过固定监控摄像头拍摄水尺（图中为红白搪瓷"E字水尺"），自动识别水面与水尺的交界线，结合水尺刻度标定信息换算出实时水位高程。整体技术路线为：

我写了一个AI图像视频生成工具，免费API+本地部署，分享给大家上个月刷到一条新闻，说有个叫Agnes AI的团队，把旗下文本、图片、视频三个模型的API全部免费开放了，无限期。

创作者狂喜！Seedance 2.5 支持 50 份素材同时导入，做短剧广告爽翻看完火山FORCE大会豆包2.1 Pro，千万别漏掉另一张王牌——Seedance 2.5 AI视频生成模型！官方已经确认：目前内测收尾，7月初正式全量上线，和豆包2.1 Pro、Seedream图像、Seed-Audio音频组成字节完整全栈多模态AI矩阵，文本、代码、图片、视频、音频一条龙全部打通。

豆包九宫格验证码识别上图是抖音九宫格验证码图片的样例图片。这款验证码确实有很大的难度，有一下几个特点：1、首先是图片种类非常多。

叫我：松哥

基于卷积神经网络的人脸情绪识别算法，引入残差连接与SE注意力模块1前言1.1.1 研究背景随着人工智能技术的飞速发展，人机交互日益成为日常生活的重要组成部分。人类情感的表达主要通过面部表情、语音语调、肢体动作等方式传递，其中面部表情是最直观、最丰富的载体。人脸情绪识别旨在使计算机能够自动识别人类的情绪状态，如高兴、悲伤、愤怒、惊讶等，从而实现更自然、更智能的交互。该技术在智能教育、心理健康监测、安全驾驶、娱乐互动等领域具有广阔的应用前景。

第十二章深度学习基础案例：MLP实现银行单据手写数字识别在本案例中，我们将使用PyTorch和Torchvision构建机器学习模型(特别是神经网络)来执行图像分类任务。我们使用MLP模型来构建手写数字识别模型。本案例中使用的数据集是著名的MNIST数据集，这是一个由手写数字0到9组成的28x28黑白图像数据集。

人月神话Lee

【图像处理】颜色空间——RGB之外的世界RGB 是相机记录颜色的方式，不是人类感知颜色的方式。当你说"把这张图调得更鲜艳一点"，你的意思是什么？ RGB 不知道；HSV 知道；Lab 更知道。

人月神话Lee

【图像处理】一文带你窥探近期火热图像App的主要实现原理：主色提取——从图像到调色板给一张图，告诉我它的"灵魂颜色"是什么。音乐 App 动态配色、电商颜色标注、UI 自动主题——背后都是同一个问题：从百万个像素中，找出最能代表这张图的 6 种颜色。

人月神话Lee

【图像处理】图像直方图——从"频率分布"到"智能决策"直方图是图像的"体检报告"。一眼看出：这张图曝光不足、对比度太低、色调偏暖——不用打开图像本身。掌握直方图，就掌握了对图像质量"量化评估"的能力。

人月神话Lee

【图像处理】vImage/Accelerate——SIMD 让 CPU 也能飞GPU 是并行之王，但它不是唯一的选择。 CPU 的 SIMD 单元在正确的场景下，可以让代码快 8–16 倍——而且不需要离开 Swift。

人月神话Lee

【图像处理】Core Image 与 GPU 渲染管线——让滤镜飞起来CPU 是一位精英工程师，一次专心做一件事； GPU 是一支万人工厂，每条流水线同时处理一块像素。选对工具，差距可以是 10 倍。

人月神话Lee

【图像处理】框架设计——协议、值类型与工程化思维同样是实现"灰度化"功能，一个函数、一个类的方法、一个协议的实现，结果一样，设计完全不同。这一天我们来聊聊这个框架的设计决策背后的思考，以及什么样的代码算是"工业级"的。

臻识摄像头黑屏Bug 处理我在测试摄像头测试按钮这个功能时，发现它已经弹出了对话框，但是在对话框中没有任何实时的视频图像显示，是一个黑屏，显示的摄像头的状态一直是连接中，在点击"开始播放"按钮后，整个 Python 进程直接崩溃退出，无任何错误弹窗或异常信息。多个同事的电脑上同一套代码可以正常运行，但该电脑每次都必现。

Clawdbot机器学习部署：TensorFlow模型服务化你可能已经注意到，Clawdbot（现名Moltbot）最近在开发者圈子里火得一塌糊涂。它被很多人称为"住在电脑里的贾维斯"，能通过WhatsApp、Telegram、钉钉这些你每天都在用的聊天工具，直接帮你处理文件、运行脚本、甚至操作浏览器。但如果你仔细看它的官方文档和社区讨论，会发现一个有趣的现象：Clawdbot本身并不内置机器学习能力，它更像是一个智能调度中心——把你的指令翻译成具体操作，然后调用各种工具来执行。

人月神话Lee

【图像处理】卷积原理与卷积核——图像处理的核心引擎模糊、锐化、边缘检测、浮雕…… 这些看起来完全不同的效果，底层都是同一个操作：卷积。理解了卷积，你就掌握了图像处理最核心的工具。

小郭的笔记

通过vue+js实现在网页端将像素画进行像素块级解析本文档面向有图像技术背景的读者，包含算法名称和详细技术细节。图片通过 FileReader.readAsDataURL() 读取为 Data URL，加载到 Image 对象后绘制到离屏 Canvas。通过 CanvasRenderingContext2D.getImageData() 获取 RGBA 像素数组。

人月神话Lee

【图像处理】饱和度——颜色的浓淡与灰度化饱和度为 0，图像变成灰色。饱和度为 1，颜色恢复原样。看似简单的一个滑块，背后是颜色空间的混合运算—— 而"直接灰度化"并不总是最好的选择。

人月神话Lee

【图像处理】二值化与阈值——从灰度到黑白的决策二值化是图像处理中最"武断"的操作：每个像素只有两种命运——要么全黑，要么全白。但正是这种武断，让机器能够"读懂"文字、识别形状。