用Python做有趣的AI项目 3:黑白图像自动上色(AI 上色器)

这个项目的目标是使用深度学习模型,将黑白照片自动"还原"出彩色版本,可以用在修复老照片、创意设计等场景。

🧠 项目概述

我们将使用:

cpp 复制代码
Python

OpenCV:读取和处理图像

预训练的深度学习模型(基于 Caffe 或 TensorFlow)来实现图像上色

如果你不打算训练自己的模型(因为需要很多数据和时间),我们可以使用 OpenCV 官方集成的预训练模型。

✅ 项目准备

第一步:安装依赖

cpp 复制代码
bash

pip install opencv-python opencv-contrib-python numpy

📦 第二步:下载预训练模型(OpenCV 提供)

我们将使用由 Richard Zhang 等人 提供的模型,OpenCV 已集成支持。

需要下载这三个文件(约 300MB):

cpp 复制代码
colorization_deploy_v2.prototxt

colorization_release_v2.caffemodel

pts_in_hull.npy(色彩分布点)

🧰 第三步:上色代码实现

python

cpp 复制代码
import cv2
import numpy as np

# 模型路径(需要你提前下载好)
proto_file = 'models/colorization_deploy_v2.prototxt'
model_file = 'models/colorization_release_v2.caffemodel'
pts_file = 'models/pts_in_hull.npy'

# 加载网络
net = cv2.dnn.readNetFromCaffe(proto_file, model_file)
pts = np.load(pts_file)

# 加载颜色点
class8 = net.getLayerId("class8_ab")
conv8 = net.getLayerId("conv8_313_rh")
pts = pts.transpose().reshape(2, 313, 1, 1)
net.getLayer(class8).blobs = [pts.astype("float32")]
net.getLayer(conv8).blobs = [np.full([1, 313], 2.606, dtype="float32")]

def colorize_image(image_path):
    # 读取灰度图像并转换为 LAB
    bw_image = cv2.imread(image_path)
    h, w = bw_image.shape[:2]
    img_rgb = (bw_image.astype("float32")) / 255.0
    img_lab = cv2.cvtColor(img_rgb, cv2.COLOR_BGR2Lab)
    l_channel = img_lab[:, :, 0]
    l_resized = cv2.resize(l_channel, (224, 224))
    l_resized -= 50  # 中心化

    net.setInput(cv2.dnn.blobFromImage(l_resized))
    ab_channels = net.forward()[0, :, :, :].transpose((1, 2, 0))
    ab_channels = cv2.resize(ab_channels, (w, h))

    lab_output = np.concatenate((l_channel[:, :, np.newaxis], ab_channels), axis=2)
    color_image = cv2.cvtColor(lab_output, cv2.COLOR_Lab2BGR)
    color_image = (np.clip(color_image, 0, 1) * 255).astype("uint8")
    return color_image

🖼️ 第四步:测试和显示结果

cpp 复制代码
python

import matplotlib.pyplot as plt

def show_result(image_path):
    color_img = colorize_image(image_path)
    bw_img = cv2.imread(image_path, cv2.IMREAD_GRAYSCALE)

    plt.figure(figsize=(10, 5))
    plt.subplot(1, 2, 1)
    plt.imshow(bw_img, cmap='gray')
    plt.title("原始黑白图")
    plt.axis('off')

    plt.subplot(1, 2, 2)
    plt.imshow(cv2.cvtColor(color_img, cv2.COLOR_BGR2RGB))
    plt.title("上色后的图像")
    plt.axis('off')

    plt.show()

示例

cpp 复制代码
# show_result('old_photo.jpg')

🧩 可选扩展

用 Flask 打造网页上传上色器

加入批量上色功能

训练自己的模型(高阶)

风格化上色:做成漫画风、复古风等

相关推荐
iCxhust5 分钟前
c# U盘映像生成工具
开发语言·单片机·c#
yangzhi_emo44 分钟前
ES6笔记2
开发语言·前端·javascript
九年义务漏网鲨鱼2 小时前
【大模型学习 | MINIGPT-4原理】
人工智能·深度学习·学习·语言模型·多模态
emplace_back2 小时前
C# 集合表达式和展开运算符 (..) 详解
开发语言·windows·c#
jz_ddk2 小时前
[学习] C语言数学库函数背后的故事:`double erf(double x)`
c语言·开发语言·学习
元宇宙时间2 小时前
Playfun即将开启大型Web3线上活动,打造沉浸式GameFi体验生态
人工智能·去中心化·区块链
开发者工具分享2 小时前
文本音频违规识别工具排行榜(12选)
人工智能·音视频
萧曵 丶2 小时前
Rust 所有权系统:深入浅出指南
开发语言·后端·rust
xiaolang_8616_wjl2 小时前
c++文字游戏_闯关打怪2.0(开源)
开发语言·c++·开源