用Python做有趣的AI项目 3:黑白图像自动上色(AI 上色器)

这个项目的目标是使用深度学习模型,将黑白照片自动"还原"出彩色版本,可以用在修复老照片、创意设计等场景。

🧠 项目概述

我们将使用:

cpp 复制代码
Python

OpenCV:读取和处理图像

预训练的深度学习模型(基于 Caffe 或 TensorFlow)来实现图像上色

如果你不打算训练自己的模型(因为需要很多数据和时间),我们可以使用 OpenCV 官方集成的预训练模型。

✅ 项目准备

第一步:安装依赖

cpp 复制代码
bash

pip install opencv-python opencv-contrib-python numpy

📦 第二步:下载预训练模型(OpenCV 提供)

我们将使用由 Richard Zhang 等人 提供的模型,OpenCV 已集成支持。

需要下载这三个文件(约 300MB):

cpp 复制代码
colorization_deploy_v2.prototxt

colorization_release_v2.caffemodel

pts_in_hull.npy(色彩分布点)

🧰 第三步:上色代码实现

python

cpp 复制代码
import cv2
import numpy as np

# 模型路径(需要你提前下载好)
proto_file = 'models/colorization_deploy_v2.prototxt'
model_file = 'models/colorization_release_v2.caffemodel'
pts_file = 'models/pts_in_hull.npy'

# 加载网络
net = cv2.dnn.readNetFromCaffe(proto_file, model_file)
pts = np.load(pts_file)

# 加载颜色点
class8 = net.getLayerId("class8_ab")
conv8 = net.getLayerId("conv8_313_rh")
pts = pts.transpose().reshape(2, 313, 1, 1)
net.getLayer(class8).blobs = [pts.astype("float32")]
net.getLayer(conv8).blobs = [np.full([1, 313], 2.606, dtype="float32")]

def colorize_image(image_path):
    # 读取灰度图像并转换为 LAB
    bw_image = cv2.imread(image_path)
    h, w = bw_image.shape[:2]
    img_rgb = (bw_image.astype("float32")) / 255.0
    img_lab = cv2.cvtColor(img_rgb, cv2.COLOR_BGR2Lab)
    l_channel = img_lab[:, :, 0]
    l_resized = cv2.resize(l_channel, (224, 224))
    l_resized -= 50  # 中心化

    net.setInput(cv2.dnn.blobFromImage(l_resized))
    ab_channels = net.forward()[0, :, :, :].transpose((1, 2, 0))
    ab_channels = cv2.resize(ab_channels, (w, h))

    lab_output = np.concatenate((l_channel[:, :, np.newaxis], ab_channels), axis=2)
    color_image = cv2.cvtColor(lab_output, cv2.COLOR_Lab2BGR)
    color_image = (np.clip(color_image, 0, 1) * 255).astype("uint8")
    return color_image

🖼️ 第四步:测试和显示结果

cpp 复制代码
python

import matplotlib.pyplot as plt

def show_result(image_path):
    color_img = colorize_image(image_path)
    bw_img = cv2.imread(image_path, cv2.IMREAD_GRAYSCALE)

    plt.figure(figsize=(10, 5))
    plt.subplot(1, 2, 1)
    plt.imshow(bw_img, cmap='gray')
    plt.title("原始黑白图")
    plt.axis('off')

    plt.subplot(1, 2, 2)
    plt.imshow(cv2.cvtColor(color_img, cv2.COLOR_BGR2RGB))
    plt.title("上色后的图像")
    plt.axis('off')

    plt.show()

示例

cpp 复制代码
# show_result('old_photo.jpg')

🧩 可选扩展

用 Flask 打造网页上传上色器

加入批量上色功能

训练自己的模型(高阶)

风格化上色:做成漫画风、复古风等

相关推荐
qinyia4 分钟前
Wisdom SSH 是一款创新性工具,通过集成 AI 助手,为服务器性能优化带来极大便利。
服务器·人工智能·ssh
昨日之日20063 小时前
Wan2.2-S2V - 音频驱动图像生成电影级质量的数字人视频 ComfyUI工作流 支持50系显卡 一键整合包下载
人工智能·音视频
一个天蝎座 白勺 程序猿4 小时前
Python爬虫(47)Python异步爬虫与K8S弹性伸缩:构建百万级并发数据采集引擎
爬虫·python·kubernetes
XiaoMu_0015 小时前
基于Django+Vue3+YOLO的智能气象检测系统
python·yolo·django
SEO_juper5 小时前
大型语言模型SEO(LLM SEO)完全手册:驾驭搜索新范式
人工智能·语言模型·自然语言处理·chatgpt·llm·seo·数字营销
攻城狮7号6 小时前
腾讯混元翻译模型Hunyuan-MT-7B开源,先前拿了30个冠军
人工智能·hunyuan-mt-7b·腾讯混元翻译模型·30个冠军
zezexihaha6 小时前
从“帮写文案”到“管生活”:个人AI工具的边界在哪?
人工智能
算家云6 小时前
nano banana官方最强Prompt模板来了!六大场景模板详解
人工智能·谷歌·ai大模型·算家云·ai生图·租算力,到算家云·nano banana 提示词
暴躁的大熊6 小时前
AI助力决策:告别生活与工作中的纠结,明析抉择引领明智选择
人工智能
Gyoku Mint6 小时前
提示词工程(Prompt Engineering)的崛起——为什么“会写Prompt”成了新技能?
人工智能·pytorch·深度学习·神经网络·语言模型·自然语言处理·nlp