背景替换大模型图像处理gradio部署服务

愿我们终有重逢之时,而你还记得我们曾经讨论的话题。

group 868373192

second group 277356808

1. 导入库
复制代码
import gradio as gr
from PIL import Image
from modelscope_studio import encode_image, decode_image, call_demo_service
import json
import os
from skimage import io
import numpy as np
  • gradio: 用于创建交互式Web界面的库。

  • PIL: Python Imaging Library,用于图像处理。

  • modelscope_studio: 自定义库,包含图像编码、解码和调用模型服务的功能。

  • json: 用于处理JSON数据。

  • os: 用于处理文件路径。

  • skimage.io: 用于读取图像。

  • numpy: 用于数值计算。

2. 定义推理函数 inference
复制代码
def inference(image: Image, bk: Image) -> Image:
    if image is None or bk is None:
        return None, None
    input_url = encode_image(image)

    data = {
        "task": "portrait-matting",
        "inputs": [
            input_url
        ],
        "urlPaths": {
            "inUrls": [
                {
                    "value": input_url,
                    "fileType": "png",
                    "type": "image",
                    "displayType": "ImgUpload",
                    "displayProps": {
                        "label": {
                            "text": "原图",
                            "style": {
                                "background": "rgba(98,74,255,0.8)",
                                "color": "#fff"
                            }
                        }
                    },
                    "validator": {
                        "max_resolution": "3000*3000",
                        "max_size": "10M"
                    },
                    "name": "",
                    "title": ""
                }
            ],
            "outUrls": [
                {
                    "outputKey": "output_img",
                    "type": "image"
                }
            ]
        }
    }
    model_id = 'cv_unet_image-matting'
    result = call_demo_service(path='damo', name=model_id, data=json.dumps(data))
    print(result)
    res_url = result['data']['output_img']

    res_img = io.imread(res_url)
    alpha = res_img[:, :, 3:4] / 255.0
    w, h = image.size
    bk = bk.resize((w, h))
    combine_img = image * alpha + bk * (1 - alpha)
    combine_img = combine_img.astype(np.uint8)
    return res_img, combine_img
  • 功能: 该函数接收两张图像(人像和背景),使用模型对输入的人像进行抠图,然后将抠图结果与背景图像进行合成,生成新的图像。

  • 步骤:

    1. 检查输入: 确保输入图像不为空。

    2. 图像编码: 将输入图像编码为URL。

    3. 构建请求数据: 构建包含任务类型、输入图像URL等信息的JSON数据。

    4. 调用模型服务 : 使用call_demo_service函数调用模型服务进行抠图。

    5. 读取结果: 从模型服务返回的结果中获取抠图结果的URL,并读取该图像。

    6. 处理图像: 提取抠图结果的Alpha通道,调整背景图像大小,将抠图结果与背景图像合成。

    7. 返回结果: 返回抠图结果和合成后的新图像。

3. 定义Gradio界面
复制代码
css_style = "#fixed_size_img {height: 240px;} " \
            "#overview {margin: auto;max-width: 400px; max-height: 400px;}"

title = "一键人像抠图换背景"
description = "输入一张人像照片和背景图,本空间能生成抠图结果,并进行换背景,一键穿越!欢迎使用!"
examples = [[os.path.dirname(__file__) + 'input1.jpg', os.path.dirname(__file__) + 'bk1.jpg'],
            [os.path.dirname(__file__) + 'input2.jpg', os.path.dirname(__file__) + 'bk2.jpg'],
            [os.path.dirname(__file__) + 'input3.jpg', os.path.dirname(__file__) + 'bk3.jpg']]

with gr.Blocks(title=title, css=css_style) as demo:
    gr.HTML('''
      <div style="text-align: center; max-width: 720px; margin: 0 auto;">
                  <div
                    style="
                      display: inline-flex;
                      align-items: center;
                      gap: 0.8rem;
                      font-size: 1.75rem;
                    "
                  >
                    <h1 style="font-family:  PingFangSC; font-weight: 500; font-size: 36px; margin-bottom: 7px;">


                      一键人像抠图换背景
                    </h1>       
      ''')

    gr.Markdown(description)
    with gr.Row():
        img_input1 = gr.Image(label="人像", type="pil", elem_id="fixed_size_img")
        img_output1 = gr.Image(label="抠图", type="pil", elem_id="fixed_size_img")
    with gr.Row():
        img_input2 = gr.Image(label="背景", type="pil", elem_id="fixed_size_img")
        img_output2 = gr.Image(label="新图", type="pil", elem_id="fixed_size_img")
    with gr.Row():
        btn_submit = gr.Button(value="一键抠图换背景", elem_id="blue_btn")
        # btn_clear = gr.Button(value="清除")

    examples = gr.Examples(examples=examples, inputs=[img_input1, img_input2], outputs=[img_output1, img_output2])
    btn_submit.click(inference, inputs=[img_input1, img_input2], outputs=[img_output1, img_output2])

demo.launch()
  • 功能: 创建一个Gradio界面,允许用户上传人像和背景图像,并展示抠图结果和合成后的新图像。

  • 界面元素:

    • 标题: 显示"一键人像抠图换背景"。

    • 描述: 显示功能的简要说明。

    • 输入框: 用户上传人像和背景图像。

    • 输出框: 显示抠图结果和合成后的新图像。

    • 按钮 : 用户点击按钮后,调用inference函数进行抠图和合成。

    • 示例: 提供一些示例图像供用户参考。

4. 启动Gradio界面
复制代码
demo.launch()
  • 功能: 启动Gradio界面,用户可以在浏览器中访问并使用该工具。

总结

该代码实现了一个基于Gradio的Web界面,用户可以通过上传人像和背景图像,使用预训练的模型进行人像抠图,并将抠图结果与背景图像合成,生成新的图像。界面简洁直观,适合用于展示和体验人像抠图换背景的功能。

相关推荐
feilieren15 分钟前
AI 视频:初识 Pika 2.0,基本使用攻略
人工智能·ai视频
开放知识图谱1 小时前
论文浅尝 | HippoRAG:神经生物学启发的大语言模型的长期记忆(Neurips2024)
人工智能·语言模型·自然语言处理
威化饼的一隅1 小时前
【多模态】swift-3框架使用
人工智能·深度学习·大模型·swift·多模态
人类群星闪耀时2 小时前
大模型技术优化负载均衡:AI驱动的智能化运维
运维·人工智能·负载均衡
编码小哥2 小时前
通过opencv加载、保存视频
人工智能·opencv
发呆小天才O.oᯅ2 小时前
YOLOv8目标检测——详细记录使用OpenCV的DNN模块进行推理部署C++实现
c++·图像处理·人工智能·opencv·yolo·目标检测·dnn
lovelin+v175030409662 小时前
智能电商:API接口如何驱动自动化与智能化转型
大数据·人工智能·爬虫·python
rpa_top2 小时前
RPA 助力电商:自动化商品信息上传,节省人力资源 —— 以影刀 RPA 为例【rpa.top】
大数据·前端·人工智能·自动化·rpa
视觉语言导航2 小时前
arXiv-2024 | STMR:语义拓扑度量表示引导的大模型推理无人机视觉语言导航
人工智能·具身智能
咯咯咯伦3 小时前
AI神了,一键视频下载+翻译+配音+字幕!(整合包)
人工智能