【图像处理】数据集合集!

本文将为您介绍经典、热门的数据集,希望对您在选择适合的数据集时有所帮助。

1

ai_webui

  • 更新时间:2024-03-03

  • 访问地址: GitHub

  • 描述:

    用于 AI 创建的通用 Web 界面,一款好用的图像、音频、视频AI处理工具,该项目提供了图像分割、对象跟踪、图像修复、语音识别、语音合成等基础功能,以及聊天机器人、视频翻译、视频去水印等高级功能,大大提高了短视频创作的效率。

  • 数据集网址: https://github.com/jasonaidm/ai_webui

2

QT5-Image-and-video-processing-software

  • 更新时间:2024-06-02

  • 访问地址: GitHub

  • 描述:

    使用QT5+Opencv完成简单的图像处理及视频处理软件。图像处理包括:灰度化、均值滤波、边缘检测、伽马变换、旋转镜像、亮度调节、二值化、对比度,饱和度调节、色彩调节、图片保存、水印等。 视频处理包括:二值化、边缘检测、灰度化、平滑、局部马赛克、缩放等。 此外还进行了界面美化、中英翻译等。

  • 数据集网址:

    https://github.com/KyrieFeng23/QT5-Image-and-video-processing-software

3

PhotoEdit

  • 更新时间:2024-12-19

  • 访问地址: GitHub

  • 描述:

    For Android studio 图片处理 1、图片编辑(图片添加,文字添加),实现图片编辑中的图片添加,旋转,缩放,删除;文字的添加,大小缩放,字体更换,颜色更换,删除; 2,基本滤镜实现与接口封装; 涂鸦(画笔的样式,粗细,颜色,橡皮擦,贴图); 相框(简单相框,酷炫相框); 马赛就克(基本马赛克,酷炫马赛克,橡皮擦)及其接口封装 3,接下来, 图像剪切,旋转等功能实现测试接口封装

  • 数据集网址:

    https://github.com/jarlen/PhotoEdit

4

pictureChange

  • 更新时间:2024-08-15

  • 访问地址: GitHub

  • 描述:

    适用于chatgpt-on-wechat项目插件,支持百度AI和Stable Diffusion WebUI进行图像处理,提供多种模型选择,支持图生图、文生图自定义模板。Suno音乐AI可将图像和文字转为音乐。系统支持文件、图片总结功能,管理员可控制群聊内容与参数。兼容企业微信、个人号、公众号部署,确保高效管理与创作。

  • 数据集网址:

    https://github.com/Yanyutin753/pictureChange

5

ImageProcessing-Python

  • 更新时间:2024-05-18

  • 访问地址: GitHub

  • 描述:

    该资源为作者在CSDN的撰写Python图像处理文章的支撑,主要是Python实现图像处理、图像识别、图像分类等算法代码实现。该系列文章是讲解Python OpenCV图像处理知识,前期主要讲解图像入门、OpenCV基础用法,中期讲解图像处理的各种算法,包括图像锐化算子、图像增强技术、图像分割等,后期结合深度学习研究图像识别、图像分类应用。

  • 数据集网址:

    https://github.com/eastmountyxz/ImageProcessing-Python

6

Morn

  • 更新时间:2024-05-05

  • 访问地址: GitHub

  • 描述:

    Morn是一个C语言的基础工具和基础算法库,包括数据结构、图像处理、音频处理、机器学习等,具有简单、通用、高效的特点。

  • 数据集网址:

    https://github.com/jingweizhanghuai/Morn

7

JavaVision

  • 更新时间:2024-03-29

  • 访问地址: GitHub

  • 描述:

    JavaVision是一个基于Java开发的全能视觉智能识别项目。该项目起源于对图像处理和人工智能领域的热情,以及对Java作为主要编程语言的坚持。在AI领域,大多数解决方案都是使用Python实现的,因此决定充分利用Java的优势来构建一个功能强大且易于集成的视觉智能识别平台。

  • 特点:

    框架: SpringBoot

    多功能性:JavaVision不仅支持OCR接口、YoloV8物体识别、人脸识别等核心功能,还可以轻松扩展到其他领域,如语音识别、动物识别、安防检查等。

    高性能:JavaVision经过精心优化,具备卓越的性能表现。通过巧妙地结合算法优化和多线程技术,JavaVision能够在短时间内处理大量复杂的图像数据,并快速准确地进行识别和分析。

    可靠稳定:Java作为一种成熟而可靠的编程语言,具备出色的稳定性和安全性。JavaVision严格遵循最佳实践和高标准,确保项目的稳定运行,并提供可靠的数据保护和隐私保密。

    易于集成:JavaVision提供简洁而强大的API接口,使得与其他系统和平台的集成变得轻松快捷。无论是嵌入到现有应用程序中,还是作为独立的服务进行部署,JavaVision都能够与各种技术栈和框架无缝衔接。

    灵活可拓展:JavaVision采用模块化设计,允许用户根据自己的需求进行灵活的定制和扩展。用户可以根据项目需求选择合适的功能模块,也可以通过插件机制添加新的识别算法和特性。

  • 数据集网址:

    https://github.com/javpower/JavaVision

8

Augmentation

  • 更新时间:2024-12-29

  • 访问地址: GitHub

  • 描述:

    用于数据增强使用autoaugmentation的部分策略,目前实现了针对单个图像的处理,后续需要将程序完善成普适的针对数据集的处理策略。

  • 数据集网址:

    https://github.com/12sqawdwq/Augmentation

9

resnet-50

  • 更新时间:2024-12-22

  • 访问地址: GitHub

  • 描述:

    该项目基于 ResNet-50 模型进行图像分类,使用 PyTorch 实现,支持图像预处理、数据增强、训练与验证过程,并提供提前停止机制以避免过拟合。用户可以使用该代码进行任意图像分类任务的训练和推理。

  • 用途:

    图像数据预处理:包括图像大小调整、随机翻转、旋转、裁剪、标准化等。

    数据集划分:将数据集分为训练集和验证集。

    迁移学习:加载预训练的 ResNet-50 模型,并微调最后的全连接层以适应新的分类任务。

    训练与验证:在训练集上训练模型,并在验证集上评估性能。

    提前停止:当验证损失不再减少时,自动停止训练,避免过拟合。

    模型保存:训练过程中的最佳模型会被保存,以便后续使用。

    推理功能:提供一个函数用于加载训练好的模型并对新的图像进行分类预测。

    评估功能:计算模型的准确率、精确度、召回率、F1分数,并绘制混淆矩阵、PR曲线和ROC曲线。

  • 数据集网址:

    https://github.com/Highwe2hell/resnet-50

10

ComfyUI-Seed-Nodes

  • 更新时间:2024-12-18

  • 访问地址: GitHub

  • 描述:

    ComfyUI-Seed-Nodes 是一个扩展 ComfyUI 功能的自定义节点库,提供高级图像加载与像素化处理工具。

  • 用途:

    LoadImage: 加载单张图像,支持可选的 alpha 通道保留。

    LoadMultipleImages: 从指定目录加载多张图像。

    ImagePixelator: 根据指定的像素块大小对图像应用像素化效果。

    SLICPixelator: 使用 SLIC(Simple Linear Iterative Clustering)算法进行高级图像像素化处理。

  • 数据集网址:

    https://github.com/Aerse/ComfyUI-Seed-Nodes

相关推荐
李昊哲小课12 小时前
基于NLP的检索式聊天机器人
人工智能·自然语言处理·机器人
听麟12 小时前
HarmonyOS 6.0+ PC端智能监控助手开发实战:摄像头联动与异常行为识别落地
人工智能·深度学习·华为·harmonyos
wasp52012 小时前
【开源】Banana Slide:一个基于nano banana pro[特殊字符]的原生AI PPT生成应用,迈向真正的"Vibe PPT"
人工智能·开源
说私域12 小时前
破局互联网产品开发困境:开源AI智能名片链动2+1模式S2B2C商城小程序的实践与启示
人工智能·小程序·开源·私域运营
开源技术13 小时前
深入了解Turso,这个“用Rust重写的SQLite”
人工智能·python
初恋叫萱萱13 小时前
构建高性能生成式AI应用:基于Rust Axum与蓝耘DeepSeek-V3.2大模型服务的全栈开发实战
开发语言·人工智能·rust
水如烟21 小时前
孤能子视角:“组织行为学–组织文化“
人工智能
大山同学21 小时前
图片补全-Context Encoder
人工智能·机器学习·计算机视觉
薛定谔的猫198221 小时前
十七、用 GPT2 中文对联模型实现经典上联自动对下联:
人工智能·深度学习·gpt2·大模型 训练 调优
壮Sir不壮21 小时前
2026年奇点:Clawdbot引爆个人AI代理
人工智能·ai·大模型·claude·clawdbot·moltbot·openclaw