机器学习——奇异值分解案例(图片压缩-代码简洁版)

本想大迈步进入前馈神经网络

但是...唉...瞅了几眼,头晕

然后想到之前梳理的奇异值分解、主成分分析、CBOW都没有实战

如果没有实际操作,会有一种浮在云端的虚无感

但是如果要实际操作,我又不想直接调用库包

可是...如果不直接调包,感觉自己又像是在造轮子造螺丝,明明别人都已经造好了,为什么还要自己造一遍呢

意义何在?

这又让我回想当初开始机器学习的初衷:消磨时间

既然初衷至今没变,那就不应该求快,应该尽可能合格专业地磨洋工

生活本就没有意义,再加快脚步,又有什么意义呢?

slow down

好叭,那就慢慢来,自己造个破破烂烂的轮子,也能敝帚自珍

通过奇异值分解,来压缩图片

这就需要opencv来获取图片的RGB信息。

python 复制代码
import cv2
img = cv2.imread("crab.png", 1)
print(img)

首先,获取到的图片信息是个嵌套数组,一般每个像素表示一个向量,这个向量里含有RGB三个数值

获取到的颜色信息数据,是个嵌套数组,并不是奇异值分解中的标准矩阵形式

因此,我们需要将RGB这三个颜色通道的数据拆分开,变成三个矩阵

  • 矩阵1:表示红色通道的图片信息
  • 矩阵2:表示绿色通道的图片信息
  • 矩阵3:表示蓝色通道的图片信息
python 复制代码
b,g,r = cv2.split(img)

算了,还是直接给出完整代码吧

python 复制代码
import cv2
import numpy as np

# 前k个sigma
k = 1000

# 读取三通道颜色
img = cv2.imread("img1.png", 1)
colors = cv2.split(img)

new_colors = []
for c in colors:
    # 奇异值分解
    u, sigma, v = np.linalg.svd(c, full_matrices=0)
    u = u[:,:k] # 获取U的前k列
    sigma = np.diag(sigma[:k]) # 奇异值是一个一维向量,将奇异值构造成对角矩阵
    v = v[:k,:] # 获取V的前k行
    
    # 组建压缩后的新矩阵
    a = np.matmul(u,sigma)
    new_c = np.matmul(a,v)
    """转型!!!很重要!!!!因为矩阵计算后是float型,float型在cv2的显示有很大问题!!!!!!!!!!"""
    new_c = new_c.astype('uint8')
    new_colors.append(new_c)
    
# 展示原图与压缩图片
cv2.imshow("img-old", cv2.merge(colors))
cv2.imshow("img-new", cv2.merge(new_colors))
cv2.waitKey(0)

这是k=1000时的对比

这是k=100时的样子

K的取值范围,是基于sigma奇异值的个数范围内

因此,有些人为了避免自己k值设置超出范围报错,可以加以限制

但我被下边的bug烦了4个小时,有些气恼,懒得搞了

找了4个小时的bug!!!!!!居然是没有将float转为整数!!!含恨吐血

python 复制代码
new_c = new_c.astype('uint8')

没有转型,就会变成下边这样,。,。。。。鬼样!!

相关推荐
shuaicoding1 小时前
OpenClaw 完全指南:让你的 AI 助手真正『长』在浏览器里
人工智能
刀法如飞1 小时前
AI时代,程序员都应该是算法思想工程师
人工智能·设计模式·程序员
理想小青年1 小时前
OpenClaw网络搜索Tavily Search Skill 安装教程
人工智能
yangpow22 小时前
深度解析 OpenClaw:一个自托管 AI Agent 网关的架构设计与安全机制
人工智能
agentium2 小时前
1小时LangChain教程
人工智能
工边页字2 小时前
面试官:请详细介绍下AI中的token,越详细越好!
前端·人工智能·后端
Miku162 小时前
OpenClaw-Linux+飞书官方Plugin安装指南
linux·人工智能·agent
Miku162 小时前
OpenClaw 接入 QQ Bot 完整实践指南
linux·人工智能·agent
哥布林学者2 小时前
高光谱成像(五)高光谱成像的噪声估计
机器学习·高光谱成像
熊崽3 小时前
Claude Code CLI+英伟达免费api 教程
人工智能