机器学习——奇异值分解案例(图片压缩-代码简洁版)

本想大迈步进入前馈神经网络

但是...唉...瞅了几眼,头晕

然后想到之前梳理的奇异值分解、主成分分析、CBOW都没有实战

如果没有实际操作,会有一种浮在云端的虚无感

但是如果要实际操作,我又不想直接调用库包

可是...如果不直接调包,感觉自己又像是在造轮子造螺丝,明明别人都已经造好了,为什么还要自己造一遍呢

意义何在?

这又让我回想当初开始机器学习的初衷:消磨时间

既然初衷至今没变,那就不应该求快,应该尽可能合格专业地磨洋工

生活本就没有意义,再加快脚步,又有什么意义呢?

slow down

好叭,那就慢慢来,自己造个破破烂烂的轮子,也能敝帚自珍

通过奇异值分解,来压缩图片

这就需要opencv来获取图片的RGB信息。

python 复制代码
import cv2
img = cv2.imread("crab.png", 1)
print(img)

首先,获取到的图片信息是个嵌套数组,一般每个像素表示一个向量,这个向量里含有RGB三个数值

获取到的颜色信息数据,是个嵌套数组,并不是奇异值分解中的标准矩阵形式

因此,我们需要将RGB这三个颜色通道的数据拆分开,变成三个矩阵

  • 矩阵1:表示红色通道的图片信息
  • 矩阵2:表示绿色通道的图片信息
  • 矩阵3:表示蓝色通道的图片信息
python 复制代码
b,g,r = cv2.split(img)

算了,还是直接给出完整代码吧

python 复制代码
import cv2
import numpy as np

# 前k个sigma
k = 1000

# 读取三通道颜色
img = cv2.imread("img1.png", 1)
colors = cv2.split(img)

new_colors = []
for c in colors:
    # 奇异值分解
    u, sigma, v = np.linalg.svd(c, full_matrices=0)
    u = u[:,:k] # 获取U的前k列
    sigma = np.diag(sigma[:k]) # 奇异值是一个一维向量,将奇异值构造成对角矩阵
    v = v[:k,:] # 获取V的前k行
    
    # 组建压缩后的新矩阵
    a = np.matmul(u,sigma)
    new_c = np.matmul(a,v)
    """转型!!!很重要!!!!因为矩阵计算后是float型,float型在cv2的显示有很大问题!!!!!!!!!!"""
    new_c = new_c.astype('uint8')
    new_colors.append(new_c)
    
# 展示原图与压缩图片
cv2.imshow("img-old", cv2.merge(colors))
cv2.imshow("img-new", cv2.merge(new_colors))
cv2.waitKey(0)

这是k=1000时的对比

这是k=100时的样子

K的取值范围,是基于sigma奇异值的个数范围内

因此,有些人为了避免自己k值设置超出范围报错,可以加以限制

但我被下边的bug烦了4个小时,有些气恼,懒得搞了

找了4个小时的bug!!!!!!居然是没有将float转为整数!!!含恨吐血

python 复制代码
new_c = new_c.astype('uint8')

没有转型,就会变成下边这样,。,。。。。鬼样!!

相关推荐
狂炫冰美式几秒前
3天,1人,从0到付费产品:AI时代个人开发者的生存指南
前端·人工智能·后端
LCG元32 分钟前
垂直Agent才是未来:详解让大模型"专业对口"的三大核心技术
人工智能
我不是QI1 小时前
周志华《机器学习—西瓜书》二
人工智能·安全·机器学习
操练起来1 小时前
【昇腾CANN训练营·第八期】Ascend C生态兼容:基于PyTorch Adapter的自定义算子注册与自动微分实现
人工智能·pytorch·acl·昇腾·cann
KG_LLM图谱增强大模型1 小时前
[500页电子书]构建自主AI Agent系统的蓝图:谷歌重磅发布智能体设计模式指南
人工智能·大模型·知识图谱·智能体·知识图谱增强大模型·agenticai
声网1 小时前
活动推荐丨「实时互动 × 对话式 AI」主题有奖征文
大数据·人工智能·实时互动
caiyueloveclamp1 小时前
【功能介绍03】ChatPPT好不好用?如何用?用户操作手册来啦!——【AI溯源篇】
人工智能·信息可视化·powerpoint·ai生成ppt·aippt
q***48412 小时前
Vanna AI:告别代码,用自然语言轻松查询数据库,领先的RAG2SQL技术让结果更智能、更精准!
人工智能·microsoft
LCG元2 小时前
告别空谈!手把手教你用LangChain构建"能干活"的垂直领域AI Agent
人工智能
想你依然心痛3 小时前
视界无界:基于Rokid眼镜的AI商务同传系统开发与实践
人工智能·智能硬件·rokid·ai眼镜·ar技术