目录
1.文章内容来源
python
1.题目来源:https://edu.csdn.net/skill/opencv/opencv-819f137c35c64f76945bcd7e60d37807?category=657&typeId=20811
2.资料来源:https://edu.csdn.net/skill/opencv/opencv-819f137c35c64f76945bcd7e60d37807?category=657&typeId=20810#___44
2.图像的进阶操作
2.1.边界填充
python
常见的边界填充的方法有如下5种:
BORDER_REPLICATE :复制法,也就是复制最边缘像素
BORDER_REFLECT :反射法,对感兴趣的图像中的像素在两边进行复制例如:fedcb|ajabcdefghjhg|fedcb
BORDER_REFLECT_101 :反射法,也就是以最边缘像素为轴、对称、gfedcb|jabcdefghi|gfedcba
BORDER_WRAP :外包装法 abcdefgh|abcdefgh|abcdefgh
BORDER_CONSTANT : 常量法,常数值填充,填充一个常数value(效果不好)
python
#%%
import cv2
import matplotlib.pyplot as plt
img = cv2.imread(r"cv.jpg")
top_size,buttom_size,left_size,right_size = (50,50,50,50)# 定义图片显示大小
# 复制法,也就是复制最边缘像素
replicate = cv2.copyMakeBorder(img,top_size,buttom_size,left_size,right_size,borderType=cv2.BORDER_REPLICATE)
# 反射法,对感兴趣的图像中的像素在两边进行复制例如:fedcb|ajabcdefghjhg|fedcb
reflect = cv2.copyMakeBorder(img,top_size,buttom_size,left_size,right_size,borderType=cv2.BORDER_REFLECT)
# 反射法,也就是以最边缘像素为轴、对称、gfedcb|jabcdefghi|gfedcba
reflect01 = cv2.copyMakeBorder(img,top_size,buttom_size,left_size,right_size,borderType=cv2.BORDER_REFLECT_101)
# 外包装法 abcdefgh|abcdefgh|abcdefgh
wrap = cv2.copyMakeBorder(img,top_size,buttom_size,left_size,right_size,borderType=cv2.BORDER_WRAP)
# 常量法,常数值填充,填充一个常数value(效果不好)
constant = cv2.copyMakeBorder(img,top_size,buttom_size,left_size,right_size,borderType=cv2.BORDER_CONSTANT)
#绘制效果图
figure=[img,replicate,reflect,reflect01,wrap,constant]
title=[u'ORIGINAL',u'REPLICATE',u'REFLECT',u'REPLICATE01',u'WRAP',u'CONSTANT']
for i in range(6):
plt.subplot(2,3,i+1)
plt.imshow(figure[i],'gray')
plt.title(title[i]),plt.xticks([]),plt.yticks([])
plt.show()
2.2.数值计算
python
数值计算方法与原则:
图片的灰度值范围为0-255,如果超出范围就会作溢出计算。
example:
如果一个灰度值为254的像素点,做加法运算+10,则表示为254+10=264>255;
此时该点的像素值为264-255=9
python
import cv2
img = cv2.imread(r"cv.jpg")
img2 = img + 100
img[:5,:,0]
print(img)
print("*******************************")
print(img2)
2.3.图像融合
python
图像融合:
1.图像融合要求我们两张图片的H和W必须是一样的。
2.我们首先获取第一张图片的大小。
3.我们然后用resize()函数来修改第二张图片大小与第一张图片相同。
4.这里注意img.shape()返回的是(H,W),resize()需要输入的是(W,H)
5.最后再用addWeighted()函数融合获得图片即可
python
#%%
import cv2 as cv
import matplotlib.pyplot as plt
import numpy as np
img = cv.imread(r"cv.jpg")
print(img.shape)#打印出来的是(1748,2400)
img_cat = cv.imread(r"data_data.jpg")
img_cat = cv.resize(img_cat,(2400,1748))#设置与 img 一样的数值
res = cv.addWeighted(img,0.4,img_cat,0.6,0)
plt.imshow(res)
plt.xticks([]),plt.yticks([])
plt.show()
2.4.图像保存
python
#%%
"""
图像的保存非常简单,只需要使用 imwrite() 方法即可将图像保存起来
千万注意最好别加中文
"""
import cv2
img = cv.imread("./cv.jpg",cv.IMREAD_GRAYSCALE)# 读取图像
# 图像保存
cv.imwrite("./cv_demo.jpg",img)# 第一个参数是图像要保存的路径,第二个图像是要保存的图像
2.5.视频读取
python
#%%
import cv2
video = cv2.VideoCapture(r"lihuatian.mp4")
# 检查是否打开正确
if video.isOpened():
# 我们都知道视频和游戏其实都是由图像组成的,通过访问图像的帧数连贯形成的,这里也是一样
# video.read() 一帧一帧地读取
# open 得到的是一个布尔值,就是 True 或者 False
# frame 得到当前这一帧的图像
open, frame = video.read()
else:
open = False
#如果打开正确的话,进行每帧的遍历
while open:
ret, frame = video.read()
# 如果读到的帧数不为空,那么就继续读取,如果为空,就退出
if frame is None:
break
if ret == True:
# 转换为灰度图
#gray = cv2.cvtColor(frame, cv2.COLOR_UNCHANGED)
cv2.imshow("video",frame)
# 这里使用 waitKey 可以控制视频的播放速度,数值越小,播放速度越快
# 这里等于 27 也即是说按下 ESC 键即可退出该窗口
if cv2.waitKey(10) & 0xFF == 27:
break
video.release()
cv2.destroyAllWindows()
3.课后习题代码复现
3.1.问题一图像像素颜色
python
#%%
"""
认识颜色空间,OpenCV 常用的颜色空间有RGB颜色空间、HSV颜色空间、Lab颜色空间。
以下选项中不正确打印像素(100,100)处颜色空间分量名字的是?
"""
#OPENCV中默认的颜色通道是BRG!!!
import numpy as np
import cv2 as cv
if __name__ == '__main__':
img = cv.imread('lena.png', cv.IMREAD_COLOR)
px = img[100, 100]
print(f'blue:{px[0]}, green:{px[0]}, red:{px[0]}')
3.2.问题二图片黑客帝国化
python
颜色操作方法:
Method 1.数据img[i,j]上直接进行操作
Method 2.b,g,r = img.item((i, j, 0)),img.item((i, j, 1)), img.item((i, j, 2))
必须分别指明bgr
python
#%%
import numpy as np
import cv2
import math
def hacker(img):
height, width, channels = img.shape
for i in range(0, width):
for j in range(0, height):
b, g, r = img[i, j]
hack_b = int(math.pow(b/256.0, 3/2) * 256)
hack_g = int(math.pow(g/256.0, 4/5) * 256)
hack_r = int(math.pow(r/256.0, 3/2) * 256)
img[i, j] = (hack_b, hack_g, hack_r)
if __name__ == '__main__':
img_origin = cv2.imread('lena.png', cv2.IMREAD_COLOR)
img = cv2.imread('lena.png', cv2.IMREAD_COLOR)
print(img.size)
print(img.shape)
hacker(img)
print('显示图片,请按任意键退出')
numpy_horizontal_concat = np.concatenate((img_origin, img), axis=1)
cv2.imshow('Lena图片黑客帝国化', numpy_horizontal_concat)
cv2.waitKey()
cv2.destroyAllWindows()
3.3.问题三梅西的足球轨迹
python
1.首先我们需要知道这个图片的轴是在哪?
图片的轴是在以左上角为轴向下做y轴正方向,向右边做x轴正方向
2.所以messi的球的轨迹还原是y减小x增大的路径的。
3.我们描述的适合,都是习惯(x,y),但在cv很多方面都是使用(y,x)坐标。
python
import cv2
import numpy as np
if __name__ == '__main__':
img = cv2.imread('ball.jpg', cv2.IMREAD_COLOR)
start = [493, 594]
end = [112, 213]
ball = img[start[0]:start[1], end[0]:end[1]]
x_step = 101
y_step = 10
for i in range(-1, 4):
# TODO(You): 请在此实现代码
x_offset = x_step*i
y_offset = y_step*i
img[start[0]-y_offset:start[1]-y_offset, end[0]+x_offset:end[1]+x_offset] = ball
cv2.imshow("ball_continue", img)
cv2.waitKey(0)
cv2.destroyAllWindows()
4.易错点总结与反思
python
1.边界填充的方法有很多种,最好别用恒值填充。
2.灰度值计算具有溢出原则,超过255就又从0开始计算了。
3.图像保存用imwrite(),路径最好不要用中文。
4.OPENCV中默认的颜色通道是BGR。
5.用item()函数操作颜色的时候一定要指明是BGR。
6.图片的坐标轴是从左上方为原点,向下为y轴正半轴,向右为x轴正半轴。