Python-OpenCV教程-4

来源:互联网 发布:北京凶宅数据库名单 编辑:程序博客网 时间:2024/05/16 07:31

OpenCV版本要求在2.3.1以上

本文主要介绍OpenCV中对图像的基本操作和基本算法

1.基本操作

在Python环境下,我们有两种方式来操作图像——通过OpenCV提供的函数来操作图像或者是通过Numpy来直接修改图像的数组。这里,我们推荐使用Numpy的方式,应为它清晰并且高效。

首先我们读取一幅图像:

<span style="font-size:14px;">>>> import cv2>>> import numpy as np>>> img = cv2.imread('messi5.jpg')</span>

然后,我们可以直接通过行列坐标来访问这个像素的BGR值。对于灰度图像,则是访问它的灰度值。

>>> px = img[100,100]>>> print px[157 166 200]# accessing only blue pixel>>> blue = img[100,100,0]>>> print blue157

然后通过这种方式也可以修改像素的值:

>>> img[100,100] = [255,255,255]>>> print img[100,100][255 255 255]

但是,以上这种读取像素值的方式非常缓慢。因此,我们耿推荐使用Numpy的函数——array.item()和array.itemset()来访问。

以下是推荐的访问和修改方式:

# accessing RED value>>> img.item(10,10,2)59# modifying RED value>>> img.itemset((10,10,2),100)>>> img.item(10,10,2)100
除了访问图像的像素值,我们还能获取图像的属性——行数、列数、通道数、图像的数据类型以及像素点的数量等。

通过img.shape这个属性,我们可以得到一个记录了图像行数、列数和通道数的元组(灰度图像则只返回行列数,通过这个可以区分图像是彩色的还是灰度的)。

像素点的数量可以通过img.size这个函数获得,图像的数据类型可以通过img.dtype来获得:

>>> print img.shape(342, 548, 3)>>> print img.size562248>>> print img.dtypeuint8
有时,我们会经常对一幅图像的特定区域进行操作。比如我们要对一幅图像进行人眼检测,那么一般会先去检测人脸,然后在人脸的区域内去检测眼睛。这样做即提高的精度(因为眼睛总是长在脸上 : D),又提高了速度(搜索区域变小了)。

我们把这种特定区域的操作叫做ROI(region of image),下面的代码中,我们把图中的球复制到另一区域:

>>> ball = img[280:340, 330:390]>>> img[273:333, 100:160] = ball
效果如下:

Image ROI

有时我们还需要把图形的RGB通道分离,或者是把分离的三个通道合成成一幅RGB图像:

>>> b,g,r = cv2.split(img)>>> img = cv2.merge((b,g,r))
或者

>>> b = img[:,:,0]
假设你想要把所有红色像素的值置为0:

>>> img[:,:,2] = 0
另外,cv2.split()函数运行非常消耗时间,所以在不必要的情况下最好别用。因此,我们更即推荐第二种方法。
最后,再介绍一个基本操作——边界填补(Padding)

在卷积计算、零点补偿等领域内,Padding有非常大的用处。Padding主要使用cv2.copyMakeBorder()这个函数,它需要的参数如下:

src:输入的图片

top,bottom,left,right:上下左右边界的宽度。

borderType:请参考英文页面

下面的代码显示了所有不同类型的边界:

import cv2import numpy as npfrom matplotlib import pyplot as pltBLUE = [255,0,0]img1 = cv2.imread('opencv_logo.png')replicate = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_REPLICATE)reflect = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_REFLECT)reflect101 = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_REFLECT_101)wrap = cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_WRAP)constant= cv2.copyMakeBorder(img1,10,10,10,10,cv2.BORDER_CONSTANT,value=BLUE)plt.subplot(231),plt.imshow(img1,'gray'),plt.title('ORIGINAL')plt.subplot(232),plt.imshow(replicate,'gray'),plt.title('REPLICATE')plt.subplot(233),plt.imshow(reflect,'gray'),plt.title('REFLECT')plt.subplot(234),plt.imshow(reflect101,'gray'),plt.title('REFLECT_101')plt.subplot(235),plt.imshow(wrap,'gray'),plt.title('WRAP')plt.subplot(236),plt.imshow(constant,'gray'),plt.title('CONSTANT')plt.show()
Border Types

翻译自http://docs.opencv.org/trunk/doc/py_tutorials/py_core/py_basic_ops/py_basic_ops.html#basic-ops

2.基本算法

我们可以通过cv2.add()函数或者是numpy的运算res=img1+img2来相加两幅图片。需要说明的是add()函数两个数相加如果大于255则结果就是255,而直接相加的会如果大于255则会把结果对255取模。

>>> x = np.uint8([250])>>> y = np.uint8([10])>>> print cv2.add(x,y) # 250+10 = 260 => 255[[255]]>>> print x+y          # 250+10 = 260 % 256 = 4[4]
除了简单相加两幅图像,我们还能按比重去混合两幅图像,混合时按照以下公式:

g(x) = (1 - \alpha)f_{0}(x) + \alpha f_{1}(x)

\alpha0 \rightarrow 1调整,我们能看到从一幅图像慢慢变为另一副图像,cv2.addWeighted()按照以下公式来混合两幅图像:

dst = \alpha \cdot img1 + \beta \cdot img2 + \gamma

<span style="font-size:18px;">img1 = cv2.imread('ml.png')img2 = cv2.imread('opencv_logo.jpg')dst = cv2.addWeighted(img1,0.7,img2,0.3,0)cv2.imshow('dst',dst)cv2.waitKey(0)cv2.destroyAllWindows()</span>
效果如下

Image Blending

另外OpenCV还支持对象素点的位运算(与或非和亦或)。这些运算方法在提取图片的非矩形区域时,能发挥意想不到的作用。

比如我想把上面的OpenCV的logo给抠下来放到另一张图片里去,如果之家吧两幅图片相加,那么颜色就会改变,如果混合两幅图片,则会造成透明的效果,这时就可以巧妙地运用为运算来解决这个问题:

# Load two imagesimg1 = cv2.imread('messi5.jpg')img2 = cv2.imread('opencv_logo.png')# I want to put logo on top-left corner, So I create a ROIrows,cols,channels = img2.shaperoi = img1[0:rows, 0:cols ]# Now create a mask of logo and create its inverse mask alsoimg2gray = cv2.cvtColor(img2,cv2.COLOR_BGR2GRAY)ret, mask = cv2.threshold(img2gray, 10, 255, cv2.THRESH_BINARY)mask_inv = cv2.bitwise_not(mask)# Now black-out the area of logo in ROIimg1_bg = cv2.bitwise_and(roi,roi,mask = mask_inv)# Take only region of logo from logo image.img2_fg = cv2.bitwise_and(img2,img2,mask = mask)# Put logo in ROI and modify the main imagedst = cv2.add(img1_bg,img2_fg)img1[0:rows, 0:cols ] = dstcv2.imshow('res',img1)cv2.waitKey(0)cv2.destroyAllWindows()
Otsu's Thresholding
左图是mask的图像,右图是最后的结果。

这个程序要求logo必须是黑底的,它先用cvtColor把原图转换成灰度图,然后用threshold函数,根据灰度把图像分成了两部分——logo部分和背景部分,其中logo的灰度值为255(白色),背景为0(黑色),这就是mask图像。然后,对mask取反,让logo为0,背景为255,得到mask_inv图像。然后让messi5的左上角和它自身以mask_inv为掩码做与运算——即掩码为0,则结果得0,掩码大于0,则结果不变(这就在messi5上用黑色抠了一个logo,接下来要上色了)。再接着,让logo和它自身以mask为掩码做与运算(把有颜色的部分抠出来)。最后使用add函数把两个图片相加就得到了右图(这里用到了黑色是(0,0,0),它加上什么颜色就是什么颜色这个特性)。

翻译自http://docs.opencv.org/trunk/doc/py_tutorials/py_core/py_image_arithmetics/py_image_arithmetics.html#image-arithmetics


1 0
原创粉丝点击