计算机视觉之机器学习与深度学习

来源:互联网 发布:淘宝会员数 编辑:程序博客网 时间:2024/05/16 07:31

计算机视觉之机器学习与深度学习

                                                                                                                                    图像处理

       这些都是记录我学习与工作过程中的一些笔记,以免忘记。如有错误地方,请指出,我们一起讨论

       前几篇完善补充一下自己对这个技术领域的认识

       什么是机器视觉。计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像(摘自百度百科)。简单来说就是用某种技术使机器能够在图像上找到感兴趣的区域,并对这个区域进行识别或跟踪或测量,以供进一步使用。这些技术包括图像处理,模式识别,图像理解等。这篇主要说说图像处理。

       图像处理技术就是把输入图像转换成具有所希望特性的另一幅图像。例如,可通过处理使输出图象有较高的信-噪比,或通过增强处理突出图象的细节,以便于操作员的检验。在计算机视觉研究中经常利用图象处理技术进行预处理和特征抽取(摘自百度百科)。按不同功能区分可分为图像平滑,转换,增强,恢复,分割,压缩等技术。按不同处理域可分为频域与空间域处理。频域利用傅里叶变换将空间域转到频域处理。空间域,用一些滤波算子对图像直接进行卷积运算,达到如平滑、分割,提取特征等目的。

       在实际应用中需结合平滑,分割,恢复等方面对一幅图像进行处理,如在图像分割中,一般需先对图像进行增强,然后在做后续工作。且在工程应用中根据用户的需求和使用环境考虑使用哪种算法:是全局还是局部处理,是自适应还是通过实验找到一个值来均衡速率与效果;是先对图像做边缘检测,得到边缘,对边缘附近进行局部的平滑处理还是直接对全局进行平滑等等。

       列举一下用的较多的算法:

       高斯滤波,各项异性滤波滤波,中值滤波,均值滤波,灰度线性映射,sobel边缘检测,canny边缘检测,区域生长,形态学处理,水平集分割算法,fast Marching算法,hough变换,radon变换,分水岭算法,Hessian矩阵增强等。

如要深入了解,学学数学,去看看这方面的文献,看看迭代优化算法,看看代码。

       除了上述图像处理算法还有一些诸如图像匹配、融合、标定、测距等也值得去关注。

       图像处理就大致介绍到这里。如有时间将会介绍一些诸如360全景成像解决方案的思考。下篇将介绍模式识别中的机器学习与深度学习。

       欢迎一起讨论