图像分割技术(3)
来源:互联网 发布:c语言表白小程序代码 编辑:程序博客网 时间:2024/09/21 06:38
接上篇 图像分割技术(2)
5. 基于运动的分割
严格说来这部分应该属于运动检测,是计算机视觉的内容,有光流,卡尔曼,meanshift。。。
对于图像处理,更侧重的是通过分析和转换,突出运动特征。
这里从空间域和频率域上介绍
5.1 空间域
基本思路是帧间做差,按参考帧的不同,又分为帧差法和累积差值。前者使用相邻帧做差,后者固定一帧作为参考,所有后续帧与之做差。
帧差:
按对比的条件,累积差值又分为绝对ADI、正ADI、负ADI:
这里R(x,y)为参考图像,对于累计差值的方法,参考图像如果取某一帧显然是不合适的(考虑监控路口视频流),理想的参考帧应该是当前场景下始终保持静止的图像(如路面,围栏,树)。
而使用正ADI可以重建满足上述要求的参考帧(图5-1):
1. 对一段运动视频,取第一帧为参考,后续帧与之做正ADI,借此获取运动物的初始位置。
2. 对每个初始位置,用后续帧里运动停止的那一帧的相应内容覆盖。
图5-1. 重建参考帧
图5-1的1为视频流第一帧,2为使用正ADI获得的运动初始位置,3为抠去运动物的重建参考帧(结果有点糙。。。)
5.2 频率域
算法出自Rajala等人的Application of the one-dimensional fourier transform for tracking moving objects in noisy environments。
基本思路是:将目标的运动投影到x和y轴,然后分别对其做傅里叶变换,查找变换域内幅值最高的频率,由该频率解算出两个方向的运动速度和方向。
该方法对尺度较小的运动有一定优势,算法也不复杂,但严重依赖参数的选择。
1)对一个K帧M*N大小的视频流,在时间点t上,x轴和y轴上投影加权和为:
其中a1和a2的选择文章写的很含糊:取接近U_max/V_max的整数,前者由帧数和采样频率确定,后者为期望的最大速度。
delta_t为帧间时间间隔。
2)然后对1)的投影做一维傅里叶
3)分别选择频域内x和y方向取最大值的频率u(第一个周期内),由式u=aV获得速度;此外分别对gx的实部和虚部做二次导,若时刻n的值为同符号则表示该时刻x方向速度为正,对gy类似。
实验中最大的问题是a的选择,可能是我没看懂论文,结果基本不可信。
- 图像分割技术(3)
- 图像分割技术(1)
- 图像分割技术(2)
- 图像分割技术
- 图像语义分割技术
- 【语义分割】图像语义分割技术入门
- 彩色图像分割技术基础
- 4k图像分割技术
- 图像分割技术之图像边缘检测
- 图像语义分割(3)- Dilated Convolutions
- 图像分割阈值选取技术综述
- 图像分割阈值选取技术综述
- 图像分割阈值选取技术综述
- 图像分割阈值选取技术综述
- 基于阈值法的图像分割技术
- 图像边界提取和分割技术1
- 基于阈值法的图像分割技术
- 图像分割阈值选取技术综述
- Android学习笔记三十五:socket 编程 实现消息推送
- _MainTex_ST是什么
- mysql 命令
- window eclipse 访问远程虚拟机 Hdfs
- Android学习笔记三十六:android之socket编程实例
- 图像分割技术(3)
- 关于FileDialog基本用法
- Java异常处理
- 使用android studio进行多渠道打包
- HTML5的一些新特性
- grails基于groovy开发的动态框架。开发过程中常见的错。
- Go--基础知识学习三
- 解决easyui combobox 下拉高度大于实际值
- SuperSlide 最简demo