视频检测之：利用结构稀疏性（结构稀疏范数）进行RPCA分析

来源：互联网发布：572-393的简便算法编辑：程序博客网时间：2024/06/04 17:55

文献来源：Liu X, Zhao G, Yao J, et al. Background subtraction based on low-rank and structured sparse decomposition[J]. IEEE Transactions on Image Processing, 2015, 24(8): 2502-2514.

透过现象看本质

本文其实就是在一点点细微的地方对于算法“”利用显著运动检测的 block-sparsity RPCA “”的改进。关于 block-sparsity based RPCA 可以看博主之前的详细介绍的博文 http://blog.csdn.net/jyzhang_cvml/article/details/77689058 ，在此就不再赘述了。
简而言之，本文其他的创新点都可以被涵盖在上面的工作中，唯一的工作（博主认为的工作）就是对于之前算法的 First-pass RPCA 部分进行了改进。原先算法仅仅采用传统 RPCA 来进行 candidate foreground 的提取，在第一部分没有考虑结构信息，因此无论其中正则化参数如何选取，都会造成 candidate foreground 的选择的不尽如人意，从而影响整个算法框架的精度。
这里写图片描述
因此本文提出的算法改进了原来算法的 First-pass 部分，在 candidate foreground 提取部分就通过 structured sparsity-inducing norm 结构稀疏范数对前景区域部分引入空间结构信息，从而提高 First-pass 的准确性，从而使得整个算法框架的准确性得到提高。

需要注意的几篇引用文献 —— 使用了 Structured sparsity-inducing norm 的算法

Robust and Practical Face Recognition via Structured Sparsity
利用基于分类的框架，将结构正则化信息引入稀疏项，从而使得该稀疏项具有一定 pattern 的分布。
Network flow algorithms for structured sparsity
这篇文章是来源于 Sparse Signal Recovery 领域，需要干净的没有前景区域的背景图像作为训练过程。这个缺陷限制其在实际视频检测中的应用。这边简要地对稀疏信号重建方面给出描述：
最初没有任何对于信号的误差：

求解上面的算法详见博主的博文 http://blog.csdn.net/jyzhang_cvml/article/details/77774454，需要用 soft-threshold operator 求解得到上述 LASSO 问题。
后面对于信号恢复的 error 项具有一定的先验知识，如 structured sparsity。一般可以认为 structured sparsity-inducing norm 是由 ProxFlow 算法首先提出并解决的，但是存在需要首先获得训练图像（X 不包含前景区域的干净图像）的缺陷：
。其中是重要的结构稀疏范数，也是本文引入 RPCA 框架的内容。
注意这些问题的形式，其实都是最基础的 LASSO 或者稀疏优化问题的形式。

Structured Sparsity-inducing Norms 以及对应的优化框架

利用 structured sparsity-inducing norm 对前景区域建模

采用能够使得 (c) 计算的值要小于 (d)，从而得到具有结构化的稀疏项，而不是仅仅有散乱结构的稀疏项。
我们定义每一个 group 都是 overlapping 的，大小为 9*9 的区域，因此每一个区域和其相邻的区域具有 6*6 的 overlapping 情况。无穷范数作用于每个 group 上，仅仅考虑 group 内最大的值。因此这样的范数（无穷/1 范数）有点类似于前面所用过的 group-sparsity 范数（2/1范数），使得对于一幅图像而言，尽可能少的 group 被选中，从而保证了稀疏性。只不过这里采用的 group 内的范数不是 2范数而是无穷范数而已。
Optimization
将 structured-sparsity-inducing norm 引入 RPCA 问题框架，表示为：

同样的，求解方法按照 RPCA related method 类似的 Augment Lagrange Multiplier 方法求解，只不过关于 S 的优化部分因为涉及结构稀疏范数，因此需要有些调整。
整个算法的框架还是交替优化原始变量 L;S 和更新对偶变量 Y。其中需要注意的两个子问题：
sub-problem 1: 优化 L 通过。一定要对这样的 LASSO 形式敏感。还是按照传统 RPCA 求解的套路，对进行 SVD 分解，得到的结果带入 soft-threshold 算子中得到结果。这部分详见博主的博文 http://blog.csdn.net/jyzhang_cvml/article/details/77774454 。
sub-problem 2: 优化 S 通过这个也就是将传统 RPCA 优化框架中的关于 L 的 1范数换成了结构稀疏范数。求解这个问题需要采用相关于 structured sparsity-inducing norm 的 proximal operator 求解，采用 quadratic min-cost flow 问题的求解方法。
sub-problem 3：更新 Y 的方法还是照搬即可。

总结

具体算法流程完全照搬上面提到的算法，唯一的不同就是在 First-pass RPCA 部分在传统的 RPCA 基础上引入结构稀疏范数，考虑前景区域的结构连接性，后面还是用基于显著性运动检测的方法自适应的调整正则化参数进行 group-sparsity 运算，从而得到更好的视频检测结果。

阅读全文

0 0