基于内容的视频标注——视频类型层标注

来源：互联网发布：怎样申请软件著作权编辑：程序博客网时间：2024/06/08 16:37

视频类型层标注，就是指对每一段视频，依据其内容产生相应的文本标注其类型信息(电影、新闻等)。
目前国际上已经提出了很多视频类型的白动分类方法，这些算法通常都是对每个视频提取一系列和视频类型相关的特征，然后通过机器学习算法训练分类器，在这些特征和视频类型之间建立对应关系。所划分的视频类型要么是简单.的几种类型，要么局限在电影或者体育运动这样某个特定的类型内。

       使用C4.5决策树进行视频类型自动分类，和现在流行的分类器，比如SVM等相比，无法获得更低的推广误差。最后一个问题就是这些方法都是采用被动监督学习的方法，通过在用户事先标注的训练数据上训练分类器，然后对未知数据进行分类。这种被动学习的方法需要大量的标注好的训练样本以获得良好的分类效果，但是获得这些训练样本需要耗时耗力的手工标注。如果能用主动学习的方法选择最“有用”的样本提供给用户进行标注，可以很大程度上减轻用户的标注负担。
       现有的SVM多类分类算法：SVM本身是一个两类分类器，将其从两类扩展到多类通常有1-against-l，1-against-rest，DDAG，Hierachicla SVM built by k-Means等方法。虽然己经有上述多种方法可以解决SVM多类分类问题，但是分类精度更高、计算时间更短的多类SVM算法仍然是研究的热点。
      在主动学习中，最关键的就是“有用”样本的选择策略。早期，选择最接近于分类面的样本，但是这种方法仅局限于两类的主动学习。后来又有一些研究者将两类的SVM主动学习扩展到多类。其中有的是全局考虑变型空间的容量减少情况，进行样本选择；有的是首先将多类分类分解为两类问题，然后选择这些两类分类器中变型空间容量减少最多的那个分类器，它所对应的样本给用户进行标注；有的考虑损失函数，找到能够最小化经验损失的样本。到目前为止，SVM多类主动学习中更有效的样本选择策略依然是研究的热点问题。